LWLock - buffer_io
当 PostgreSQL 正在等待其他进程在同时尝试访问页面时完成输入/输出 (I/O) 操作时,会发生 buffer_io
事件。它的目的是将同一个分页读入共享缓冲区中。
每个共享缓冲区都有一个与 buffer_io
等待事件相关的输入/输出锁,每次必须在共享缓冲池外检索数据块(或分页)。
此锁定用于处理多个会话,而这些会话都需要访问同一个数据块。必须从共享缓冲池外部读取此数据库块,该缓冲池由 shared_buffers
参数定义。
一旦在共享缓冲池内读取分页,buffer_io
锁即被释放。
注意
buffer_io
等待事件发生在 DataFileRead 等待事件之前。DataFileRead
事件在从存储中读取数据时发生。
buffer_io
显示在主要等待中的常见原因包括以下各项:
- 多个后端或连接试图访问同样在等待输入/输出操作的同一页面
- 共享缓冲池大小之间的比率(由
shared_buffers
参数定义)以及当前工作负载所需的缓冲区数量 - 共享缓冲池的大小与其他操作移出的分页数量没有很好地平衡
- 需要引擎在共享缓冲池中读取更多页面的臃肿的大索引
- 缺乏强制数据库引擎从表中读取更多页面的索引
- 检查点发生太频繁或需要刷新太多修改过的页面
- 试图在同一页面上执行操作的数据库连接突增
请运行以下查询,查看共享缓冲池访问命中率。
SELECT
round(100 * sum(blks_hit) / sum(blks_hit + blks_read), 3) as cache_hit_ratio
FROM pg_stat_database;
根据等待事件的原因,我们建议采取不同的操作:
- 请观察
cache_hit_ratio
突然减少和buffer_io
等待事件之间的关系。此影响可能意味着您有一个较小的共享缓冲区设置。您可能需要增加数据库实例类或对其进行纵向扩展。您可以将工作负载拆分为更多的读取器节点。 - 如果您发现
buffer_io
与cache_hit_ratio
指标降低相一致,请根据您的工作负载峰值时间优化max_wal_size
和checkpoint_timeout
。然后确定哪个查询可能会导致发生此情况。 - 验证是否有未使用的索引,然后将其删除。
- 使用分区表(也具有分区索引)。这样做有助于保持较低的指数重新排序并降低其影响。
- 避免对列进行不必要的索引编制。
- 使用连接池防止数据库连接突增。
- 作为最佳实践,限制与数据库的最大连接数。