Redrock Postgres 文档
主页 切换暗/亮/自动模式 切换暗/亮/自动模式 切换暗/亮/自动模式 返回首页

LWLock - buffer_io

当 PostgreSQL 正在等待其他进程在同时尝试访问页面时完成输入/输出 (I/O) 操作时,会发生 buffer_io 事件。它的目的是将同一个分页读入共享缓冲区中。

上下文

每个共享缓冲区都有一个与 buffer_io 等待事件相关的输入/输出锁,每次必须在共享缓冲池外检索数据块(或分页)。

此锁定用于处理多个会话,而这些会话都需要访问同一个数据块。必须从共享缓冲池外部读取此数据库块,该缓冲池由 shared_buffers 参数定义。

一旦在共享缓冲池内读取分页,buffer_io 锁即被释放。

注意

buffer_io 等待事件发生在 DataFileRead 等待事件之前。DataFileRead 事件在从存储中读取数据时发生。

原因

buffer_io 显示在主要等待中的常见原因包括以下各项:

  • 多个后端或连接试图访问同样在等待输入/输出操作的同一页面
  • 共享缓冲池大小之间的比率(由 shared_buffers 参数定义)以及当前工作负载所需的缓冲区数量
  • 共享缓冲池的大小与其他操作移出的分页数量没有很好地平衡
  • 需要引擎在共享缓冲池中读取更多页面的臃肿的大索引
  • 缺乏强制数据库引擎从表中读取更多页面的索引
  • 检查点发生太频繁或需要刷新太多修改过的页面
  • 试图在同一页面上执行操作的数据库连接突增

操作

请运行以下查询,查看共享缓冲池访问命中率。

SELECT 
  round(100 * sum(blks_hit) / sum(blks_hit + blks_read), 3) as cache_hit_ratio
FROM pg_stat_database;

根据等待事件的原因,我们建议采取不同的操作:

  • 请观察cache_hit_ratio突然减少和buffer_io等待事件之间的关系。此影响可能意味着您有一个较小的共享缓冲区设置。您可能需要增加数据库实例类或对其进行纵向扩展。您可以将工作负载拆分为更多的读取器节点。
  • 如果您发现buffer_iocache_hit_ratio指标降低相一致,请根据您的工作负载峰值时间优化 max_wal_sizecheckpoint_timeout。然后确定哪个查询可能会导致发生此情况。
  • 验证是否有未使用的索引,然后将其删除。
  • 使用分区表(也具有分区索引)。这样做有助于保持较低的指数重新排序并降低其影响。
  • 避免对列进行不必要的索引编制。
  • 使用连接池防止数据库连接突增。
  • 作为最佳实践,限制与数据库的最大连接数。