PostgreSQL统计信息的几个重要视图

2025-04-15 技术教程

1、pg_stat_database

yzs=# select *from pg_stat_database;-[ RECORD 1 ]--+------------------------------datid | 13156 #数据库的oiddatname | postgres #数据库名numbackends | 0 #访问当前数据库的连接数量xact_commit | 2357 #该数据库事务提交总量：和下面的rollback和作为TPS统计xact_rollback | 17 #该数据库事务rollback总量，如果特别多，需要看业务是否有问题了blks_read | 1946 #总磁盘物理读的块数，这里的read可能是从 cache中读取，如果很高需要结合blk_read_time看是否真的存在从磁盘读取的情况blks_hit | 103625 #从shared buffer命中块数tup_returned | 1413113 #对于表来说，是全表扫描的行数；对于索引是通过索引返回的索引行数，如果这个值明显大于tup_fetched，说明当前数据库存在大量的全表扫描。查看执行计划，这个是databas全局级别的tup_fetched | 36041 #指通过索引返回的行数tup_inserted | 104 #插入的行数tup_updated | 0 #更新的行数tup_deleted | 19 #删除的行数conflicts | 0 #与恢复冲突取消的查询次数，只会在备机上发生temp_files | 0 #产生临时文件的数量，如果这个值很高，需要调大work_memtemp_bytes | 0 #临时文件的大小deadlocks | 0 #死锁的数量，如果这个值很大说明业务逻辑有问题blk_read_time | 0 #数据库中花费在读取文件的时间，这个值很高说明内存较小，需要频繁从磁盘读入数据文件blk_write_time | 0 #数据库中花费在写数据文件的时间，pg中脏页一般写入page cache，如果这个值较高，则说明cache较小，操作系统的cache需要更积极的写入stats_reset | 2019-02-11 23:42:37.526743-08 #统计信息重置的时间

通过pg_stat_database可以大概了解数据库的历史情况。
比如tup_returned值明显大于tup_fetched，历史SQL语句很多是全表扫描，存在没有使用索引的SQL，可结合pg_stat_statments查找慢SQL，也可结合pg_stat_user_table找全表扫描次数和行数最多的表；
通过看tup_updated很高，可以说明数据库有频繁的更新，这个时候需要关注vaccum相关的指标和长事务，如果没有及时进行垃圾回收，会引起表膨胀；
temp_files较高说明存在很多排序，hash,或者聚合这种操作，可以增大work_mem减少临时文件的产生，并且同时这些操作的性能也会有较大的提升。

2、pg_stat_user_tables

通过查询pg_stat_user_tables，可以基本清除哪些表的全表扫描次数较多，表中DML哪种操作多，也可以了解垃圾数据的数量。

3、pg_stat_user_indexes

可以知道当前哪些索引频繁使用，哪些是无效索引。无效索引可以删除掉，减少磁盘空间的使用和提升insert、delete、update的性能。

4、pg_statio_user_tables

如果heap_blks_read、idx_blks_read很高，说明shared buffer较小，存在频繁从磁盘或者page cache读取到shared buffer中命中toast表的块数。

5、 pg_stat_bgwriter

yzs=# select *from pg_stat_bgwriter;-[ RECORD 1 ]---------+------------------------------checkpoints_timed | 206 #指超过checkpoint_timeout的时间后触发的检查点次数checkpoints_req | 8 #手动触发checkpoint或者因为WAL文件数量达到max_wal_size时也会增加，如果这个值大于checkpoints_req说明checkpoint_timeout设置的不合理checkpoint_write_time | 306582 #从shared buffer 中write到page cache花费的时间checkpoint_sync_time | 367 #checkpoint调用fsync将脏数据刷到磁盘花费的时间，如果这个值很长，容易造成IO抖动，需要增加checkpoint_timeout或者checkpoint_completion_targetbuffers_checkpoint | 6671 #通过checkpoint写入脏块的数量buffers_clean | 0 #通过bgwriter写入块的数量maxwritten_clean | 0 #bgwriter超过bgwriter_lru_maxpages时停止的次数，如果这个值很高，需要增加bgwriter_lru_maxpagesbuffers_backend | 7953 #通过backend写入的块数量buffers_backend_fsync | 0 #backend需要fsync的次数buffers_alloc | 11613 #被分配的缓冲区数量stats_reset | 2019-02-11 23:42:35.273758-08

通过这个视图，可以判断checkpoint以及max_wal_size是否合理