数智融合计算服务 DATAARTSFABRIC-更新统计信息:自动收集统计信息
自动收集统计信息
当配置参数autoanalyze打开时,查询语句走到优化器发现表不存在统计信息或数据变化超过阈值时,会自动触发统计信息收集,以满足优化器的需求。
基于代价的优化器模型(CBO,cost base optimizer)中,统计信息决定了查询计划生成的好坏。因此,统计信息的及时有效很重要。
- 表级统计信息,存储在pg_class的relpages、reltuples中。
- 列级统计信息,存储在pg_statistics中,可以通过pg_stats视图查看。包括:NULL值比例,distinct值占比,高频值MCV,直方图histgram等。
收集条件:当数据量发生较大变化,默认是变化10%,认为数据特征已经有了变化,需要重新收集统计信息。