数据仓库服务 GAUSSDB(DWS)-HStore表使用优秀实践:列存表存储机制
时间:2025-06-10 08:58:36
列存表存储机制
在 GaussDB (DWS)中,列存表以压缩单元(CU)为最小存储单位,每列默认以60000行当做一个CU进行存储。由于CU采用追加写模式,更新和删除操作不会修改原有CU。CU一旦生成,其数据便不可更改,无论插入1条还是60,000条数据,都会生成一个新的完整CU。
因此使用过程中会产生如下问题:
- 删除操作:仅在字典中将旧数据标记为作废,并未释放空间。
- 更新操作:标记旧数据删除后,将新记录写入新的CU。
- 空间问题:频繁更新/删除会导致表空间膨胀和大量存储空间无法有效利用。
support.huaweicloud.com/bestpractice-dws/dws_05_0109.html