PostgreSQL 11 新特性之哈希分区
作者: 不剪发的Tony老师
毕业于北京航空航天大学,十多年数据库管理与开发经验,目前在一家全球性的金融公司从事数据库架构设计。CSDN学院签约讲师以及GitChat专栏作者。csdn上的博客收藏于以下地址:
https://tonydong.blog.csdn.net
文章目录
PostgreSQL 10 引入了声明式分区(declarative partitioning)特性,但是实现的功能有限。PostgreSQL 11 为此带来了许多关于分区的增强功能。首先就是增加了 HASH 分区。哈希分区基于分区键的哈希值计算数据所在的分区。
CREATE TABLE htable (c1 bigint, c2 VARCHAR(10)) PARTITION BY HASH(c1);
为哈希分区表创建分区时,使用 FOR VALUES WITH 子句指定分区的计算方法,其中的 MODULUS 子句用于指定除数,REMAINDER 子句用于指定哈希值被除后的余数。
CREATE TABLE htable_p0 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 0);
CREATE TABLE htable_p1 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 1);
CREATE TABLE htable_p2 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 2);
CREATE TABLE htable_p3 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 3);
REMAINDER 子句需要指定一个小于 MODULUS 子句的值。如果指定的分区数量少于 MODULES 子句的值,将会导致无法插入某些数据,因为没有用于存储这些值的分区。
\d+ htable
Table "public.htable"
Column | Type | Collation | Nullable | Default | Storage | Stats target | Description
--------+-----------------------+-----------+----------+---------+----------+--------------+-------------
c1 | bigint | | | | plain | |
c2 | character varying(10) | | | | extended | |
Partition key: HASH (c1)
Partitions: htable_p0 FOR VALUES WITH (modulus 4, remainder 0),
htable_p1 FOR VALUES WITH (modulus 4, remainder 1),
htable_p2 FOR VALUES WITH (modulus 4, remainder 2),
htable_p3 FOR VALUES WITH (modulus 4, remainder 3)
为表 htable 生成一些数据,查看数据在各个分区的分布是否均匀:
INSERT INTO htable SELECT val,'val:'||val FROM generate_series(1,100000) val;
INSERT 0 100000
SELECT COUNT(*) FROM htable_p0;
count
-------
25126
(1 row)
SELECT COUNT(*) FROM htable_p1;
count
-------
24978
(1 row)
SELECT COUNT(*) FROM htable_p2;
count
-------
24971
(1 row)
SELECT COUNT(*) FROM htable_p3;
count
-------
24925
(1 row)
每个分区大概包含四分之一(25000)的数据。
对于哈希分区,同样支持分区裁剪(Partition Pruning):
show enable_partition_pruning;
enable_partition_pruning
--------------------------
on
EXPLAIN SELECT * FROM htable where c1 = 200;
QUERY PLAN
------------------------------------------------------------------
Append (cost=0.00..470.57 rows=1 width=17)
-> Seq Scan on htable_p3 (cost=0.00..470.56 rows=1 width=17)
Filter: (c1 = 200)
(3 rows)
官方文档:Table Partitioning