添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

PostgreSQL 11 新特性之哈希分区

作者: 不剪发的Tony老师
毕业于北京航空航天大学,十多年数据库管理与开发经验,目前在一家全球性的金融公司从事数据库架构设计。CSDN学院签约讲师以及GitChat专栏作者。csdn上的博客收藏于以下地址: https://tonydong.blog.csdn.net

文章目录

PostgreSQL 10 引入了声明式分区(declarative partitioning)特性,但是实现的功能有限。PostgreSQL 11 为此带来了许多关于分区的增强功能。首先就是增加了 HASH 分区。哈希分区基于分区键的哈希值计算数据所在的分区。

CREATE TABLE htable (c1 bigint, c2 VARCHAR(10)) PARTITION BY HASH(c1);


为哈希分区表创建分区时,使用 FOR VALUES WITH 子句指定分区的计算方法,其中的 MODULUS 子句用于指定除数,REMAINDER 子句用于指定哈希值被除后的余数。

CREATE TABLE htable_p0 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 0);
CREATE TABLE htable_p1 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 1);
CREATE TABLE htable_p2 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 2);
CREATE TABLE htable_p3 PARTITION OF htable FOR VALUES WITH (MODULUS 4, REMAINDER 3);

REMAINDER 子句需要指定一个小于 MODULUS 子句的值。如果指定的分区数量少于 MODULES 子句的值,将会导致无法插入某些数据,因为没有用于存储这些值的分区。

\d+ htable
Table "public.htable"
Column |         Type          | Collation | Nullable | Default | Storage  | Stats target | Description
--------+-----------------------+-----------+----------+---------+----------+--------------+-------------
c1     | bigint                |           |          |         | plain    |              |
c2     | character varying(10) |           |          |         | extended |              |
Partition key: HASH (c1)
Partitions: htable_p0 FOR VALUES WITH (modulus 4, remainder 0),
htable_p1 FOR VALUES WITH (modulus 4, remainder 1),
htable_p2 FOR VALUES WITH (modulus 4, remainder 2),
htable_p3 FOR VALUES WITH (modulus 4, remainder 3)

为表 htable 生成一些数据,查看数据在各个分区的分布是否均匀:

INSERT INTO htable SELECT val,'val:'||val FROM generate_series(1,100000) val;
INSERT 0 100000

SELECT COUNT(*) FROM htable_p0;
count
-------
25126
(1 row)

SELECT COUNT(*) FROM htable_p1;
count
-------
24978
(1 row)

SELECT COUNT(*) FROM htable_p2;
count
-------
24971
(1 row)

SELECT COUNT(*) FROM htable_p3;
count
-------
24925
(1 row)

每个分区大概包含四分之一(25000)的数据。

对于哈希分区,同样支持分区裁剪(Partition Pruning):

show enable_partition_pruning;
enable_partition_pruning
--------------------------
on

EXPLAIN SELECT * FROM htable where c1 = 200;
QUERY PLAN
------------------------------------------------------------------
Append  (cost=0.00..470.57 rows=1 width=17)
->  Seq Scan on htable_p3  (cost=0.00..470.56 rows=1 width=17)
Filter: (c1 = 200)
(3 rows)

官方文档:Table Partitioning