ADB MySQL CREATE TABLE创建分区表与维表 - 云原生数据仓库AnalyticDB MySQL版

本文介绍 AnalyticDB for MySQL 的 CREATE TABLE 建表语法。您将了解到如何创建分区表和维表，以及如何定义表的分布键、分区键、索引、生命周期、冷热数据分层等。

设置默认值、自增列
设置主键

设置分布键
设置分区键与生命周期

设置聚集索引
设置全文索引

设置向量索引
设置冷热分层存储策略

表的数据分布策略

建表前，您可以通过下图中的示例，了解关于表的几个重要概念，包括分片、分区、聚集索引。

语法

CREATE TABLE [IF NOT EXISTS] table_name
  ({column_name column_type [column_attributes] [ column_constraints ] [COMMENT 'column_comment']
  | table_constraints}
  [, ... ])
  [table_attribute]
  [partition_options]
  [storage_policy]
  [block_size]
  [engine]
  [rt_engine]
  [table_properties]
  [AS query_expr]
  [COMMENT 'table_comment']
column_attributes:
  [DEFAULT {constant | CURRENT_TIMESTAMP}]
  [AUTO_INCREMENT]
column_constraints:
  [{NOT NULL|NULL} ]
  [PRIMARY KEY]
table_constraints:
  [{INDEX|KEY} [index_name] (column_name,...)]
  [FULLTEXT [INDEX|KEY] [index_name] (column_name) [index_option]] [,...]
  [PRIMARY KEY [index_name] (column_name,...)]
  [CLUSTERED KEY [index_name] (column_name,...)]
  [[CONSTRAINT [symbol]] FOREIGN KEY (fk_column_name) REFERENCES pk_table_name (pk_column_name)][,...]
  [ANN INDEX [index_name] (column_name,...) [index_option]] [,...]
table_attribute:
  DISTRIBUTE BY HASH(column_name,...) | DISTRIBUTE BY BROADCAST
partition_options:
  PARTITION BY 
        {VALUE(column_name) | VALUE(date_format(column_name, 'format'))}
  LIFECYCLE N
storage_policy:
  STORAGE_POLICY= {'HOT'|'COLD'|'MIXED' {hot_partition_count=N}}
block_size:
  BLOCK_SIZE= VALUE
engine:
  ENGINE= 'XUANWU|XUANWU_V2'

参数

table_name、column_name、column_type、COMMENT

参数	说明
table_name	表名。表名以字母或下划线（_）开头，可包含字母、数字以及下划线（_），长度为1到127个字符。您可以使用 `db_name.table_name` ，指定在某个数据库下创建表。
column_name	列名。列名以字母或下划线（_）开头，可包含字母、数字以及下划线（_），长度为1到127个字符。
column_type	列的数据类型。 AnalyticDB MySQL版支持的数据类型，请参见基础数据类型和复杂数据类型。
COMMENT	为列或表添加备注信息。

column_attributes（默认值与自增列）

DEFAULT {constant | CURRENT_TIMESTAMP}

定义列的默认值。仅支持常量或 CURRENT_TIMESTAMP函数 。不支持其他函数和变量表达式。

如果未指定默认值，则列的默认值为 NULL 。

AUTO_INCREMENT

定义自增列。自增列的数据类型必须是 BIGINT 类型。

AnalyticDB for MySQL 为自增列提供 唯一值 ，但自增列的值 不是顺序递增 ，且 不支持从1开始递增 。

column_constraints（非空与主键）

NOT NULL

定义了 NOT NULL 的列，值不能为 NULL 。不定义 NOT NULL 或定义了 NULL 时，值可以为 NULL 。

PRIMARY KEY

定义主键。在列约束（column_constraints）中，只能定义单一列作为主键，例如 id BIGINT NOT NULL PRIMARY KEY 。如需多个列作为主键，请在表约束（table_constraints）中定义复合主键。

table_constraints（索引）

AnalyticDB for MySQL 支持多种索引，包括INDEX索引、主键索引、聚集索引、外键索引、全文索引、向量索引等。一个表可以有一种或多种索引。

INDEX | KEY

定义普通索引。INDEX和KEY作用相同。

默认情况下， AnalyticDB for MySQL 自动为全表所有列创建索引 。但是，如果您在建表时手动指定为某一列或某几列创建索引（例如 INDEX (id) ），则 AnalyticDB for MySQL 不会再为表中其他列自动创建索引。

PRIMARY KEY

定义主键索引。

基本使用：

每个表只能有一个主键。
主键可以是单个列或多个列的组合，例如 PRIMARY KEY (id) 或 PRIMARY KEY (id,name) 。
主键中 必须包含分布键 和 分区键 ，并且建议将 分布键 和 分区键放在 主键的前部。

注意事项 ：

无主键的表，不能执行DELETE和UPDATE操作。
未定义主键，会有以下行为：
- 如果未定义主键和分布键， AnalyticDB for MySQL 将 自动添加一个列 __adb_auto_id__ 作为表的主键和分布键 。
- 如果未定义主键，但定义了分布键， AnalyticDB for MySQL 不会自动添加主键 。
建表后，不能增加、减少或变更主键列。

调优建议 ：推荐使用数值类型的列作为主键，并尽量减少主键包含的列的个数，以获得较好的性能。

CREATE TABLE customer (
  customer_id BIGINT NOT NULL COMMENT '顾客ID',
  customer_name VARCHAR NOT NULL COMMENT '顾客姓名',
  phone_num BIGINT NOT NULL COMMENT '电话',
  city_name VARCHAR NOT NULL COMMENT '所属城市',
  sex INT NOT NULL COMMENT '性别',
  id_number VARCHAR NOT NULL COMMENT '身份证号码',
  home_address VARCHAR NOT NULL COMMENT '家庭住址',
  office_address VARCHAR NOT NULL COMMENT '办公地址',
  age INT NOT NULL COMMENT '年龄',
  login_time TIMESTAMP NOT NULL COMMENT '登录时间',
  PRIMARY KEY (login_time,customer_id，phone_num)
DISTRIBUTED BY HASH(customer_id)
PARTITION BY VALUE(DATE_FORMAT(login_time, '%Y%m%d')) LIFECYCLE 30
COMMENT '客户信息表';

CREATE TABLE orders (
  order_id BIGINT NOT NULL COMMENT '订单ID',
  customer_id INT NOT NULL COMMENT '顾客ID',
  order_status VARCHAR(1) NOT NULL COMMENT '订单状态',
  total_price DECIMAL(15, 2) NOT NULL COMMENT '订单金额',
  order_date DATE NOT NULL COMMENT '订单日期',
  PRIMARY KEY(order_id,order_date)
);

SHOW CREATE TABLE orders;

+---------+-----------------------------------------------------------------------------------------------------------------------------------------------+
| Table   | Create Table                                                                                                                                  | 
+---------+-----------------------------------------------------------------------------------------------------------------------------------------------+
| orders  | CREATE TABLE `orders` (                                                                                                                       |
|         | `order_id` bigint NOT NULL COMMENT '订单ID',                                                                                                   |
|         | `customer_id` int NOT NULL COMMENT '顾客ID',                                                                                                   |
|         | `order_status` varchar(1) NOT NULL COMMENT '订单状态',                                                                                         | 
|         | `total_price` decimal(15, 2) NOT NULL COMMENT '订单金额',                                                                                      |
|         | `order_date` date NOT NULL COMMENT '订单日期',                                                                                                 |
|         | PRIMARY KEY (`order_id`,`order_date`)                                                                                                         |
|         | ) DISTRIBUTE BY HASH(`order_id`,`order_date`) INDEX_ALL='Y' STORAGE_POLICY='HOT' ENGINE='XUANWU' TABLE_PROPERTIES='{"format":"columnstore"}'  |
+---------+-----------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.04 sec)

CREATE TABLE orders_new (
  order_id BIGINT NOT NULL COMMENT '订单ID',
  customer_id INT NOT NULL COMMENT '顾客ID',
  order_status VARCHAR(1) NOT NULL COMMENT '订单状态',
  total_price DECIMAL(15, 2) NOT NULL COMMENT '订单金额',
  order_date DATE NOT NULL COMMENT '订单日期'
);

SHOW CREATE TABLE orders_new;

+-------------+-----------------------------------------------------------------------------------------------------------------------------------------------+
| Table       | Create Table                                                                                                                                  | 
+-------------+-----------------------------------------------------------------------------------------------------------------------------------------------+
| orders_new  | CREATE TABLE `orders_new` (                                                                                                                   |
|             | `__adb_auto_id__` bigint AUTO_INCREMENT,                                                                                                      |
|             | `order_id` bigint NOT NULL COMMENT '订单ID',                                                                                                   |
|             | `customer_id` int NOT NULL COMMENT '顾客ID',                                                                                                   |
|             | `order_status` varchar(1) NOT NULL COMMENT '订单状态',                                                                                         | 
|             | `total_price` decimal(15, 2) NOT NULL COMMENT '订单金额',                                                                                      |
|             | `order_date` date NOT NULL COMMENT '订单日期',                                                                                                 |
|             | PRIMARY KEY (`__adb_auto_id__`)                                                                                                               |
|             | ) DISTRIBUTE BY HASH(`__adb_auto_id__`) INDEX_ALL='Y' STORAGE_POLICY='HOT' ENGINE='XUANWU' TABLE_PROPERTIES='{"format":"columnstore"}'        |
+-------------+-----------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.04 sec)

CREATE TABLE supplier (
  supplier_id BIGINT AUTO_INCREMENT PRIMARY KEY,
  supplier_name VARCHAR,
  address INT,
  phone VARCHAR
DISTRIBUTED BY HASH(supplier_id);

CREATE TABLE item (
  order_id BIGINT NOT NULL,
  item_id INT NOT NULL,
  quantity DECIMAL(15, 2) NOT NULL,
  discount DECIMAL(15, 2) NOT NULL,
  shipdate DATE NOT NULL,
  PRIMARY KEY (order_id,item_id,shipdate)
DISTRIBUTE BY HASH(item_id) 
PARTITION BY VALUE(date_format(shipdate, '%Y%m')) LIFECYCLE 200 
STORAGE_POLICY='COLD';

CREATE TABLE item (
  order_id BIGINT NOT NULL,
  item_id INT NOT NULL,
  quantity DECIMAL(15, 2) NOT NULL,
  discount DECIMAL(15, 2) NOT NULL,
  shipdate DECIMAL NOT NULL,
  PRIMARY KEY (order_id,item_id,shipdate)
DISTRIBUTE BY HASH(item_id) 
PARTITION BY VALUE(date_format(shipdate, '%Y%m')) LIFECYCLE 200 
STORAGE_POLICY='HOT';

CREATE TABLE item (
  order_id BIGINT NOT NULL,
  item_id INT NOT NULL,
  quantity DECIMAL(15, 2) NOT NULL,
  discount DECIMAL(15, 2) NOT NULL,
  shipdate DATE NOT NULL,
  PRIMARY KEY (order_id,item_id,shipdate)
DISTRIBUTE BY HASH(item_id) 
PARTITION BY VALUE(date_format(shipdate, '%Y%m')) LIFECYCLE 200  
STORAGE_POLICY='MIXED' HOT_PARTITION_COUNT=16;

CREATE TABLE fulltext_tb (
  id INT,
  content VARCHAR,
  keyword VARCHAR,
  FULLTEXT INDEX fidx_c(content),
  PRIMARY KEY (id)
DISTRIBUTE BY HASH(id);

CREATE TABLE fact_tb (  
  xid BIGINT NOT NULL,  
  cid BIGINT NOT NULL,  
  uid VARCHAR NOT NULL,  
  vid VARCHAR NOT NULL,  
  wid VARCHAR NOT NULL,  
  short_feature array<smallint>(4),  
  float_feature array<float>(4),  
  ann index short_feature_index(short_feature), 
  ann index float_feature_index(float_feature),  
  PRIMARY KEY (xid, cid, vid)
DISTRIBUTE BY HASH(xid) PARTITION BY VALUE(cid) LIFECYCLE 4;

CREATE TABLE store_returns (
  sr_sale_id BIGINT NOT NULL PRIMARY KEY,
  sr_store_sk BIGINT,
  sr_item_sk BIGINT NOT NULL,
  FOREIGN KEY (sr_item_sk) REFERENCES customer (customer_id)
);

SELECT partition_id, --分区名
 row_count, -- 分区总行数
 local_data_size, --分区本地存储所占用空间大小
 index_size, -- 分区的索引大小
 pk_size, --分区的主键索引大小
 remote_data_size --分区的远端存储所占用空间大小
FROM information_schema.kepler_partitions
WHERE schema_name = '$DB'
 AND table_name ='$TABLE' 
 AND partition_id > 0;

CREATE TABLE test (
  id INT COMMENT '',
  name VARCHAR(10) COMMENT '',
  PRIMARY KEY (id, name)
DISTRIBUTED BY HASH(id) PARTITION BY VALUE(name);

CREATE TABLE test (
  id INT COMMENT '',
  name VARCHAR(10) COMMENT '',
  PRIMARY KEY (id, name)
DISTRIBUTED BY HASH(id) PARTITION BY VALUE(name) LIFECYCLE 30;

SELECT count(partition_id)
FROM information_schema.kepler_partitions
WHERE partition_id > 0;

CREATE TABLE test (
  id INT COMMENT '',
  name VARCHAR(10) COMMENT '',
  PRIMARY KEY (id)
DISTRIBUTED BY HASH(id) PARTITION BY VALUE(name) LIFECYCLE 30;

CREATE TABLE test (
  id INT COMMENT '',
  name VARCHAR(10) COMMENT ''
PARTITION BY VALUE(name) LIFECYCLE 30;

语法

参数

table_name、column_name、column_type、COMMENT

column_attributes（默认值与自增列）

DEFAULT {constant | CURRENT_TIMESTAMP}

AUTO_INCREMENT

column_constraints（非空与主键）

NOT NULL

PRIMARY KEY

table_constraints（索引）

INDEX | KEY

PRIMARY KEY

CLUSTERED KEY

FULLTEXT INDEX | FULLTEXT KEY

FOREIGN KEY

ANN INDEX

JSON INDEX

table_attribute（分布键）

DISTRIBUTED BY HASH (column_name,...)

DISTRIBUTED BY BROADCAST

partition_options（分区键与生命周期）

PARTITION BY

LIFECYCLE n

storage_policy（存储策略）

hot_partition_count（热分区）

block_size（数据块）

engine（存储引擎）

AS query_expr（CTAS）

示例

新建分区表并设置生命周期

新建表（未定义分布键）

未定义分布键，自动将主键作为分布键

未定义主键，自动增加主键

新建表（未定义分区键）

定义冷热数据存储策略

定义冷（COLD）存储策略

定义热（HOT）存储策略

定义混合（MIXED）存储策略，同时指定热分区数量为16个

定义全文索引

定义向量索引

定义外键索引

常见问题

列属性和列约束

分布键、分区键与生命周期

索引

列存

其他

常见报错

相关文档