表格存储的表引擎、二级索引、多元索引_表格存储(Tablestore)-阿里云帮助中心

使用宽表模型的表引擎查询数据时存在依赖主键以及根据属性查询效率低的问题，表格存储提供了二级索引和多元索引用于解决宽表模型的数据查询问题。您也可以为数据表创建映射关系后，像使用传统数据库一样使用SQL查询表中数据。

表引擎

宽表模型通过数据表存储数据。不同的数据分区可以加载到不同的机器上，实现水平扩展。如下图所示。

表格存储的宽表模型包含多个主键列，多列主键列按照顺序共同构成一个主键，类似MySQL的联合主键，也可以把多个主键列拼接起来看作HBase的RowKey，每一列其实都只是整体主键的一部分。采用多列主键主要原因如下：

业务常需要多个字段来构成主键，如果只支持一个主键列，业务需要进行拼接，多列主键列避免了业务层做主键拼接和拆解。
第一个主键列是分区键，保证了分区键相同的行一定在同一个分区上。分区键可以帮助实现分区内事务（Transaction）、分区内自增列等功能。

维度	描述
宽表模型优势	完全水平扩展，可支撑的读写并发和数据规模几乎无上限。表格存储可支持千万级的PTS/QPS，以及10 PB级的存储量。当业务数据量大量上涨时，只要增加机器资源即可。同时，基于共享存储的架构实现了动态负载均衡，不需要数据库层进行副本数据复制。提供了表模型。相比纯粹的Key-value数据库，表格存储具有列和多版本的概念，可以单独对某列进行读写。表模型也是一种比较通用的模型，可以方便与其他系统进行数据模型映射。表模型中数据按照主键有序存储，而非Hash映射，因此支持主键的范围扫描。类似于HashMap与SortedMap的区别（此模型类似于SortedMap）。 Schema Free，即每行可以有不同的属性列，数据列个数也不限制。适合存储半结构化的数据。业务在运行过程中，可以进行任意的属性列变更。支持数据自动过期清理和数据多版本。每列都可以存储多个版本的值，每个值会有一个版本号，同时也是一个时间戳，如果设置了数据自动过期，则会按照这个时间戳来判断数据是否过期，后台会对过期数据自动清理。
宽表模型劣势	数据查询依赖主键表格存储的数据模型类似于SortedMap，只能做点查和顺序/逆序扫描，包括如下查询方式：主键点查：通过已知主键，精确读取表上的一行。主键范围查：按照顺序从开始主键（StartPrimaryKey）扫描到结束主键（EndPrimaryKey）或者逆序扫描。即对表进行顺序或逆序遍历，支持指定起始位置和结束位置。主键前缀范围查：等价于主键范围查，主键前缀的一个范围可以转换成主键的一个范围，在表上进行顺序扫描即可。针对属性列的查询需要使用Filter Filter模式在过滤大量数据时效率有限，甚至变成全表扫描。数据查询的效率与底层扫描的数据量正相关，而底层扫描的数据量取决于数据分布和结构。数据默认仅按照主键有序存储，要按照某一属性列查询，符合条件的数据必然分布于全表的范围内，需要扫描后筛选。全表数据越多，扫描的数据量也就越大，效率也就越低。

维度	全局二级索引	本地二级索引
同步方式	异步方式	同步方式
第一列主键要求	可选数据表中的任意主键列或者预定义列	必须和数据表的第一列主键相同
同步延迟	毫秒级别	实时
读取一致性	最终一致性	强一致性

索引介绍

表引擎

二级索引

多元索引