PostgreSQL - 数组(Array)
PostgreSQL 可以通过一种数据结构在独立字段中存储非原子的值。这个数据结构就是我们今天要谈的数组(Array),它本身不是一种数据类型,而是任何数据类型的一种拓展。
创建一个数组字段 #
在
CREATE TABLE
或
ALTER
语句中需要声明成数组的字段类型后面追加上方括号,这样就可以创建一个数组字段。
现在来看个例子,声明一个一维数组:
single_array type[]
可以将多个方括号追加在类型的后面,就可以声明一个多维数组,可以在数组中存储数组:
multi_array type[][]
理论上说,可以在方括号中插入一个整数 n 来声明一个定长(fixed-length)的数组。但是在 PostgreSQL 7.1.x 之后,这个限制非强制的,实际上定长数组和非定长数组之间没有实际的不同。
接下来是一个创建包含数组的表:
pigdb> CREATE TABLE faviroute_book (
employee_id INTEGER,
books TEXT[]
CREATE TABLE
这个例子中,
books
字段存储任何数量的书名数组。创建多维数据的方法也是类似的,唯一的区别就是有另一对方括号要紧跟在第一对的后面,就像前面的例子那样。
pigdb> CREATE TABLE favorite_authors (
employee_id INTEGER,
author_and_titles TEXT[][]
CREATE TABLE
给数组追加数据 #
为了在一个字段插入多个值, PostgreSQL 引入了一个特殊的语法。这个语法允许你描述一个数组常量。这个数组常量有话括号,双引号和逗号组成,外层由单引号包裹着。双引号只有在字符数组的时候,需要用到,通用的模式:
'{"text1",[...]}' -- 字符数组
'{ numeric, [...]}' -- 数字数组
这个语法模式演示如何使用字符和数字数组,但是每个数组必须定义单一数据类型(可以是任何的数据类型,boolean,date 或者是 time)。通常情况下,你使用单引号来描述非数组上下文的值,双引号用来数组中的值。
现在,我们插入数据:
pigdb> INSERT INTO faviroute_book VALUES (102, E'{"The Hichhiker \'s GUIDE to he Galaxy"}'); -- 插入一个值的数组,注意这边的单引号需要转移,E - escape, 后续会单独讲解这块
INSERT 0 1
pigdb> INSERT INTO faviroute_book VALUES (103, '{"The Hobbit", "Kitten, Squared"}'); -- 插入多个值的数组
INSERT 0 1
pigdb> SELECT * FROM faviroute_book;
+---------------+------------------------------------------+
| employee_id | books |
|---------------+------------------------------------------|
| 102 | [u"The Hichhiker 's GUIDE to he Galaxy"] |
| 103 | [u'The Hobbit', u'Kitten, Squared'] |
+---------------+------------------------------------------+
在插入单个值的时候,花括号还是需要的,这是因为数组常量本身也需要被当作字符串来解析,随后基于上下文解析成真正的数组。
多维数组的插入也是类似,看看例子:
pigdb> INSERT INTO favorite_authors VALUES (102,
'{ {"J.R.R. Tokeien", "The Silmarillion"}, {"Charless Dickness", "Great Expectations"} }'
INSERT 0 1
pigdb> SELECT * FROM favorite_authors;
+---------------+-------------------------------------------------------------------------------------------+
| employee_id | author_and_titles |
|---------------+-------------------------------------------------------------------------------------------|
| 102 | [[u'J.R.R. Tokeien', u'The Silmarillion'], [u'Charless Dickness', u'Great Expectations']] |
+---------------+-------------------------------------------------------------------------------------------+
#之前已经演示查询数组字段,它会返回整个数组。但是数组的最大用处实际是依赖于他的下标操作。
数组下标(Subscripts)
#
下标的语法由方括号包围着整形数值;这个数值描述的是从左开始的位置距离。
不像大部分编程语言(比如 C),PostgreSQL 的下标是从 1 开始的,而不是 0;现在看个例子
pigdb> SELECT books[1] FROM faviroute_book;
+-------------------------------------+
| books |
|-------------------------------------|
| The Hichhiker 's GUIDE to he Galaxy |
| The Hobbit |
+-------------------------------------+
SELECT 2
注意到了吧,查询返回的值不包含话括号的双引号;这是因为单个文本值只需要作为文本常量返回,而不是一个数组;在看一条:
pigdb> SELECT books[2] FROM faviroute_book;
+-----------------+
| books |
|-----------------|
| |
| Kitten, Squared |
+-----------------+
如果筛选的的结果值被存在会返回空值。你可以使用 IS NOT NULL
的语法来过滤它:
pigdb> SELECT books[2] FROM faviroute_book WHERE books[2] IS NOT NULL;
+-----------------+
| books |
|-----------------|
| Kitten, Squared |
+-----------------+
现在,我们来操作下多维数组:
pigdb> SELECT
author_and_titles[1][1] AS author,
author_and_titles[1][2] AS title
FROM favorite_authors;
+----------------+------------------+
| author | title |
|----------------+------------------|
| J.R.R. Tokeien | The Silmarillion |
+----------------+------------------+
SELECT 1
数组切片(Slices)
#
PostgreSQL 同样支持数组的切片操作;原理和下标操作类似,只是它返回制定范围段的值。切片的语法由一对整形数字,被冒号隔开,被方括号包围;例如 [2:5]
返回的是,数组的第二,第三,第四和第五的值,以数组形式返回:
pigdb> INSERT INTO faviroute_book VALUES (104, '{"The Hobbit", "Kitten, Squared", "Practical PostgreSQL"}'); -- 为了掩饰效果,插入一条数组
INSERT 0 1
pigdb> SELECT * FROM faviroute_book;
+---------------+--------------------------------------------------------------+
| employee_id | books |
|---------------+--------------------------------------------------------------|
| 102 | [u"The Hichhiker 's GUIDE to he Galaxy"] |
| 103 | [u'The Hobbit', u'Kitten, Squared'] |
| 104 | [u'The Hobbit', u'Kitten, Squared', u'Practical PostgreSQL'] |
+---------------+--------------------------------------------------------------+
SELECT 3
pigdb> SELECT books[1:2] FROM faviroute_book;
+------------------------------------------+
| books |
|------------------------------------------|
| [u"The Hichhiker 's GUIDE to he Galaxy"] |
| [u'The Hobbit', u'Kitten, Squared'] |
| [u'The Hobbit', u'Kitten, Squared'] |
+------------------------------------------+
SELECT 3
而多维数组在切片方面有点不可预期,因此不推荐在多维数组使用切片操作。
数组维度(Dimensions)
#
有些时候,我们需要知道数组中存储值的数量,你可以使用 array_dims()
函数;它接受一个数组参数,返回的字符串的格式和切片语法相同,描述有点拗口,不多说,看看例子就知道了:
pigdb> SELECT array_dims(books) FROM faviroute_book;
+--------------+
| array_dims |
|--------------|
| [1:1] |
| [1:2] |
| [1:3] |
+--------------+
SELECT 3
#数组更新的方式有三种:
- 整体变更:修改整个字段
- 切片变更:修改某个范围的值
- 元素变更:修改单个元素的值
PostgreSQL 对数组的更新操作没有限制,我们通过几个简单的例子就可以一窥究竟了;
pigdb> UPDATE faviroute_book SET
books=E'{"The Hichhiker\'s GUIDE to he Galaxy"}'
WHERE employee_id = 102; -- 整体变更
UPDATE 1
pigdb> UPDATE faviroute_book SET
books[2:3]='{"Kitten, Squared", "Practical PostgreSQL-2014"}'
WHERE employee_id = 104; -- 切片变更
UPDATE 1
pigdb> UPDATE faviroute_book SET
books[1]=E'{"There and Back Again: AHobbit\'s Holiday"}'
WHERE employee_id = 103; -- 元素变更
UPDATE 1
pigdb> SELECT * FROM faviroute_book;
+---------------+-----------------------------------------------------------------------+
| employee_id | books |
|---------------+-----------------------------------------------------------------------|
| 102 | [u"The Hichhiker's GUIDE to he Galaxy"] |
| 104 | [u'The Hobbit', u'Kitten, Squared', u'Practical PostgreSQL-2014'] |
| 103 | [u'{"There and Back Again: AHobbit\'s Holiday"}', u'Kitten, Squared'] |
+---------------+-----------------------------------------------------------------------+
SELECT 3
http://stackoverflow.com/questions/19812597/postgresql-string-escaping-settings
http://blog.163.com/digoal@126/blog/static/163877040201342185210972/