添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

SELECT

描述

SELECT 将从零个或更多表中返回记录行。 SELECT 通常的处理如下:

  1. 计算列出在 WITH 中的所有查询。这些有效的充当可以在 FROM 列表中引用的临时表。一个在 FROM 中多次引用的 WITH 查询只计算一次。(参阅下面的 WITH 子句 。)

  2. 计算列出在 FROM 中的所有元素( FROM 列表中的每个元素都是一个实际的或虚拟的表)。如果在 FROM 列表里声明了多个元素,那么他们就交叉连接在一起(参见下面的 FROM 子句 )。

  3. 如果声明了 WHERE 子句,那么在输出中消除所有不满足条件的行。 (参见下面的 WHERE 子句 。)

  4. 如果声明了 GROUP BY 子句,输出就组合成匹配一个或多个数值的不同组里。 如果出现了 HAVING 子句,那么它消除那些不满足给出条件的组。 (参见下面的 GROUP BY 子句 HAVING 子句 。)

  5. 实际输出行将使用 SELECT 输出表达式针对每一个选中的行或行组进行计算。 (参见下面的 SELECT 列表 。)

  6. SELECT DISTINCT 从结果中消除重复的行。 SELECT DISTINCT ON 消除匹配所有指定表达式的行。 SELECT ALL (缺省)返回所有的行, 包括重复的行。(参阅下面的 DISTINCT 子句 。)

  7. 使用 UNION , INTERSECT , EXCEPT 可以把多个 SELECT 语句的输出合并成一个结果集。 UNION 操作符返回两个结果集的并集。 INTERSECT 操作符返回两个结果集的交集。 EXCEPT 操作符返回在第一个结果集对第二个结果集的差集。不管哪种情况, 重复的行都被删除,除非声明了 ALL 。噪声字 DISTINCT 可以用来明确的声明消除重复的行。请注意, DISTINCT 在这里是缺省的行为, 即使 ALL SELECT 本身的缺省。 (参阅下面的 UNION 子句 INTERSECT 子句 EXCEPT 子句 。)

  8. 如果声明了 ORDER BY 子句,那么返回的行将按照指定的顺序排序。 如果没有给出 ORDER BY ,那么数据行是按照系统认为可以最快生成的顺序给出的。 (参阅下面的 ORDER BY 子句 。)

  9. 如果给出了 LIMIT (或 FETCH FIRST )或 OFFSET 子句,那么 SELECT 语句只返回结果行的一个子集。 (参阅下面的 LIMIT 子句 。)

  10. 如果声明了 FOR UPDATE , FOR NO KEY UPDATE , FOR SHARE FOR KEY SHARE 子句,那么 SELECT 语句对并发的更新锁住选定的行。 (参阅下面的 锁定子句 子句。)

你必须对每个在 SELECT 命令中使用的字段有 SELECT 权限。 使用 FOR NO KEY UPDATE , FOR UPDATE , FOR SHARE FOR KEY SHARE 还要求 UPDATE 权限 (至少选择每个表的一列)。

参数

WITH 子句

WITH 子句允许声明一个或多个可以在主查询中通过名字引用的子查询。 子查询在主查询期间有效的充当临时表或视图。每个子查询可以是 SELECT , VALUES , INSERT , UPDATE DELETE 语句。当在 WITH 中写一个数据修改语句时 ( INSERT , UPDATE DELETE ), 通常包含一个 RETURNING 子句。 RETURNING 的输出而 不是 语句修改的底层表的输出形成被主查询读取的临时表。如果省略了 RETURNING , 该语句仍然执行,但是不会产生输出,所以不能作为一个表被主查询引用。

必须为每个 WITH 查询声明一个名字(没有模式修饰)。 可选的,可以指定字段名的列表;如果省略了,那么字段名从子查询中推断出。

如果声明了 RECURSIVE ,那么允许 SELECT 子查询通过名字引用它自己。 比如一个有下面形式的子查询

non_recursive_term UNION [ ALL | DISTINCT ] recursive_term

递归的自我引用必须在 UNION 的右边出现。每个查询只允许一个递归的自我引用。 不支持递归的数据修改语句,但是可以在数据修改语句中使用递归的 SELECT 查询的结果。参阅 第 7.8 节 获取一个例子。

RECURSIVE 的另外一个作用是 WITH 查询不需要排序: 一个查询可以引用另外一个稍后出现在列表中的查询。(但是,循环引用或相互递归没有实现。) 没有 RECURSIVE WITH 查询只能引用 更早出现在 WITH 列表中的同层级的 WITH 查询。

WITH 查询的主要特性是他们只在主查询的每次执行中评估一次, 即使主查询引用了他们多次也是如此。特别的,保证数据修改语句只被执行一次, 不管主查询读取他们的所有或任意的输出。

主查询和 WITH 查询(理论上)同时执行。这意味着 WITH 中的数据修改语句的影响不能从查询的其他部分看到,除非读取它的 RETURNING 输出。如果两个这样的数据修改语句尝试修改相同的行,那么结果是未知的。

参阅 第 7.8 节 获取额外的信息。

FROM 子句

FROM 子句为 SELECT 声明一个或者多个源表。如果声明了多个源表, 那么结果就是所有源表的笛卡儿积(交叉连接)。但是通常会添加一些条件(通过 WHERE ), 把返回行限制成笛卡儿积的一个小的子集。

FROM 子句可以包括下列元素:

table_name

一个现存的表或视图的名字(可以有模式修饰)。如果声明了 ONLY ,则只扫描该表; 否则,该表和所有其派生表(如果有的话)都被扫描。可以在表名后面跟一个 * 表示扫描所有其后代表。

alias

为那些包含别名的 FROM 项目取的别名。别名用于缩写或者在自连接中消除歧义 (自连接中同一个表将扫描多次)。如果提供了别名,那么它就会完全隐藏表或者函数的实际名字; 比如,如果给出 FROM foo AS f ,那么 SELECT 剩下的东西必须把这个 FROM 项按照 f 而不是 foo 引用。 如果写了别名,也可以提供一个字段别名列表,这样可以替换表中一个或者多个字段的名字。

select

可以在 FROM 子句里出现一个子 SELECT 。 它的输出作用好像是为这条 SELECT 命令在其生存期里创建一个临时表。 请注意这个子 SELECT 必须用园括弧包围。并且 必须 给它一个别名。 当然, VALUES 同样也可以在这里使用。

with_query_name

WITH 查询通过写它自己的名字来引用,就像查询的名字就是一个表的名字。 (实际上, WITH 查询为主查询隐藏了相同名字的任意实际表。 如果需要,可以通过模式限定表的名字来引用相同名字的实际表。)别名可以用相同的方式提供给表。

function_name

函数(特别是那些返回结果集的函数)调用可以出现在 FROM 子句里。 这么做就好像在这个 SELECT 命令的生命期中,把函数的输出创建为一个临时表一样。 当然也可以使用别名。如果写了别名,还可以写一个字段别名列表, 为函数返回的复合类型的一个或多个属性提供名字替换。如果函数定义为返回 record 类型, 那么必须出现一个 AS 关键字或者别名,后面跟着一个形如 ( column_name data_type [ , ... ] ) 的字段定义列表。这个字段定义列表必须匹配函数返回的字段的实际数目和类型。

join_type

下列之一:

  • [ INNER ] JOIN

  • LEFT [ OUTER ] JOIN

  • RIGHT [ OUTER ] JOIN

  • FULL [ OUTER ] JOIN

  • CROSS JOIN

必须为 INNER OUTER 连接类型声明一个连接条件, 也就是 NATURAL , ON join_condition , or USING ( join_column [, ...]) 之一。 它们的含义见下文,对于 CROSS JOIN 而言,这些子句都不能出现。

一个 JOIN 子句组合两个 FROM 项,为了方便我们将其作为 "tables" 引用,尽管实际上他们可以是任意 FROM 条目的类型。必要时使用圆括弧以决定嵌套的顺序。 如果没有圆括弧, JOIN 从左向右嵌套。在任何情况下, JOIN 都比逗号分隔的 FROM 列表绑定得更紧。

CROSS JOIN INNER JOIN 生成一个简单的笛卡儿积, 和你在 FROM 的顶层列出两个表的结果相同,但是受到连接条件(如果有)的限制。 CROSS JOIN 等效于 INNER JOIN ON (TRUE) ,也就是说, 没有被条件删除的行。这种连接类型只是符号上的方便,因为它们和你用简单的 FROM WHERE 的效果一样。

LEFT OUTER JOIN 返回笛卡儿积中所有符合连接条件的行, 再加上左表中通过连接条件没有匹配右表行的那些行。这样,左边的行将扩展成生成表的全长, 方法是在那些右表对应的字段位置填上 NULL 。请注意,只在计算匹配的时候, 才使用 JOIN 子句的条件,外层的条件是在计算完毕之后施加的。

相应的, RIGHT OUTER JOIN 返回所有内连接的结果行, 加上每个不匹配的右边行(左边用 NULL 扩展)。这只是一个符号上的便利, 因为总是可以把它转换成一个 LEFT OUTER JOIN ,只要把左边和右边的输入对掉一下即可。

FULL OUTER JOIN 返回所有内连接的结果行,加上每个不匹配的左边行(右边用 NULL 扩展), 再加上每个不匹配的右边行(左边用 NULL 扩展)。

ON join_condition

一个生成 boolean 类型结果的表达式(类似 WHERE 子句), 限定连接中那些行是匹配的。

USING ( join_column [, ...] )

一个形如 USING ( a, b, ... ) 的子句,是 ON left_table.a = right_table.a AND left_table.b = right_table.b ... 的缩写。 同样, USING 蕴涵着每对等效字段中只有一个包含在连接输出中,而不是两个都输出的意思。

NATURAL

NATURAL 是一个 USING 列表的缩写,这个列表说的是两个表中同名的字段。

LATERAL

LATERAL 关键字可以放在一个子 SELECT FROM 项目的前面。 这允许子 SELECT 引用出现在 FROM 列表之前的 FROM 条目中的字段。 (没有 LATERAL ,每个子 SELECT 独立评估并且以此不能交叉引用任何其他 FROM 条目。)

LATERAL 也可以放在一个函数调用 FROM 条目的前面, 但是这种情况下它是一个噪声字,因为函数表达式可以在任何情况下引用前面的 FROM 条目。

LATERAL 可以出现在 FROM 列表的顶层,或出现在 JOIN 树中。 在后面当前情况下,它也可以引用 JOIN 左侧和右侧的任意条目。

FROM 条目包含 LATERAL 交叉引用时,评估收益如下: 对于提供交叉引用字段的 FROM 条目的每一行,或提供字段的多个 FROM 条目的行集,使用该字段的行或行集值评估 LATERAL 条目。 结果行像往常一样和计算他们的行连接。这是从字段源表重复每行或行集。

字段源表必须 INNER LEFT 连接 LATERAL 条目, 其他为 LATERAL 条目计算每个行集的行集将不会是明确定义的行集。 因此,尽管一个构造(如 X RIGHT JOIN LATERAL Y ) 在语法结构上合法,并不实际上允许 Y 引用 X

WINDOW 子句

WINDOW 子句的一般形式是

WINDOW window_name AS ( window_definition ) [, ...]

这里的 window_name 是可以在 OVER 子句中引用的名字或随后的窗口定义,这里的 window_definition

[ existing_window_name ]
[ PARTITION BY expression [, ...] ]
[ ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...] ]
[ frame_clause ]

如果声明了 existing_window_name , 那么必须引用一个在 WINDOW 列表中出现的更早的项;新的窗口从这个项中拷贝分区子句, 和排序子句(如果有)。在这种情况下,这个新的窗口不能声明他自己的 PARTITION BY 子句, 但是如果拷贝的窗口没有排序子句的话他可以声明 ORDER BY 子句。 新窗口总是使用他自己的框架子句;拷贝的窗口必须不能声明框架子句。

PARTITION BY 列表的元素的以与 GROUP BY 子句 的元素相同的方式来解释,除了他们总是简单的表达式并且从不是一个输出列的名称或者编号。 另外一个差异是这些表达式可以包含聚合函数调用,而在常规的 GROUP BY 子句中这是不允许的。 在这里允许是因为开窗在分组和聚合之后发生。

同样的, ORDER BY 列表的元素以与 ORDER BY 子句 的元素相同的方式来解释,除了这个表达式总是作为简单的表达式并且从不是一个输出列的名称或者编号。

可选的 frame_clause 为依赖于框架的窗口函数(不是所有)定义 窗口框架 。窗口框架是查询中的每行(称为 当前行 )的一组相关行。 frame_clause 可以是下列之一

[ RANGE | ROWS ] frame_start
[ RANGE | ROWS ] BETWEEN frame_start AND frame_end

这里的 frame_start frame_end 可以是下列之一

UNBOUNDED PRECEDING
value PRECEDING
CURRENT ROW
value FOLLOWING
UNBOUNDED FOLLOWING

如果省略了 frame_end ,那么它的缺省是 CURRENT ROW 。 限制是 frame_start 不能是 UNBOUNDED FOLLOWING frame_end 不能是 UNBOUNDED PRECEDING frame_end 选项在上面的列表中不能比 frame_start 选项出现的早,例如 RANGE BETWEEN CURRENT ROW AND value PRECEDING 是不允许的。

缺省框架选项是 RANGE UNBOUNDED PRECEDING ,这与 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 相同;它将框架设置为分区中的所有行,在 ORDER BY 序列中是从当前行的最后一个元素开始(这意味着若无 ORDER BY 则是所有行)。 通常, UNBOUNDED PRECEDING 表示框架从分区的第一行开始,类似的 UNBOUNDED FOLLOWING 表示框架以分区的最后一行结束(不管是 RANGE 还是 ROWS 模式)。在 ROWS 模式, CURRENT ROW 意味着框架以当前行开始或结束;但是在 RANGE 模式,意味着框架以当前行在 ORDER BY 序列中的第一个或最后一个元素开始或结束。 value PRECEDING value FOLLOWING 子句目前只允许在 ROWS 模式。 他们表明框架以当前行之前或者之后许多行开始或者结束。 value 必须是一个不包含任何变量、聚合函数或者窗口函数的整型表达式。该值不能为空或者负值; 但可以为0,并且这时选择当前行本身。

注意如果 ORDER BY 排序不能唯一地排列行,那么 ROWS 选项可能产生不可预测的结果。 RANGE 选项是为了确保 ORDER BY 序列中的对等的行能得到同等对待;任何两个对等行将会都在或者都不在框架中。

一个 WINDOW 语句的目的是指定出现在查询的 SELECT 列表 或者 ORDER BY 子句 中的 window 函数 的行为。 这些函数可以在其 OVER 子句中通过名称引用 WINDOW 子句条目。 一个 WINDOW 子句条目不需要在任何地方都引用;若它不在查询中使用,它将被忽略。 可以使用窗口程序而根本不需要任何 WINDOW 子句, 因为一个窗口函数调用可以直接在其 OVER 子句中指定其窗口定义。然而, WINDOW 子句会在多个窗口函数需要相同窗口定义时保存输入。

窗口函数在 第 3.5 节 , 第 4.2.8 节 , 和 第 7.2.4 节 中有详细描述。

SELECT 列表

SELECT 列表(在 SELECT FROM 关键字之间的部分) 声明组成 SELECT 语句的输出行的表达式。这些表达式可以 (并且通常也会)引用在 FROM 子句里面计算出来的字段。

就像在一个表中,一个 SELECT 的每个输出列都有一个名称。 在一个简单的 SELECT 中,该名称仅用于标记显示的列, 但当 SELECT 是一个较大查询的子查询时,名称被较大查询视为子查询产生的虚表的字段名。 为了指定用于输出列的名称,要在列表达式后写 AS output_name 。(您可以省略 AS , 但只有当所需的输出名称不匹配任何 PostgreSQL 关键字时 (请参阅 附录 C )。为了防止将来可能的关键字添加, 建议您要么写 AS 要么用双引号引起输出名称。)如果你不指定一个字段名, PostgreSQL 会自动选择一个名称。如果字段的表达式是一个简单的列引用, 那么选择的名称与字段名相同;在更复杂的情况下,可能会使用一个函数或类型名, 或系统会依赖于一个类似 ?column? 的生成名。

一个输出列的名称可以用来参考 ORDER BY GROUP BY 子句中的字段的值, 而不是在 WHERE 或者 HAVING 子句中的;反而您必须在那里写出表达式。

除了表达式,也可以在输出列表中使用 * 表示所有字段。 还可以用 table_name .* 作为来自该表的所有字段的缩写。这些情况下用 AS 指定新名称是不可能的; 输出列的名称将会与表列的名称相同。

ORDER BY 子句

可选的 ORDER BY 子句有下面的一般形式:

ORDER BY expression [ ASC | DESC | USING operator ] [ NULLS { FIRST | LAST } ] [, ...]

ORDER BY 子句导致结果行根据指定的表达式进行排序。 如果根据最左边的表达式,两行的结果相同,那么就根据下一个表达式进行比较, 依此类推。如果对于所有声明的表达式他们都相同,那么按随机顺序返回。

每个 expression 可以是一个输出字段 ( SELECT 列表项)的名字或者序号,或者也可以是用输入字段的数值组成的任意表达式。

序数指的是输出字段按顺序(从左到右)的位置。这个特性可以对没有唯一名称的字段进行排序。 这不是必须的,因为总是可以通过 AS 子句给一个要输出的字段赋予一个名称。

ORDER BY 里还可以使用任意表达式,包括那些没有出现在 SELECT 输出列表里面的字段。因此下面的语句现在是合法的:

SELECT name FROM distributors ORDER BY code;

这个特性的一个局限就是应用于 UNION , INTERSECT , EXCEPT 子句的结果的 ORDER BY 子句只能在一个输出字段名或者数字上声明, 而不能在一个表达式上声明。

如果一个 ORDER BY 表达式是一个简单名称,同时匹配结果字段和输入字段, ORDER BY 将把它解释成结果字段名称。这和 GROUP BY 在同样情况下做的选择正相反。这样的不一致是用来和 SQL 标准兼容的。

可以给 ORDER BY 子句里每个字段加一个可选的 ASC (升序,缺省) 或 DESC (降序)关键字。还可以在 USING 子句里声明一个排序操作符来实现排序。排序操作符必须小于或大于某些B-tree操作符族的成员。 ASC 等效于使用 USING < DESC 等效于使用 USING > 。 但是一个用户定义类型的创建者可以明确定义缺省的排序顺序,并且可以使用其他名称的操作符。

如果指定 NULLS LAST ,空值会在所有非空值之后排序;如果指定 NULLS FIRST ,空值会在所有非空值之前排序。如果两者均未指定, 当指定 ASC 或缺省时,默认反应时是 NULLS LAST , 并且当指定 DESC 时,默认反应时是 NULLS FIRST (因此, 默认地认为空是大于非空的)。当指定 USING 时, 默认空排序依赖于操作符是小于还是大于操作符。

请注意排序选项仅适用于他们遵循的表达式;例如 ORDER BY x, y DESC 不意味着与 ORDER BY x DESC, y DESC 相同。

字符类型的数据是按照应用于被排序的字段的排序规则排序的。可以在需要时通过在 expression 中包含 COLLATE 子句覆盖,例如 ORDER BY mycolumn COLLATE "en_US" 。更多信息请参阅 第 4.2.10 节 第 22.2 节

LIMIT 子句

LIMIT 子句由两个独立的子句组成:

LIMIT { count | ALL }
OFFSET start

count 声明返回的最大行数, 而 start 声明开始返回行之前忽略的行数。 如果两个都指定了,那么在开始计算 count 个返回行之前将先跳过 start 行。

如果 count 表达式评估为NULL, 它被当做 LIMIT ALL ,也就是,没有限制。如果 start 评估为NULL,他与 OFFSET 0 相同对待。

SQL:2008引入了一个不同的语法来达到相同的效果,这也是 PostgreSQL 支持的。这是:

OFFSET start { ROW | ROWS }
FETCH { FIRST | NEXT } [ count ] { ROW | ROWS } ONLY

在该语法中,为 start count 提供除简单整型常量之外的东西时,你必须写圆括号。如果 count FETCH 子句中省略了,它默认为1。 ROW ROWS 以及 FIRST NEXT 是不影响这些子句的效果的干扰词。 根据该标准,若两个都存在则 OFFSET 子句必须在 FETCH 子句之前出现; 但是 PostgreSQL 的要求更为宽松并且允许任意一种顺序。

使用 LIMIT 的一个好习惯是使用一个 ORDER BY 子句把结果行限制成一个唯一的顺序。 否则你会得到无法预料的结果子集,你可能想要第十行到第二十行,但是是以什么顺序的第十行到第二十行? 除非你声明 ORDER BY ,否则你不知道什么顺序。

查询优化器在生成查询规划时会把 LIMIT 考虑进去,所以你很有可能因给出的 LIMIT OFFSET 值不同而得到不同的规划(生成不同的行序)。 因此用不同的 LIMIT / OFFSET 值选择不同的查询结果的子集 将不会产生一致的结果 ,除非你用 ORDER BY 强制生成一个可预计的结果顺序。这可不是 bug ;这是 SQL 生来的特点, 因为除非用了 ORDER BY 约束顺序,SQL 不保证查询生成的结果有任何特定的顺序。

如果没有一个 ORDER BY 来强制选择一个确定性子集,那么重复执行相同的 LIMIT 查询返回不同的表行的子集甚至都是可能的。同样, 这不是一个漏洞;结果的确定在这种情况下没法保证。

锁定子句

FOR UPDATE , FOR NO KEY UPDATE , FOR SHARE FOR KEY SHARE 锁定子句 ;他们影响 SELECT 如何从表中锁定行作为获得的行。

锁定子句的一般形式:

FOR lock_strength [ OF table_name [, ...] ] [ NOWAIT ]

这里的 lock_strength 可以是下列之一:

UPDATE
NO KEY UPDATE
SHARE
KEY SHARE

FOR UPDATE 令那些被 SELECT 检索出来的行被锁住, 就像要更新一样。这样就避免它们在当前事务结束前被其它事务修改或者删除;也就是说, 其它企图 UPDATE , DELETE , SELECT FOR UPDATE , SELECT FOR NO KEY UPDATE , SELECT FOR SHARE SELECT FOR KEY SHARE 这些行的事务将被阻塞,直到当前事务结束。 FOR UPDATE 锁模式也可以通过在一个行上 DELETE 或在特定的字段上修改值的 UPDATE 获得。目前,为 UPDATE 情况考虑的字段设置是那些有唯一索引并且可以用于外键的 (所以不考虑局部索引和表达式索引),但是这个可能会在将来改变。同样, 如果一个来自其它事务的 UPDATE , DELETE , SELECT FOR UPDATE 已经锁住了某个或某些选定的行, SELECT FOR UPDATE 将等到那些事务结束,并且将随后锁住并返回更新的行(或者不返回行,如果行已经被删除)。 但是,在 REPEATABLE READ SERIALIZABLE 事务内部, 如果在事务开始时要被锁定的行已经改变了,那么将抛出一个错误。更多的讨论参阅 第 13 章

FOR NO KEY UPDATE 的行为类似,只是获得的锁比较弱:这个锁将不锁定 尝试在相同的行上获得锁的 SELECT FOR KEY SHARE 命令。 这个锁模式也可以通过任何不争取 FOR UPDATE 锁的 UPDATE 获得。

FOR SHARE 的行为类似,只是它在每个检索出来的行上要求一个共享锁, 而不是一个排它锁。一个共享锁阻塞其它事务在这些行上执行 UPDATE , DELETE , SELECT FOR UPDATE SELECT FOR NO KEY UPDATE ,却不阻止他们执行 SELECT FOR SHARE SELECT FOR KEY SHARE

FOR KEY SHARE 的行为类似于 FOR SHARE ,只是锁比较弱: 阻塞 SELECT FOR UPDATE 但不阻塞 SELECT FOR NO KEY UPDATE 。 一个共享键块阻塞其他事务执行 DELETE 或任意改变键值的 UPDATE , 但是不阻塞其他 UPDATE ,也不阻止 SELECT FOR NO KEY UPDATE , SELECT FOR SHARE , 或 SELECT FOR KEY SHARE

为了避免操作等待其它事务提交,使用 NOWAIT 选项。如果被选择的行不能立即被锁住, 那么语句将会立即报告一个错误,而不是等待。请注意, NOWAIT 只适用于行级别的锁, 要求的表级锁 ROW SHARE 仍然以通常的方法进行(参阅 第 13 章 )。 如果需要申请表级别的锁同时又不等待,那么你可以使用 LOCK NOWAIT 选项。

如果在锁定子句中明确指定了表名字,那么将只有这些指定的表被锁定,其他在 SELECT 中使用的表将不会被锁定。 一个其后不带表列表的锁定子句将锁定该声明中所有使用的表。 如果锁定子句应用于一个视图或者子查询,它同样将锁定所有该视图或子查询中使用到的表。 但是这些子句不适用于被主查询引用的 WITH 查询。 如果你想要行锁定发生在 WITH 查询中,那么在 WITH 查询中指定锁定子句。

多个锁定子句可以用于为不同的表指定不同的锁定模式。如果一个表出同时出现 (或隐含同时出现)在多个锁定子句中,那么将看做只被最强的那个声明了处理。 类似的,如果影响一个表的任意子句中出现了 NOWAIT , 那么该表将按照 NOWAIT 处理。

锁定子句不能在那些无法使用独立的表行清晰标识返回行的环境里使用;比如,它不能和聚合一起使用。

当锁定子句出现在 SELECT 查询的顶层时,锁定的行恰好是被查询返回的行; 在连接查询的情况下,锁定的行是那些有助于返回连接的行。另外, 满足查询条件的行作为查询快照将被锁定,尽管如果在快照后他们被更新不再满足查询条件 就不再被返回。如果使用了 LIMIT ,那么一旦返回足够的行满足限制锁定将停止 (但是请注意,通过 OFFSET 跳过的行将被锁定)。相似的,如果锁定子句用于游标查询, 只有实际抓取到的行或通过游标跳过的行将被锁定。

当锁定子句出现在子 SELECT 中时,锁定的行是那些通过子查询返回到外查询的行。 这些包含的行可能比单独检查子查询时给出的行更少,因为外查询的条件可能会用来优化子查询的执行。

SELECT * FROM (SELECT * FROM mytable FOR UPDATE) ss WHERE col1 = 5;

将只锁定 col1 = 5 的行,即使那个条件不是子查询中的原文。

以前的版本未能保持锁,通过一个稍后的保存点来改善。例如,这段代码:

BEGIN;
SELECT * FROM mytable WHERE key = 1 FOR UPDATE;
SAVEPOINT s;
UPDATE mytable SET ... WHERE key = 1;
ROLLBACK TO s;

FOR UPDATE 锁将会在 ROLLBACK TO 之后无法保持。这在版本9.3中已经修复了。

小心

一个 SELECT 命令运行在 READ COMMITTED 事务隔离级别和使用 ORDER BY 和一个锁定子句返回顺序混乱的行是可能的。这是因为 ORDER BY 先生效。命令排序结果,但是可能会在其中一行或多行上获取锁的时候被阻塞。一旦 SELECT 的阻塞被解除后,某些顺序字段值可能被修改,导致这些行混乱了(尽管他们还是原先字段值的顺序)。 可以在需要的时候通过在子查询中放置 FOR UPDATE/SHARE 子句来避开,例如

SELECT * FROM (SELECT * FROM mytable FOR UPDATE) ss ORDER BY column1;

请注意这将导致锁定 mytable 的所有行,而顶层的 FOR UPDATE 将会实际上仅锁住返回行。这可能会产生一个显著的性能差异,尤其是如果 ORDER BY LIMIT 或者其他限制结合。仅当顺序列的并发更新是预期的并且需要一个严格的排序结果时, 该技术才是建议使用的。

REPEATABLE READ SERIALIZABLE 事务隔离级别, 这可能会导致一个序列化失败( SQLSTATE '40001' ), 所以在这些隔离级别下接收次序混乱的行是不可能的。

例子

将表 films 和表 distributors 连接在一起:

SELECT f.title, f.did, d.name, f.date_prod, f.kind
    FROM distributors d, films f
    WHERE f.did = d.did
       title       | did |     name     | date_prod  |   kind
-------------------+-----+--------------+------------+----------
 The Third Man     | 101 | British Lion | 1949-12-23 | Drama
 The African Queen | 101 | British Lion | 1951-08-11 | Romantic
  

统计用kind分组的每组电影的长度len总和:

SELECT kind, sum(len) AS total FROM films GROUP BY kind;
   kind   | total
----------+-------
 Action   | 07:34
 Comedy   | 02:58
 Drama    | 14:28
 Musical  | 06:42
 Romantic | 04:38

统计用kind分组的每组电影的长度len总和不足五小时的组:

SELECT kind, sum(len) AS total
    FROM films
    GROUP BY kind
    HAVING sum(len) < interval '5 hours';
   kind   | total
----------+-------
 Comedy   | 02:58
 Romantic | 04:38

下面两个例子是根据第二列(name)的内容对单独的结果排序的相同的方法:

SELECT * FROM distributors ORDER BY name;
SELECT * FROM distributors ORDER BY 2;
 did |       name
-----+------------------
 109 | 20th Century Fox
 110 | Bavaria Atelier
 101 | British Lion
 107 | Columbia
 102 | Jean Luc Godard
 113 | Luso films
 104 | Mosfilm
 103 | Paramount
 106 | Toho
 105 | United Artists
 111 | Walt Disney
 112 | Warner Bros.
 108 | Westward

下面这个例子演示如何获得表distributorsactors的连接, 只将每个表中以字母 W 开头的取出来。因为只取了不重复的行,所以关键字ALL被省略了:

distributors:               actors:
 did |     name              id |     name
-----+--------------        ----+----------------
 108 | Westward               1 | Woody Allen
 111 | Walt Disney            2 | Warren Beatty
 112 | Warner Bros.           3 | Walter Matthau
 ...                         ...
SELECT distributors.name
    FROM distributors
    WHERE distributors.name LIKE 'W%'
UNION
SELECT actors.name
    FROM actors
    WHERE actors.name LIKE 'W%';
----------------
 Walt Disney
 Walter Matthau
 Warner Bros.
 Warren Beatty
 Westward
 Woody Allen

这个例子显示了如何在FROM子句中使用函数,包括带有和不带字段定义列表的。

CREATE FUNCTION distributors(int) RETURNS SETOF distributors AS $$
    SELECT * FROM distributors WHERE did = $1;
$$ LANGUAGE SQL;
SELECT * FROM distributors(111);
 did |    name
-----+-------------
 111 | Walt Disney
CREATE FUNCTION distributors_2(int) RETURNS SETOF record AS $$
    SELECT * FROM distributors WHERE did = $1;
$$ LANGUAGE SQL;
SELECT * FROM distributors_2(111) AS (f1 int, f2 text);
 f1  |     f2
-----+-------------
 111 | Walt Disney

这个例子显示了如何使用一个简单的WITH子句:

WITH t AS (
    SELECT random() as x FROM generate_series(1, 3)
SELECT * FROM t
UNION ALL
SELECT * FROM t
--------------------
  0.534150459803641
  0.520092216785997
 0.0735620250925422
  0.534150459803641
  0.520092216785997
 0.0735620250925422

请注意WITH查询只评估一次,所以我们获得两组相同的三个随机值。

这个例子使用WITH RECURSIVE 从一个只显示直接属下的表中找到所有职员Mary的属下(直接或间接),和他们的间接级别,

WITH RECURSIVE employee_recursive(distance, employee_name, manager_name) AS (
    SELECT 1, employee_name, manager_name
    FROM employee
    WHERE manager_name = 'Mary'
  UNION ALL
    SELECT er.distance + 1, e.employee_name, e.manager_name
    FROM employee_recursive er, employee e
    WHERE er.employee_name = e.manager_name
SELECT distance, employee_name FROM employee_recursive;

请注意递归查询的典型形式:一个初始条件,紧接着是UNION, 然后是查询的递归部分。确定查询的递归部分最终将不会返回元组,否则查询将无限循环下去。 (请参阅第 7.8 节获取更多示例。)

这个例子使用LATERALmanufacturers表的每行应用一个设置返回函数 get_product_names()

SELECT m.name AS mname, pname
FROM manufacturers m, LATERAL get_product_names(m.id) pname;

当前没有任何产品的制造商将不会出现在结果中,因为这是一个内连接。 如果我们希望在结果中包括这种制造商的名字,我们可以这样做:

SELECT m.name AS mname, pname
FROM manufacturers m LEFT JOIN LATERAL get_product_names(m.id) pname ON true;

兼容性

SELECT 语句和 SQL 标准兼容。但是还有一些扩展和一些缺少的特性。

LIMIT OFFSET

子句 LIMIT OFFSET PostgreSQL 特定的语法,也是 MySQL 使用的。SQL:2008标准引入了 OFFSET ... FETCH {FIRST|NEXT} ... 获取相同的功能, 如上面的 LIMIT 子句 子句所示。 该语法也被 IBM DB2 使用。(为 Oracle 所写的应用程序通常使用一个涉及自动生成的 rownum 列的工作区, 来实现这些子句的效果,这在PostgreSQL中是不可用的。)