PostgreSQL unnest(),元素编号
当我有一个带有单独值的列时,可以使用以下unnest()函数:
myTableid | elements
---+------------
1 |ab,cd,efg,hi
2 |jk,lm,no,pq
3 |rstuv,wxyz
select id, unnest(string_to_array(elements, ',')) AS elem
from myTable
id | elem
---+-----
1 | ab
1 | cd
1 | efg
1 | hi
2 | jk
...
如何包含元素编号?IE:
id | elem | nr---+------+---
1 | ab | 1
1 | cd | 2
1 | efg | 3
1 | hi | 4
2 | jk | 1
...
我想要源字符串中每个元素的原始位置。我试着窗口函数(row_number(),rank()等等),但我总是得到1。也许是因为它们在源表的同一行中?
我知道这是一个不好的表设计。这不是我的,我只是想解决它。
回答:
Postgres 9.4或更高版本使用WITH ORDINALITY了一组返回功能:
当FROM子句中的函数后缀为时WITH ORDINALITY,bigint会在输出后附加一列,该 列从1开始,对于函数输出的每一行以1递增。在设置返回函数(例如)的情况下,此功能最有用unnest()。
结合LATERALpg 9.3+中的功能,并根据pgsql-hackers上的该线程,上述查询现在可以写成:
SELECT t.id, a.elem, a.nrFROM tbl AS t
LEFT JOIN LATERAL unnest(string_to_array(t.elements, ','))
WITH ORDINALITY AS a(elem, nr) ON TRUE;
LEFT JOIN ... ON TRUE
保留左侧表中的所有行,即使右侧的表表达式不返回任何行。如果这无关紧要,则可以使用这种等效的,不太冗长的形式,并带有一个隐式CROSS JOIN LATERAL
:
SELECT t.id, a.elem, a.nrFROM tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);
如果基于实际数组(arr是数组列),则更简单:
SELECT t.id, a.elem, a.nrFROM tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);
甚至使用最少的语法:
SELECT id, a, ordinalityFROM tbl, unnest(arr) WITH ORDINALITY a;
a自动为表和列的别名。添加的序数列的默认名称为ordinality。但是最好添加(更安全,更整洁)显式的列别名和表限定列。
这样,row_number() OVER (PARTITION BY id ORDER BY elem)您将获得按排序顺序排列的数字,而不是字符串中原始序数位置的序数。
您可以简单地省略ORDER BY:
SELECT *, row_number() OVER (PARTITION by id) AS nrFROM (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;
尽管这通常可以正常工作,但我从未见过在简单查询中失败,但是PostgreSQL断言了没有的行的顺序ORDER BY。由于实现细节,它碰巧可以工作。
为了保证用空格分隔的字符串中元素的序号:
SELECT id, arr[nr] AS elem, nrFROM (
SELECT *, generate_subscripts(arr, 1) AS nr
FROM (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
) sub;
如果基于实际数组,则更简单:
SELECT id, arr[nr] AS elem, nrFROM (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;
dba.SE的相关答案:
如何在未嵌套的数组中保留元素的原始顺序?
这些功能都不是可用的,但:RETURNS TABLE,generate_subscripts(),unnest(),array_length()
。但这有效:
CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer) RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
FROM generate_series(array_lower($1,1), array_upper($1,1)) i';
特别要注意的是,数组索引可以与元素的顺序位置不同。考虑具有扩展功能的此演示:
CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int) RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
FROM generate_series(array_lower($1,1), array_upper($1,1)) i';
SELECT id, arr, (rec).*
FROM (
SELECT *, f_unnest_ord_idx(arr) AS rec
FROM (VALUES (1, '{a,b,c}'::text[]) -- short for: '[1:3]={a,b,c}'
, (2, '[5:7]={a,b,c}')
, (3, '[-9:-7]={a,b,c}')
) t(id, arr)
) sub;
id | arr | val | ordinality | idx
----+-----------------+-----+------------+-----
1 | {a,b,c} | a | 1 | 1
1 | {a,b,c} | b | 2 | 2
1 | {a,b,c} | c | 3 | 3
2 | [5:7]={a,b,c} | a | 1 | 5
2 | [5:7]={a,b,c} | b | 2 | 6
2 | [5:7]={a,b,c} | c | 3 | 7
3 | [-9:-7]={a,b,c} | a | 1 | -9
3 | [-9:-7]={a,b,c} | b | 2 | -8
3 | [-9:-7]={a,b,c} | c | 3 | -7
以上是 PostgreSQL unnest(),元素编号 的全部内容, 来源链接: utcz.com/qa/403932.html