我正在寻找一种方法,通过查询连接组内字段的字符串。例如,我有一个表格:

ID   COMPANY_ID   EMPLOYEE
1    1            Anna
2    1            Bill
3    2            Carol
4    2            Dave

我想通过company_id进行分组,以获得如下内容:

COMPANY_ID   EMPLOYEE
1            Anna, Bill
2            Carol, Dave

mySQL中有一个内置函数来执行这个group_concat


当前回答

PostgreSQL 9.0及以上版本:

现代Postgres(自2010年以来)有string_agg(表达式,分隔符)函数,它将做的正是询问者正在寻找的:

SELECT company_id, string_agg(employee, ', ')
FROM mytable
GROUP BY company_id;

Postgres 9还增加了在任何聚合表达式中指定ORDER BY子句的能力;否则,您必须对所有结果进行排序或处理未定义的顺序。现在你可以这样写:

SELECT company_id, string_agg(employee, ', ' ORDER BY employee)
FROM mytable
GROUP BY company_id;

PostgreSQL 8.4.x:

PostgreSQL 8.4(2009年)引入了聚合函数array_agg(表达式),用于收集数组中的值。然后可以使用array_to_string()来给出所需的结果:

SELECT company_id, array_to_string(array_agg(employee), ', ')
FROM mytable
GROUP BY company_id;

PostgreSQL 8.3。X及以上:

最初提出这个问题时,没有内置的聚合函数来连接字符串。最简单的自定义实现(Vajda Gabo在这篇邮件列表帖子中建议)是使用内置的textcat函数(位于||操作符后面):

CREATE AGGREGATE textcat_all(
  basetype    = text,
  sfunc       = textcat,
  stype       = text,
  initcond    = ''
);

下面是CREATE AGGREGATE文档。

这只是将所有字符串粘在一起,没有分隔符。为了在它们之间插入一个“,”,而不是在末尾,您可能想要创建自己的连接函数,并用它代替上面的“textcat”。下面是我在8.3.12上测试的一个:

CREATE FUNCTION commacat(acc text, instr text) RETURNS text AS $$
  BEGIN
    IF acc IS NULL OR acc = '' THEN
      RETURN instr;
    ELSE
      RETURN acc || ', ' || instr;
    END IF;
  END;
$$ LANGUAGE plpgsql;

这个版本将输出一个逗号,即使行中的值为null或空,所以你会得到这样的输出:

a, b, c, , e, , g

如果你想删除额外的逗号来输出:

a, b, c, e, g

然后在函数中添加ELSIF检查,如下所示:

CREATE FUNCTION commacat_ignore_nulls(acc text, instr text) RETURNS text AS $$
  BEGIN
    IF acc IS NULL OR acc = '' THEN
      RETURN instr;
    ELSIF instr IS NULL OR instr = '' THEN
      RETURN acc;
    ELSE
      RETURN acc || ', ' || instr;
    END IF;
  END;
$$ LANGUAGE plpgsql;

其他回答

使用STRING_AGG函数PostgreSQL和谷歌BigQuery SQL:

SELECT company_id, STRING_AGG(employee, ', ')
FROM employees
GROUP BY company_id;

从PostgreSQL 9.0开始,你可以使用名为string_agg的聚合函数。你的新SQL应该看起来像这样:SELECT company_id, string_agg(employee, ', ') 从mytable GROUP BY company_id;

我使用Jetbrains Rider,从上面的例子中复制结果并重新执行是一件麻烦的事情,因为它似乎将所有内容都包装在JSON中。这将它们连接到一个更容易运行的语句中

select string_agg('drop table if exists "' || tablename || '" cascade', ';') 
from pg_tables where schemaname != $$pg_catalog$$ and tableName like $$rm_%$$

下面是关于字符串连接的自定义聚合函数的使用:你需要记住,select语句将以任意顺序排列行,所以你需要在from语句中使用order by子句执行子选择,然后使用group by子句执行外层选择来聚合字符串,这样:

SELECT custom_aggregate(MY.special_strings)
FROM (SELECT special_strings, grouping_column 
        FROM a_table 
        ORDER BY ordering_column) MY
GROUP BY MY.grouping_column

如前所述,创建自己的聚合函数是正确的做法。下面是我的拼接聚合函数(你可以在法语中找到详细信息):

CREATE OR REPLACE FUNCTION concat2(text, text) RETURNS text AS '
    SELECT CASE WHEN $1 IS NULL OR $1 = \'\' THEN $2
            WHEN $2 IS NULL OR $2 = \'\' THEN $1
            ELSE $1 || \' / \' || $2
            END; 
'
 LANGUAGE SQL;

CREATE AGGREGATE concatenate (
  sfunc = concat2,
  basetype = text,
  stype = text,
  initcond = ''

);

然后把它用作:

SELECT company_id, concatenate(employee) AS employees FROM ...