Simulando a função MySQL group_concat no Microsoft SQL Server 2005?

347

Estou tentando migrar um aplicativo baseado no MySQL para o Microsoft SQL Server 2005 (não por opção, mas é a vida).

No aplicativo original, usamos quase inteiramente instruções compatíveis com ANSI-SQL, com uma exceção significativa - usamos a group_concatfunção do MySQL com bastante frequência.

group_concat, a propósito, faz isso: dada uma tabela de, digamos, nomes e projetos de funcionários ...

SELECT empName, projID FROM project_members;

retorna:

ANDY   |  A100
ANDY   |  B391
ANDY   |  X010
TOM    |  A100
TOM    |  A510

... e aqui está o que você obtém com group_concat:

SELECT 
    empName, group_concat(projID SEPARATOR ' / ') 
FROM 
    project_members 
GROUP BY 
    empName;

retorna:

ANDY   |  A100 / B391 / X010
TOM    |  A100 / A510

Então, o que eu gostaria de saber é: É possível escrever, digamos, uma função definida pelo usuário no SQL Server que emule a funcionalidade do group_concat?

Não tenho quase nenhuma experiência usando UDFs, procedimentos armazenados ou qualquer coisa assim, apenas SQL direto, por isso, erre no lado de muita explicação :)

— DanM
fonte

Alguns links úteis: postgresonline.com/journal/archives/191-stringagg.html e consultingblogs.emc.com/jamiethomson/archive/2009/07/16/…

— bernhof

Esta é uma pergunta antiga, mas eu gosto da solução CLR fornecida aqui .

— Diego

possível duplicata de Como criar uma lista separada por vírgulas usando uma consulta SQL? - esse post é mais ampla, então eu iria escolher aquele como canônica

— TMS

possível duplicata de função group_concat SQL no SQL Server

— Trikaldarshi

Como você sabe em que ordem a lista deve ser construída, por exemplo, você mostra A100 / B391 / X010, mas, como não há pedidos implícitos em um banco de dados relacional, ele poderia ser facilmente X010 / A100 / B391 ou qualquer outra combinação.

— Steve Ford

174

Nenhuma maneira fácil e REAL de fazer isso. Muitas idéias lá fora, no entanto.

Melhor que eu encontrei :

SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
    SELECT column_name + ','
    FROM information_schema.columns AS intern
    WHERE extern.table_name = intern.table_name
    FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;

Ou uma versão que funcione corretamente se os dados puderem conter caracteres como <

WITH extern
     AS (SELECT DISTINCT table_name
         FROM   INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
       LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM   extern
       CROSS APPLY (SELECT column_name + ','
                    FROM   INFORMATION_SCHEMA.COLUMNS AS intern
                    WHERE  extern.table_name = intern.table_name
                    FOR XML PATH(''), TYPE) x (column_names)
       CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names)

— BradC
fonte

11

Este exemplo funcionou para mim, mas eu tentei fazer outra agregação e não funcionou, deu-me um erro: "o nome da correlação 'pre_trimmed' é especificado várias vezes em uma cláusula FROM".

— PhilChuang

7

'pre_trimmed' é apenas um alias para a subconsulta. Aliases são necessários para subqueries e tem que ser único, então para uma outra mudança subconsulta-lo para algo único ...

— Koen

2

você pode mostrar um exemplo sem nome_da_tabela, pois o nome da coluna é confuso.

— 2131717 S.Mason

169

Talvez eu esteja um pouco atrasado para a festa, mas esse método funciona para mim e é mais fácil que o método COALESCE.

SELECT STUFF(
             (SELECT ',' + Column_Name 
              FROM Table_Name
              FOR XML PATH (''))
             , 1, 1, '')

— Scott
fonte

11

Isso mostra apenas como concaturar valores - group_concat os concatena por grupo, o que é mais desafiador (e o que o OP parece exigir). Veja a resposta aceita no SO 15154644 para saber como fazer isso - a cláusula WHERE é a adição crítica

— DJDave

@DJDave estava se referindo a esta resposta . Veja também a resposta aceita para uma pergunta semelhante .

— John Cummings

51

Possivelmente tarde demais para ser benéfico agora, mas não é a maneira mais fácil de fazer as coisas?

SELECT     empName, projIDs = replace
                          ((SELECT Surname AS [data()]
                              FROM project_members
                              WHERE  empName = a.empName
                              ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM         project_members a
WHERE     empName IS NOT NULL
GROUP BY empName

— J Hardiman
fonte

Interessante. Eu já terminei o projeto em questão, mas tentarei este método. Obrigado!

— DanM

7

Bom truque - o único problema é que sobrenomes com espaços substituam o espaço pelo separador.

— Mark Elliot

Eu também encontrei esse problema, Mark. Infelizmente, até o MSSQL acompanhar os horários e apresentar o GROUP_CONCAT, esse é o menor dos métodos de sobrecarga que eu pude apresentar para o que é necessário aqui.

— J # Hardiman

Obrigado por isso! Aqui está um SQL Fiddle mostrando seu funcionamento: sqlfiddle.com/#!6/c5d56/3

— saiu em

42

O SQL Server 2017 apresenta uma nova função agregada

STRING_AGG ( expression, separator).

Concatena os valores das expressões de sequência e coloca valores separadores entre elas. O separador não é adicionado no final da string.

Os elementos concatenados podem ser pedidos anexando WITHIN GROUP (ORDER BY some_expression)

Para as versões 2005-2016 , normalmente uso o método XML na resposta aceita.

Isso pode falhar em algumas circunstâncias, no entanto. por exemplo, se os dados a serem concatenadas contém CHAR(29)você vê

FOR XML não pôde serializar os dados ... porque contém um caractere (0x001D) que não é permitido em XML.

Um método mais robusto que pode lidar com todos os caracteres seria usar um agregado CLR. Contudo, aplicar uma ordem aos elementos concatenados é mais difícil com essa abordagem.

O método de atribuição a uma variável não é garantido e deve ser evitado no código de produção.

— Martin Smith
fonte

Agora também está disponível no SQL Azure: azure.microsoft.com/en-us/roadmap/…

— Simon_Weaver

34

Dê uma olhada no projeto GROUP_CONCAT no Github, acho que faço exatamente o que você está procurando:

Este projeto contém um conjunto de funções agregadas definidas pelo usuário do SQLCLR (UDAs do SQLCLR) que oferecem coletivamente uma funcionalidade semelhante à função GROUP_CONCAT do MySQL. Existem várias funções para garantir o melhor desempenho com base na funcionalidade necessária ...

— MaxiWheat
fonte

2

@ MaxiWheat: muitos caras não leem perguntas ou respondem com cuidado antes de clicar em votar. Afeta a postagem do proprietário diretamente devido a seu erro.

— Steve Lam

Funciona bem. A única característica que me falta é a capacidade de classificar em uma coluna que o MySQL group_concat () possa gostar:GROUP_CONCAT(klascode,'(',name,')' ORDER BY klascode ASC SEPARATOR ', ')

— Jan

10

Para concatenar todos os nomes de gerente de projetos de projetos com vários gerentes de projeto, escreva:

SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v 
where a.project_id=project_id
 FOR
 XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name

— Cmaly
fonte

9

Com o código abaixo, você deve definir PermissionLevel = External nas propriedades do seu projeto antes de implantar e alterar o banco de dados para confiar no código externo (leia em outro lugar sobre riscos e alternativas de segurança [como certificados]) executando "ALTER DATABASE database_name SET CONFIANÇA EM ".

using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
    public struct CommaDelimit : IBinarySerialize
{


[Serializable]
 private class StringList : List<string>
 { }

 private StringList List;

 public void Init()
 {
  this.List = new StringList();
 }

 public void Accumulate(SqlString value)
 {
  if (!value.IsNull)
   this.Add(value.Value);
 }

 private void Add(string value)
 {
  if (!this.List.Contains(value))
   this.List.Add(value);
 }

 public void Merge(CommaDelimit group)
 {
  foreach (string s in group.List)
  {
   this.Add(s);
  }
 }

 void IBinarySerialize.Read(BinaryReader reader)
 {
    IFormatter formatter = new BinaryFormatter();
    this.List = (StringList)formatter.Deserialize(reader.BaseStream);
 }

 public SqlString Terminate()
 {
  if (this.List.Count == 0)
   return SqlString.Null;

  const string Separator = ", ";

  this.List.Sort();

  return new SqlString(String.Join(Separator, this.List.ToArray()));
 }

 void IBinarySerialize.Write(BinaryWriter writer)
 {
  IFormatter formatter = new BinaryFormatter();
  formatter.Serialize(writer.BaseStream, this.List);
 }
    }

Eu testei isso usando uma consulta que se parece com:

SELECT 
 dbo.CommaDelimit(X.value) [delimited] 
FROM 
 (
  SELECT 'D' [value] 
  UNION ALL SELECT 'B' [value] 
  UNION ALL SELECT 'B' [value] -- intentional duplicate
  UNION ALL SELECT 'A' [value] 
  UNION ALL SELECT 'C' [value] 
 ) X

E produz: A, B, C, D

— GregTSmith
fonte

9

Tentei isso, mas para meus propósitos no MS SQL Server 2005, o seguinte foi mais útil, que encontrei no xaprb

declare @result varchar(8000);

set @result = '';

select @result = @result + name + ' '

from master.dbo.systypes;

select rtrim(@result);

@ Mark, como você mencionou, foi o personagem do espaço que causou problemas para mim.

— isoughtajam
fonte

Eu acho que o mecanismo não garante realmente nenhuma ordem com esse método, porque as variáveis são computadas como fluxos de dados, dependendo do plano de execução. Parece funcionar a maior parte do tempo até agora.

— 26419 phil_w

6

Sobre a resposta de J Hardiman, que tal:

SELECT empName, projIDs=
  REPLACE(
    REPLACE(
      (SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')), 
      ' ', 
      ' / '), 
    '-somebody-puts-microsoft-out-of-his-misery-please-',
    ' ') 
  FROM project_members a WHERE empName IS NOT NULL GROUP BY empName

A propósito, o uso de "Sobrenome" é um erro de digitação ou não estou entendendo um conceito aqui?

Enfim, muito obrigado pessoal porque me salvou bastante tempo :)

— user422190
fonte

11

Resposta bastante hostil, se você me perguntar e nada útil como resposta.

— quer

11

só vendo isso agora ... eu não quis dizer isso de uma maneira malvada, na época fiquei muito frustrado com o servidor sql (ainda estou). as respostas deste post foram realmente úteis; EDIT: por que não foi útil btw? ele fez o truque para mim #

— 42419

1

Para meus colegas Googlers por aí, aqui está uma solução plug-and-play muito simples que funcionou para mim depois de lutar com as soluções mais complexas por um tempo:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID ) 
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Observe que eu tive que converter o ID em um VARCHAR para concatená-lo como uma string. Se você não precisa fazer isso, aqui está uma versão ainda mais simples:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Todo o crédito para isso vai para aqui: https://social.msdn.microsoft.com/Forums/sqlserver/en-US/9508abc2-46e7-4186-b57f-7f368374e084/replicating-groupconcat-function-of-mysql-in- sql-server? forum = transactsql

— Krock
fonte