Veja como resolver seu problema.
select
regexp_replace(
'2,2,2.1,3,3,3,3,4,4'
,'([^,]+)(,\1)*(,|$)', '\1\3')
from dual
retorna
2,2.1,3,4
Do oracle 19C é construído veja aqui
A partir de 18C e anteriores, tente dentro do grupo, consulte aqui
Caso contrário, use expressões regulares
RESPOSTA abaixo:
select col1,
regexp_replace(
listagg(
col2 , ',') within group (order by col2) -- sorted
,'([^,]+)(,\1)*(,|$)', '\1\3') )
from tableX
where rn = 1
group by col1;
Nota: O procedimento acima funcionará na maioria dos casos - a lista deve ser classificada, você pode ter que cortar todos os espaços à direita e à esquerda, dependendo de seus dados.
Se você tiver muitos itens em um grupo> 20 ou tamanhos de string grandes, você poderá encontrar o limite de tamanho de string do oráculo 'o resultado da concatenação de string é muito longo'.
No oracle 12cR2 você pode suprimir este erro, veja aqui . Como alternativa, coloque um número máximo de membros em cada grupo. Isso só funcionará se não houver problema em listar apenas os primeiros membros. Se você tiver strings de variáveis muito longas, isso pode não funcionar. você terá que experimentar.
select col1,
case
when count(col2) < 100 then
regexp_replace(
listagg(col2, ',') within group (order by col2)
,'([^,]+)(,\1)*(,|$)', '\1\3')
else
'Too many entries to list...'
end
from sometable
where rn = 1
group by col1;
Outra solução (não tão simples) para evitar o limite de tamanho da string do oráculo - o tamanho da string é limitado a 4000. Graças a esta postagem aqui pelo usuário 3465996
select col1 ,
dbms_xmlgen.convert( -- HTML decode
dbms_lob.substr( -- limit size to 4000 chars
ltrim( -- remove leading commas
REGEXP_REPLACE(REPLACE(
REPLACE(
XMLAGG(
XMLELEMENT("A",col2 )
ORDER BY col2).getClobVal(),
'<A>',','),
'</A>',''),'([^,]+)(,\1)*(,|$)', '\1\3'),
','), -- remove leading XML commas ltrim
4000,1) -- limit to 4000 string size
, 1) -- HTML.decode
as col2
from sometable
where rn = 1
group by col1;
V1 - alguns casos de teste - FYI
regexp_replace('2,2,2.1,3,3,4,4','([^,]+)(,\1)+', '\1')
-> 2.1,3,4 Fail
regexp_replace('2 ,2 ,2.1,3 ,3 ,4 ,4 ','([^,]+)(,\1)+', '\1')
-> 2 ,2.1,3,4 Success - fixed length items
V2 - itens contidos em itens, por exemplo. 2,21
regexp_replace('2.1,1','([^,]+)(,\1)+', '\1')
-> 2.1 Fail
regexp_replace('2 ,2 ,2.1,1 ,3 ,4 ,4 ','(^|,)(.+)(,\2)+', '\1\2')
-> 2 ,2.1,1 ,3 ,4 -- success - NEW regex
regexp_replace('a,b,b,b,b,c','(^|,)(.+)(,\2)+', '\1\2')
-> a,b,b,c fail!
v3 - regex graças a Igor! funciona todos os casos.
select
regexp_replace('2,2,2.1,3,3,4,4','([^,]+)(,\1)*(,|$)', '\1\3') ,
---> 2,2.1,3,4 works
regexp_replace('2.1,1','([^,]+)(,\1)*(,|$)', '\1\3'),
--> 2.1,1 works
regexp_replace('a,b,b,b,b,c','([^,]+)(,\1)*(,|$)', '\1\3')
---> a,b,c works
from dual