Como mesclar 2 List <T> e removendo valores duplicados em C #


159

Eu tenho duas listas Lista que preciso combinar na terceira lista e remover valores duplicados dessas listas

Um pouco difícil de explicar, então deixe-me mostrar um exemplo de como o código se parece e o que eu quero como resultado. No exemplo, eu uso o tipo int, não a classe ResultAnalysisFileSql.

first_list = [1, 12, 12, 5]

second_list = [12, 5, 7, 9, 1]

O resultado da combinação das duas listas deve resultar nessa lista: result_list = [1, 12, 5, 7, 9]

Você notará que o resultado possui a primeira lista, incluindo seus dois valores "12", e em second_list os 12, 1 e 5 adicionais.

Classe ResultAnalysisFileSql

[Serializable]
    public partial class ResultAnalysisFileSql
    {
        public string FileSql { get; set; }

        public string PathFileSql { get; set; }

        public List<ErrorAnalysisSql> Errors { get; set; }

        public List<WarningAnalysisSql> Warnings{ get; set; }

        public ResultAnalysisFileSql()
        {

        }

        public ResultAnalysisFileSql(string fileSql)
        {
            if (string.IsNullOrEmpty(fileSql)
                || fileSql.Trim().Length == 0)
            {
                throw new ArgumentNullException("fileSql", "fileSql is null");
            }

            if (!fileSql.EndsWith(Utility.ExtensionFicherosErrorYWarning))
            {
                throw new ArgumentOutOfRangeException("fileSql", "Ruta de fichero Sql no tiene extensión " + Utility.ExtensionFicherosErrorYWarning);
            }

            PathFileSql = fileSql;
            FileSql = ObtenerNombreFicheroSql(fileSql);
            Errors = new List<ErrorAnalysisSql>();
            Warnings= new List<WarningAnalysisSql>();
        }

        private string ObtenerNombreFicheroSql(string fileSql)
        {
            var f = Path.GetFileName(fileSql);
            return f.Substring(0, f.IndexOf(Utility.ExtensionFicherosErrorYWarning));
        }


        public override bool Equals(object obj)
        {
            if (obj == null)
                return false;
            if (!(obj is ResultAnalysisFileSql))
                return false;

            var t = obj as ResultAnalysisFileSql;
            return t.FileSql== this.FileSql
                && t.PathFileSql == this.PathFileSql
                && t.Errors.Count == this.Errors.Count
                && t.Warnings.Count == this.Warnings.Count;
        }


    }

Algum código de amostra para combinar e remover duplicatas?

Respostas:


288

Você já viu o Enumerable.Union

Este método exclui duplicatas do conjunto de retorno . Esse é um comportamento diferente do método Concat, que retorna todos os elementos nas seqüências de entrada, incluindo duplicatas.

List<int> list1 = new List<int> { 1, 12, 12, 5};
List<int> list2 = new List<int> { 12, 5, 7, 9, 1 };
List<int> ulist = list1.Union(list2).ToList();

// ulist output : 1, 12, 5, 7, 9

6
@Dr TJ: Sua classe de pessoa implementa IEqualityComparer <T>? Nesse caso, você precisará verificar seus métodos GetHashCode e Equals. Consulte a seção Comentários em msdn.microsoft.com/en-us/library/bb341731.aspx .
Tomas Narros

1
É importante observar porque encontrei problemas usando isso em duas coleções diferentes: "Você não pode unir dois tipos diferentes, a menos que um seja herdado do outro" em stackoverflow.com/a/6884940/410937, que gerou um cannot be inferred from the usageerro.
Atletway

30

porque não simplesmente por exemplo

var newList = list1.Union(list2)/*.Distinct()*//*.ToList()*/;

ah ... de acordo com o msdn você pode deixar de fora o.Distinct()

Este método exclui duplicatas do conjunto de retorno


25

A união não tem bom desempenho: este artigo descreve como compará-los com

var dict = list2.ToDictionary(p => p.Number);
foreach (var person in list1)
{
        dict[person.Number] = person;
}
var merged = dict.Values.ToList();

Mesclagem de listas e LINQ: 4820ms Mesclagem de
dicionário: 16ms
HashSet e IEqualityComparer: 20ms
LINQ Union e IEqualityComparer: 24ms


1
Também outro benefício de usar uma mesclagem de dicionário -> eu tenho duas listas voltando dos dados do banco de dados. E meus dados têm um campo de carimbo de data e hora, que é diferente nas duas listas de dados. Com a união, recebo duplicatas devido ao carimbo de data / hora ser diferente. Mas com a mesclagem, posso decidir qual campo exclusivo quero considerar no dicionário. +1
JimSan

Pode variar de acordo com a velocidade do processador, depende do tipo de CPU que você possui.
Asad Ali

7
E no final do artigo, diz: "Prefiro o LINQ Union porque comunica a intenção com muita clareza". ;) (Também, havia apenas uma diferença de 8 ms)
James Wilkins

1
Para listas pequenas em que a diferença é insignificante, Unionresulta em um código mais limpo e mais legível. Gastar tempo para otimizar o código quando não é lento pode resultar em uma penalidade de manutenção no caminho.
precisa saber é

14

Use a união da Linq:

using System.Linq;
var l1 = new List<int>() { 1,2,3,4,5 };
var l2 = new List<int>() { 3,5,6,7,8 };
var l3 = l1.Union(l2).ToList();

11
    List<int> first_list = new List<int>() {
        1,
        12,
        12,
        5
    };

    List<int> second_list = new List<int>() {
        12,
        5,
        7,
        9,
        1
    };

    var result = first_list.Union(second_list);
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.