A pandas
drop_duplicates
função é ótima para "unificar" um quadro de dados. No entanto, um dos argumentos de palavra-chave a ser aprovado é take_last=True
ou take_last=False
, enquanto eu gostaria de eliminar todas as linhas duplicadas em um subconjunto de colunas. Isso é possível?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
Como exemplo, eu gostaria de soltar linhas que correspondam às colunas A
e, C
portanto, isso deve soltar as linhas 0 e 1.