Eu tenho um quadro de dados com valores de repetição na coluna A. Quero eliminar duplicatas, mantendo a linha com o valor mais alto na coluna B.
Então, é isso:
A B
1 10
1 20
2 30
2 40
3 10
Deve se transformar nisso:
A B
1 20
2 40
3 10
Wes adicionou uma funcionalidade interessante para eliminar duplicatas: http://wesmckinney.com/blog/?p=340 . Mas o AFAICT foi desenvolvido para duplicatas exatas, portanto não há menção de critérios para selecionar quais linhas serão mantidas.
Suponho que provavelmente haja uma maneira fácil de fazer isso - talvez tão fácil quanto classificar o quadro de dados antes de eliminar duplicatas -, mas não conheço a lógica interna do groupby o suficiente para descobrir isso. Alguma sugestão?