Estou usando o pandas como um substituto do db, pois tenho vários bancos de dados (oracle, mssql, etc.) e não consigo fazer uma sequência de comandos para um equivalente SQL.
Eu tenho uma tabela carregada em um DataFrame com algumas colunas:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
No SQL, contar a quantidade de clientes diferentes por ano seria:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
E o resultado seria
201301 5000
201302 13245
Como posso fazer isso em pandas?
value_counts
pode ser a resposta que você está procurando: pandas.pydata.org/pandas-docs/stable/generated/…