Estou tentando destacar exatamente o que mudou entre dois quadros de dados.
Suponha que eu tenha dois quadros de dados do Python Pandas:
"StudentRoster Jan-1":
id Name score isEnrolled Comment
111 Jack 2.17 True He was late to class
112 Nick 1.11 False Graduated
113 Zoe 4.12 True
"StudentRoster Jan-2":
id Name score isEnrolled Comment
111 Jack 2.17 True He was late to class
112 Nick 1.21 False Graduated
113 Zoe 4.12 False On vacation
Meu objetivo é gerar uma tabela HTML que:
- Identifica as linhas que foram alteradas (podem ser int, float, boolean, string)
Gera linhas com os mesmos valores OLD e NEW (idealmente em uma tabela HTML) para que o consumidor possa ver claramente o que mudou entre dois quadros de dados:
"StudentRoster Difference Jan-1 - Jan-2": id Name score isEnrolled Comment 112 Nick was 1.11| now 1.21 False Graduated 113 Zoe 4.12 was True | now False was "" | now "On vacation"
Suponho que eu poderia fazer uma comparação linha por linha e coluna por coluna, mas existe uma maneira mais fácil?
df.compare
.