Suponha que eu tenha um dicionário aninhado 'user_dict' com a estrutura:
- Nível 1: UserId (número inteiro longo)
- Nível 2: Categoria (String)
- Nível 3: Atributos variados (flutuadores, ints, etc.)
Por exemplo, uma entrada deste dicionário seria:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
cada item em user_dict
tem a mesma estrutura e user_dict
contém um grande número de itens que desejo alimentar a um DataFrame pandas, construindo a série a partir dos atributos. Nesse caso, um índice hierárquico seria útil para o propósito.
Especificamente, minha pergunta é se existe uma maneira de ajudar o construtor DataFrame a entender que a série deve ser construída a partir dos valores do "nível 3" no dicionário.
Se eu tentar algo como:
df = pandas.DataFrame(users_summary)
Os itens no "nível 1" (os UserId's) são considerados colunas, o que é o oposto do que desejo alcançar (ter UserId's como índice).
Sei que poderia construir a série após iterar as entradas do dicionário, mas se houver uma maneira mais direta, isso seria muito útil. Uma pergunta semelhante seria se é possível construir um DataFrame do pandas a partir de objetos json listados em um arquivo.