Um projeto para a aula envolve a análise de dados JSON do Twitter. Estou obtendo os dados e configurando-os no arquivo sem muitos problemas, mas está tudo em uma linha. Isso é bom para a manipulação de dados que estou tentando fazer, mas o arquivo é ridiculamente difícil de ler e não posso examiná-lo muito bem, tornando a escrita de código para a parte de manipulação de dados muito difícil.
Alguém sabe fazer isso de dentro do Python (ou seja, não usando a ferramenta de linha de comando, que não consigo fazer funcionar)? Este é meu código até agora:
header, output = client.request(twitterRequest, method="GET", body=None,
headers=None, force_auth_header=True)
# now write output to a file
twitterDataFile = open("twitterData.json", "wb")
# magic happens here to make it pretty-printed
twitterDataFile.write(output)
twitterDataFile.close()
Nota Agradeço as pessoas que me apontam para a documentação do simplejson e tal, mas como afirmei, já olhei para isso e continuo precisando de ajuda. Uma resposta verdadeiramente útil será mais detalhada e explicativa do que os exemplos encontrados lá. obrigado
Além disso: tente isso na linha de comando do Windows:
more twitterData.json | python -mjson.tool > twitterData-pretty.json
resulta neste:
Invalid control character at: line 1 column 65535 (char 65535)
Eu daria a você os dados que estou usando, mas são muito grandes e você já viu o código que usei para fazer o arquivo.
\r\n
vs \n
) é importante. Consulte stackoverflow.com/questions/3257869/… . No seu caso, você quer terminações de linha compatíveis com o Windows, mas pode não conseguir isso no terminal do Twitter, então você deve abrir em modo de texto.