TypeError: é necessário um objeto semelhante a bytes, não 'str' em python e CSV

173

TypeError: é necessário um objeto semelhante a bytes, não 'str'

ficando acima do erro ao executar o código python abaixo para salvar os dados da tabela HTML no arquivo CSV. não sei como obter rideup.pls me ajudar.

import csv
import requests
from bs4 import BeautifulSoup

url='http://www.mapsofindia.com/districts-india/'
response=requests.get(url)
html=response.content

soup=BeautifulSoup(html,'html.parser')
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
    list_of_cells=[]
    for cell in row.findAll('td'):
        list_of_cells.append(cell.text)
    list_of_rows.append(list_of_cells)
outfile=open('./immates.csv','wb')
writer=csv.writer(outfile)
writer.writerow(["SNo", "States", "Dist", "Population"])
writer.writerows(list_of_rows)

acima da última linha.

— ShivaGuntuku
fonte

Possível duplicata do python 3.5: TypeError: um objeto semelhante a bytes é necessário, não 'str'

— tripleee

olá - tentei executar isso no meu ATOM no MX-Linux - mas recebo de volta: ´Traceback (última chamada mais recente): Arquivo "/home/martin/.atom/python/examples/bs_gumtree_pl.py", linha 20, em <module> writer.writerows (list_of_rows) UnicodeEncodeError: o codec 'ascii' não pode codificar o caractere u '\ xa0' na posição 0: ordinal fora do intervalo (128) [Finalizado em 2.015s] ´ continua aqui!? gosto de ouvir de você

— zero

331

Você está usando a metodologia Python 2 em vez do Python 3.

Mudança:

outfile=open('./immates.csv','wb')

Para:

outfile=open('./immates.csv','w')

e você obterá um arquivo com a seguinte saída:

SNo,States,Dist,Population
1,Andhra Pradesh,13,49378776
2,Arunachal Pradesh,16,1382611
3,Assam,27,31169272
4,Bihar,38,103804637
5,Chhattisgarh,19,25540196
6,Goa,2,1457723
7,Gujarat,26,60383628
.....

No Python 3, o csv aceita a entrada no modo de texto, enquanto no Python 2 a aceita no modo binário.

Editado para adicionar

Aqui está o código que eu corri:

url='http://www.mapsofindia.com/districts-india/'
html = urllib.request.urlopen(url).read()
soup = BeautifulSoup(html)
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
    list_of_cells=[]
    for cell in row.findAll('td'):
        list_of_cells.append(cell.text)
    list_of_rows.append(list_of_cells)
outfile = open('./immates.csv','w')
writer=csv.writer(outfile)
writer.writerow(['SNo', 'States', 'Dist', 'Population'])
writer.writerows(list_of_rows)

— dstudeba
fonte

20

Para uso com o csvmódulo, o Python 3 opentambém deve ter newline=''como parâmetro [ref ]

— Mark Tolonen

1

Mude a string 'wb' para 'w' funciona para mim. Muito obrigado

— Loc Huynh

Se você estiver usando um buffer, veja a resposta de vinyll !

— Handra # 1/19

oi - tentei o código - e recebi de volta: `Traceback (última chamada mais recente): Arquivo" /home/martin/.atom/python/examples/bs_gumtree_pl.py ", linha 20, em <module> UnicodeEncodeError : o codec 'ascii' não pode codificar o caractere u '\ xa0' na posição 0: ordinal fora do intervalo (128) [Terminado em 1.415s] `não tenho cola do que está acontecendo aqui

— zero

21

Eu tive o mesmo problema com o Python3. Meu código estava escrevendo io.BytesIO().

Substituindo por io.StringIO()resolvido.

— vinyll
fonte

acontece-me com StringIO também

— thebeancounter

Uma consideração: io.StringIO()é a ganância da memória e pode ser uma dor de cabeça com arquivos grandes.

— Flavio

1

file = open('parsed_data.txt', 'w')
for link in soup.findAll('a', attrs={'href': re.compile("^http")}): print (link)
soup_link = str(link)
print (soup_link)
file.write(soup_link)
file.flush()
file.close()

No meu caso, usei o BeautifulSoup para escrever um .txt com o Python 3.x. Teve o mesmo problema. Assim como @tsduteba disse, altere o 'wb' na primeira linha para 'w'.

— Yang Li
fonte

Ao dar uma resposta, é preferível dar uma explicação sobre POR QUE sua resposta é essa. Nesse caso, como essa resposta difere da resposta aceita?

— Stephen Rauch

@StephenRauch Obrigado por seus comentários. Sou novo aqui e apenas comecei a aprender Python há várias semanas. Vou tentar dar uma resposta melhor no futuro.

— Yang Li

Você pode editar esta postagem e adicionar mais detalhes. Clique no botão de edição abaixo e à esquerda da postagem.

— Stephen Rauch

@StephenRauch Obrigado por suas dicas!

— Yang Li

1

basta mudar wb para w

outfile=open('./immates.csv','wb')

para

outfile=open('./immates.csv','w')

— Sarath Ak
fonte

1

Você está abrindo o arquivo csv no modo binário, ele deve ser 'w'

import csv

# open csv file in write mode with utf-8 encoding
with open('output.csv','w',encoding='utf-8',newline='')as w:
    fieldnames = ["SNo", "States", "Dist", "Population"]
    writer = csv.DictWriter(w, fieldnames=fieldnames)
    # write list of dicts
    writer.writerows(list_of_dicts) #writerow(dict) if write one row at time

— Sohan Das
fonte