Eu tenho uma string assim:
6Â 918Â 417Â 712
A maneira clara de cortar essa string (pelo que eu entendo Python) é simplesmente dizer que a string está em uma variável chamada s
, obtemos:
s.replace('Â ', '')
Isso deve funcionar. Mas é claro que ele reclama que o caractere não ASCII '\xc2'
no arquivo blabla.py não está codificado.
Nunca consegui entender como alternar entre as diferentes codificações.
Aqui está o código, ele realmente é igual ao anterior, mas agora está no contexto. O arquivo é salvo como UTF-8 no bloco de notas e possui o seguinte cabeçalho:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
O código:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
Não vai além de s.replace
...
u