Estou usando o BeautifulSoup e analisando alguns HTMLs.
Estou obtendo alguns dados de cada HTML (usando o loop for) e adicionando esses dados a uma determinada lista.
O problema é que alguns dos HTMLs têm formato diferente (e eles não têm os dados que desejo neles) .
Portanto, estava tentando usar o tratamento de exceções e agregar valor null
à lista (devo fazer isso, pois a sequência de dados é importante).
Por exemplo, tenho um código como:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
e alguns dos links não têm nenhum <dd class='title'>
, então o que eu quero fazer é adicionar string null
à lista.
O erro aparece:
list index out of range.
O que fiz tentei adicionar algumas linhas como esta:
if not dlist[1]:
newlist.append('null')
continue
Mas não dá certo. Ainda mostra erro:
list index out of range.
O que devo fazer sobre isso? Devo usar o tratamento de exceções? ou existe alguma maneira mais fácil?
Alguma sugestão? Qualquer ajuda seria muito boa!
None
seja claramente mais limpo, o OP quer'null'
nesse caso.