Eu tenho um script Python que importa um grande arquivo CSV e conta o número de ocorrências de cada palavra no arquivo, depois exporta as contagens para outro arquivo CSV.
Mas o que está acontecendo é que uma vez finalizada a contagem e iniciada a exportação diz-se Killed
no terminal.
Não acho que seja um problema de memória (se fosse, suponho que receberia um erro de memória e não Killed
).
Será que o processo está demorando muito? Em caso afirmativo, há uma maneira de estender o período de tempo limite para que eu possa evitar isso?
Aqui está o código:
csv.field_size_limit(sys.maxsize)
counter={}
with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
reader=csv.reader(file_name)
for row in reader:
if len(row)>1:
pair=row[0]+' '+row[1]
if pair in counter:
counter[pair]+=1
else:
counter[pair]=1
print 'finished counting'
writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
for key, value in counter.items():
writer.writerow([key, value])
E o Killed
acontece depois de finished counting
impresso, e a mensagem completa é:
killed (program exited with code: 137)