Estou tentando fazer uma classificação de texto usando Textblob. Primeiro, estou treinando o modelo e serializando-o usando pickle, conforme mostrado abaixo.
import pickle
from textblob.classifiers import NaiveBayesClassifier
with open('sample.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()
E quando tento executar este arquivo:
import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)
f.close()
Eu recebo este erro:
UnicodeDecodeError: o codec 'utf-8' não pode decodificar o byte 0x80 na posição 0: byte inicial inválido
A seguir está o conteúdo do meu sample.csv:
Meu SQL não está funcionando corretamente. Esta foi uma escolha errada, SQL
Eu tenho problemas. Por favor responda imediatamente, Suporte
Onde estou errando aqui? Por favor ajude.