Então, eu tenho um conjunto de dados que gostaria de remover palavras de parada de usar
stopwords.words('english')
Estou lutando para usar isso no meu código para simplesmente tirar essas palavras. Já tenho uma lista das palavras deste conjunto de dados, a parte com a qual estou lutando é comparando a esta lista e removendo as palavras irrelevantes. Qualquer ajuda é apreciada.
from nltk.corpus import stopwords
para futuros googlers
nltk.download("stopwords")
para disponibilizar o dicionário de palavras irrelevantes.