Para experimentar, gostaríamos de usar o Emoji incorporado em muitos Tweets como dados básicos de treinamento / verdade para uma análise quantitativa simples de senações. Os tweets geralmente não são estruturados para que a PNL funcione bem.
De qualquer forma, existem 722 Emoji no Unicode 6.0 e provavelmente outros 250 serão adicionados no Unicode 7.0.
Existe um banco de dados (como, por exemplo, o SentiWordNet) que contém anotações de sentimentos para eles?
(Observe que o SentiWordNet também permite significados ambíguos . Considere, por exemplo , engraçado , que não é apenas positivo: "isso tem um gosto engraçado" provavelmente não é positivo ... o mesmo vale ;-)
por exemplo. Mas não acho que isso seja mais difícil. para Emoji do que para palavras comuns ...)
Além disso, se você tiver experiência em usá-los para análise de sentimentos, ficaria interessado em ouvir.