A identificação do sarcasmo é considerada um dos problemas abertos mais difíceis no domínio da ML e da PNL.
Então, houve alguma pesquisa considerável feita nessa frente? Se sim, qual é a precisão? Por favor, explique brevemente o modelo da PNL.
A identificação do sarcasmo é considerada um dos problemas abertos mais difíceis no domínio da ML e da PNL.
Então, houve alguma pesquisa considerável feita nessa frente? Se sim, qual é a precisão? Por favor, explique brevemente o modelo da PNL.
Respostas:
O seguinte artigo de pesquisa de pesquisadores do IIT Bombay resume os recentes avanços na detecção de sarcasmo: Arxiv link .
Em referência à sua pergunta, não creio que seja considerada extraordinariamente difícil ou aberta. Embora introduza ambiguidade que os computadores ainda não conseguem lidar, os seres humanos são capazes de entender facilmente o sarcasmo e, portanto, podem rotular conjuntos de dados para detecção de sarcasmo.
Houve um trabalho recente no mesmo domínio em que as redes neurais (CNNs para ser preciso) são usadas para o mesmo objetivo. Alguma informação. sobre a pesquisa é:
Para aprender esse contexto, o artigo descreve um método pelo qual a rede neural encontra os “embeddings” do usuário - ou seja, dicas contextuais como o conteúdo de tweets anteriores, interesses e contas relacionados e assim por diante. Ele usa esses vários fatores para plotar o usuário com outras pessoas e (idealmente) descobre que elas formam grupos relativamente bem definidos.
Assim, o artigo usa CNNs, palavras e incorporação de usuários para detectar sarcasmo no texto. Há também um artigo do Techcrunch sobre isso.
O artigo usa o sentimento do tweet e se compara ao de outros tweets semelhantes:
Se o sentimento do tweet parecer discordar da maior parte do que é expresso por usuários semelhantes, há uma boa chance de o sarcasmo estar sendo empregado.