O que é a Distância Hellinger e quando usá-la?


19

Estou interessado em saber o que realmente acontece no Hellinger Distance (em termos simples). Além disso, também estou interessado em saber quais são os tipos de problemas que podemos usar o Hellinger Distance? Quais são os benefícios do uso do Hellinger Distance?


9
A distância de Hellinger é um análogo probabilístico da distância euclidiana. Uma propriedade saliente é sua simetria, como uma métrica. Essas propriedades matemáticas são úteis se você estiver escrevendo um artigo e precisar de uma função de distância que possua certas propriedades para tornar sua prova possível. No aplicativo, alguém pode descobrir que uma métrica produz resultados melhores ou melhores do que outra para uma determinada tarefa; por exemplo, a distância Wasserstein é toda a raiva em redes adversárias geradoras
Emre

Obrigado pelo comentário. Me deparei com esta pergunta, que é bastante semelhante à pergunta que tenho agora. datascience.stackexchange.com/questions/22324/… Por favor, deixe-me saber, por que a resposta diz que Hellinger Distance é adequado?
Smith Volka

2
Provavelmente, para visualizar os tópicos em um espaço métrico. Outra propriedade interessante é que a distância Hellinger é finita para distribuições com suporte diferente. É bom que você esteja fazendo essas perguntas. Sugiro tentar métricas diferentes e observar os resultados.
Emre

Obrigado. é um bom link. ajuda muito. Mas a distância de Hellinger está limitada apenas a tópicos derivados da Alocação de Dirichlet Latente (LDA), conforme mencionado no link?
Smith Volka

1
Não, não possui conexão inerente ao LDA.
Emre

Respostas:


7

A distância de Hellinger é uma métrica para medir a diferença entre duas distribuições de probabilidade. É o análogo probabilístico da distância euclidiana .

PQ

h(P,Q)=12__P-Q__2

É útil ao quantificar a diferença entre duas distribuições de probabilidade. Por exemplo, se você estimar uma distribuição para usuários e não usuários de um serviço. Se a distância de Hellinger for pequena entre esses grupos para alguns recursos, esses recursos não serão estatisticamente úteis para segmentação.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.