O significado de representar o simplex como uma superfície triangular na distribuição de Dirichlet?

Estou lendo um livro que apresenta a distribuição Dirchilet e, em seguida, apresentei números sobre ela. Mas eu realmente não era capaz de entender esses números. Anexei a figura aqui na parte inferior. O que não entendo são os significados dos triângulos.

Normalmente, quando se deseja plotar uma função de 2 variáveis, você pega o valor de var1 e va2 e depois plota o valor do valor da função dessas duas variáveis ... o que fornece uma visualização em uma dimensão 3D. Mas aqui existem 3 dimensões e um outro valor para o valor da função, para que ele faça uma visualização no espaço 4D. Eu não consigo entender esses números!

Espero que alguém possa esclarecê-los, por favor!

EDITAR: aqui está o que eu não entendo da figura 2.14a. Por isso, extraímos de K = 3 um exemplo de theta (que é basicamente um vetor) que é: theta = [theta1, theta2, theta3]. O triângulo é plotado [theta1, theta2, theta3]. A distância da origem a cada theta_i é o valor de theta_i. Então, para cada theta_i, colocou um vértice e conectou todas as três vertentes e fez um triângulo. Eu sei que se eu conectar [theta1, theta2, theta3] em dir (theta | a), obterá um número que é a probabilidade conjunta do vetor teta. Também entendo que a probabilidade de variáveis aleatórias contínuas é uma medida de uma área. Mas aqui temos três dimensões, de modo que a probabilidade conjunta será a medida do volume do espaço a partir do plano rosa e sob ... isto é, a pirâmide. Agora eu não entendo qual é o papel do triângulo aqui.

insira a descrição da imagem aqui

distributions data-visualization dirichlet-distribution

— Jack Twain
fonte

Eu sugiro que você comece da distribuição beta e trabalhe a partir daí. O Dirichlet para 3 é "apenas" uma extensão lógica do beta, que é o Dirichlet para 2.

— Andris Birkmanis

Verifique este encadeamento para obter um exemplo: stats.stackexchange.com/questions/244917/…

— Tim

Pode ser útil pensar que uma distribuição Beta é mostrada em 2D (eixo x que representa o resultado binário {0,1} e eixo y que representa a probabilidade), para que um resultado ternário precise da dimensão extra, certo?

— George

Respostas:

Eu não entendo qual é o papel do triângulo aqui. O que ele está tentando se comunicar ou visualizar?

Todos os pontos no triângulo devem satisfazer as duas restrições: entre zero e um em cada dimensão ( ) e todos somam um ( ). $0 \leq \theta \leq 1$ $\theta_0 + \theta_1 + \theta_2 = 1$

A maneira como finalmente entendi é a seguinte:

figura

Então (a) mostra um espaço 3D com como coordenadas. Eles variam apenas entre 0 e 1. $\theta_{1, 2, 3}$

Em (b), um triângulo é mostrado, este é o nosso simplex.

(d) mostra outro exemplo de ponto no simplex, as mesmas restrições são válidas

Em (e), tentei mostrar uma projeção do simplex em um triângulo 2D com todos os exemplos de pontos mostrados antes.

Espero que faça mais sentido agora :)

— John Doe
fonte

Foto legal. É seu? Se não, você poderia fornecer uma referência e sua fonte?

— Tim

Obrigado. É meu (desenhado com Inkscape), posso fornecer o SVG, se necessário ...

— John Doe

O gráfico 2.14 (a) mostra um plano feito por três vértices em cada eixo. A distância de um vértice da origem é , correspondente a uma das classes . A região delimitada pelo plano rosa e pelos planos dos eixos é probabilidade de (vetor) $\theta_i$ $k=3$ $\theta$ . Agora, suponha que você incline esse plano para ter uma pirâmide com o plano rosa, a face mais próxima do leitor, posicionada na página. Em seguida, suprima a terceira dimensão "saindo" da página e, em vez disso, pinte o triângulo para que a região de maior densidade, com uma distância maior da base à superfície, fique mais vermelha. É o que mostram os gráficos 2.14 (b) e 2.14 (c). Quanto mais o vermelho estiver concentrado perto de um vértice, mais provável será a classe associada a esse vértice. Da mesma forma, se a região vermelha não estiver muito próxima de nenhum vértice, não é provável que um evento tenha maior probabilidade de pertencer a qualquer uma das classes.

Essa pirâmide, no entanto, só faz sentido como uma realização única da distribuição de Dirichlet. Desenhar novamente a partir da mesma distribuição pode gerar uma pirâmide diferente com diferentes comprimentos para cada um dos vértices. A principal diferença entre (a) e (b) / (c) é que (a) exibe graficamente a probabilidade de um empate do vetor . Os gráficos (b) e (c) mostram a densidade de probabilidade para valores no simplex, ou seja, eles estão tentando apresentar a função de densidade de probabilidade para todos os valores $\theta$ $\theta$ $\theta$ $k=3$ $\theta$ no suporte. Uma maneira de pensar em (b) e (c) é como um ponto com uma cor vermelha adicional de acordo com a altura média entre o plano rosa plano e a superfície da pirâmide, calculada a média de muitos desenhos de . $\theta\sim\text{Dir}(\alpha)$

— Sycorax diz restabelecer Monica
fonte

Alguns pontos ainda não estão claros. Talvez porque do meu inglês fraco. "A região delimitada pelo plano rosa e pelos planos dos eixos é a densidade". Esse é o espaço vazio da pirâmide sob o plano rosa? Também "densidade"? O que você quer dizer? Como o que eu entendo é que dir (x1, x2, x3) é um valor, como a densidade aqui entra no gráfico?

— Jack Twain #

Sim, entre o plano rosa e os planos formados pelas linhas pretas em 2.14 (a) está o espaço da pirâmide que eu estava tentando descrever. Desculpe pela confusão!

— Sycorax diz Restabelecer Monica

Vou editar meu post para explicar melhor o que não está claro ainda

— Jack Twain

a coisa é que a região rosa é exatamente o suporte descrito no livro. desde theta_k <= 1 e soma (theta_k) = 1. Depois de imaginar isso, o user777 está totalmente certo.

— Scratch

@ user777 Eu só fiz uma edição para o cargo

— Jack Twain