Explicar o gráfico de densidade do Kernel


8

Estou executando a simulação em um modelo linear. Recebo 1000 resultados e os resultados são colocados em um gráfico de densidade. Entendo que o xaxis é a variável dependente e o yaxis representa a densidade do kernel. Yaxis está em números decimais, como de 0 a 0,15. Como explico isso para os outros usuários? Existe uma chance de 15% de que os valores simulados caiam entre x1 e x2?

Esta é a minha saída de simulação:

summary(s)

Model:  ls 
Number of simulations:  1000 

Values of X
  (Intercept)  Volume
1           1 1699992
attr(,"assign")
[1] 0 1

Expected Values: E(Y|X) 
    mean    sd    50% 2.5%  97.5%
1 12.305 2.638 12.231 7.03 17.512

insira a descrição da imagem aqui


Como você explicaria a altura de alguma outra densidade? (Se essa é a parte que você não sabe, parece estar fazendo a pergunta errada - você precisa da mais geral; se você sabe explicar o que é uma densidade, a explicação é a mesma)
Glen_b -Reinstate Monica

Respostas:


14

Você pode pensar na estimativa de densidade do kernel como um histograma suavizado. Os histogramas são limitados pelo fato de serem inerentemente discretos (por meio de compartimentos) e, portanto, mais apropriados para a exibição de dados em variáveis ​​discretas e podem ser muito sensíveis ao tamanho do compartimento.

O que você está realmente fazendo com a Estimativa de densidade do kernel é estimar a função de densidade de probabilidade. Isso torna a interpretação direta. Portanto, a área sob a curva é 1 e a probabilidade de um valor estar entre x1 e x2 é a área sob a curva entre esses dois pontos.

O número de valores Y determinará a "resolução" da curva, portanto, se você assumir uma linha reta entre cada dois pontos Y adjacentes, poderá calcular uma aproximação da área sob a curva entre esses dois pontos.

Para determinar a probabilidade de um valor :P ( x a < x < x b )xP(xa<x<xb)

P(xa<x<xb)=ya+..+yb

O resultado será mais preciso os mais valores que você tem.y


ok, olhando o gráfico acima, o que significa 0.10? Eu sei o que é o eixo x. Como posso dizer que essa é uma boa estimativa?
User1471980

olhando para o gráfico acima, y-axix c (0,00, 0,10) e precisa calcular a probabilidade do início do eixo x entre 5 e 20, (20-5) * (0,10 + 0,00) /2=0,75. Há 75% de chance de os valores da simulação estarem entre 5 e 20. Isso está certo?
usar o seguinte comando

Eu acho que estou entendendo isso. Mas eu só tenho que ter certeza. y-axix c (0, 0,05, 0,10, 0,15), xaxis c (5,10,15,20), para calcular o cumulativo: (20-5) * (0,0 + 0,05 + 0,1 + 0,15) / 4=1,125 (este valor for maior que 1, é esse direito?)
user1471980

@ user1471980 Atualizei minha resposta, estou removendo meus comentários para evitar confusão.
Bitwise

1

Uma vez que não há reputação de comentar sobre o post acima ...

A expressão , não parece correta. Tomemos, por exemplo, a função de densidade uniforme no intervalo [0, 1,0] e, de acordo com o exposto acima, e usando apenas a probabilidade de qualquer intervalo seria 2. O que eu acho que o pôster estava tentando se referir era a regra do trapézio .y a , y bP(xa<x<xb)=ya+...+ybya,yb

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.