Nos comentários abaixo de um post meu , Glen_b e eu estávamos discutindo como distribuições discretas necessariamente têm média e variação dependentes.
Para uma distribuição normal, faz sentido. Se eu disser a você , você não tem idéia do que é, e se eu disser a , você não tem idéia do que é . (Editado para abordar as estatísticas da amostra, não os parâmetros da população.)
Mas então, para uma distribuição uniforme e discreta, a mesma lógica não se aplica? Se eu estimar o centro dos pontos finais, não conheço a escala e, se eu estimar a escala, não conheço o centro.
O que está acontecendo de errado com o meu pensamento?
EDITAR
Eu fiz a simulação de jbowman. Então eu acertei com a transformação integral de probabilidade (eu acho) para examinar o relacionamento sem nenhuma influência das distribuições marginais (isolamento da cópula).
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- sample(seq(1,10,1),100,replace=T)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var,main="Observations")
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var),main="'Copula'")
Na pequena imagem que aparece no RStudio, o segundo gráfico parece ter cobertura uniforme sobre o quadrado da unidade, portanto, independência. Ao ampliar, existem faixas verticais distintas. Eu acho que isso tem a ver com a discrição e que eu não deveria ler sobre isso. Eu tentei para uma distribuição uniforme contínua em .
Data.mean <- Data.var <- rep(NA,20000)
for (i in 1:20000){
Data <- runif(100,0,10)
Data.mean[i] <- mean(Data)
Data.var[i] <- var(Data)
}
par(mfrow=c(2,1))
plot(Data.mean,Data.var)
plot(ecdf(Data.mean)(Data.mean),ecdf(Data.var)(Data.var))
Este realmente parece ter pontos distribuídos uniformemente pelo quadrado da unidade, então continuo cético quanto ao fato de que e são independentes.