Eu tenho que encontrar um IC de 95% na mediana e outros percentis. Não sei como abordar isso. Eu uso principalmente R como uma ferramenta de programação.
Eu tenho que encontrar um IC de 95% na mediana e outros percentis. Não sei como abordar isso. Eu uso principalmente R como uma ferramenta de programação.
Respostas:
Aqui está uma ilustração em um conjunto de dados R clássico:
> x = faithful$waiting
> bootmed = apply(matrix(sample(x, rep=TRUE, 10^4*length(x)), nrow=10^4), 1, median)
> quantile(bootmed, c(.025, 0.975))
2.5% 97.5%
73.5 77
que fornece um intervalo de confiança (73,5, 77) na mediana.
( Nota: Versão corrigida, graças a John . Eu usei no anterior, o que levou à confusão!)nrow
Outra abordagem é baseada em quantis da distribuição binomial.
por exemplo:
> x=faithful$waiting
> sort(x)[qbinom(c(.025,.975), length(x), 0.5)]
[1] 73 77
Confira a reamostragem de autoinicialização. Procure na ajuda do R a função de inicialização. Dependendo dos seus dados com a reamostragem, você pode estimar os intervalos de confiança para praticamente qualquer coisa.
wilcox.test(..., conf.int=TRUE)
função de R.
E existem outras abordagens: uma é baseada no teste de Wilcoxon Rank Sum aplicado a uma amostra com correção de continuidade. Em R, isso pode ser fornecido como:
wilcox.test(x,conf.level=0.95,alternative="two.sided",correct=TRUE)
E há o IC de David Olive para mediana discutido aqui:
O resultado baseado na abordagem qbinom não está correto para amostras pequenas. Suponha que x tenha 10 componentes. Então qbinom (c (.025, .975), 10, .5) fornece 2 e 8. O intervalo resultante não trata as estatísticas de ordem na cauda inferior simetricamente com as da cauda superior; você deve obter 2 e 9, ou 3 e 8. A resposta certa é 2 e 9. Você pode verificar se há proc univariado no SAS. Pegue aqui é que você não precisa mais do que 0,025 de probabilidade abaixo e acima; o quantil inferior não faz isso, pois fornece pelo menos 0,025 em ou abaixo. Você é salvo na parte inferior porque a contagem que deve ser 1 deve ser mapeada para a estatística de segunda ordem, contando 0 e, portanto, o "desligado por um" é cancelado. Esse cancelamento fortuito não acontece no topo e, portanto, você obtém a resposta errada aqui. A classificação do código (x) [qbinom (c (.025, .975), comprimento (x) ,. 5) + c (0,1)] quase funciona, e 0,5 pode ser substituído por outros valores quantis para obter intervalos de confiança para outros quantis, mas não será correto quando existir um tal que P [X <= a ] = 025. Veja, por exemplo, Higgins, Statistical Nonparametric.
library(boot)
aparece para confirmar:> boot.ci (boot (x, function (x, i) mediana (x [i]), R = 1000)) Intervalos: Nível Normal Básico Básico 95% (74.42, 78.22) (75.00 , 78,49) Percentil de nível BCa 95% (73,51, 77,00) (73,00, 77,00)