Quando / por que a tendência central de uma simulação de reamostragem difere acentuadamente do valor observado?


8

Deve-se sempre esperar que a tendência central (isto é, média e / ou mediana) de uma amostra com bootstrap seja semelhante ao valor observado?

Nesse caso em particular, tenho respostas distribuídas exponencialmente para sujeitos em duas condições (não realizei o experimento, só tenho os dados). Fui encarregado de ajustar o tamanho do efeito (em termos de d de Cohen, a fórmula de uma amostra, ou seja,MD¯sDonde é a estimativa amostral do desvio padrão da população. O fórum para isso é fornecido em Rosenthal e Rosnow (2008) na página 398, equação 13.27. Eles usam no denominador porque é historicamente correto; no entanto, a prática padrão definiu erroneamente d como usar e, portanto, segui esse erro no cálculo acima.σs

Eu randomizei tanto os participantes (ou seja, uma RT de participantes pode ser amostrada mais de uma vez) quanto entre os sujeitos (as amostras podem ser amostradas mais de uma vez), de modo que, mesmo que o participante 1 seja amostrado duas vezes, é improvável que o seu TR médio em ambas as amostras seja exatamente igual. Para cada conjunto de dados randomizado / reamostrado, recalculo d. Nesse caso, . O que estou observando é uma tendência para o valor observado de d de Cohen estar tipicamente mais próximo do percentil 97,5º do que do percentil 2,5º dos valores observados simulados. Também tende a estar mais próximo de 0 do que a mediana do bootstrap (de 5% a 10% da densidade da distribuição simulada).Nsim=10000

O que pode explicar isso (tendo em mente a magnitude do efeito que estou observando)? É devido ao fato de ser 'mais fácil' na reamostragem obter variações mais extremas do que aquelas observadas em relação à extremidade das médias na reamostragem? Isso pode ser um reflexo de dados que foram excessivamente massageados / aparados seletivamente? Essa abordagem de reamostragem é igual a uma inicialização? Caso contrário, o que mais deve ser feito para criar um IC?

Respostas:


4

Qualquer estatística não linear (uma combinação não linear de estatísticas lineares, como médias de amostra) tem um pequeno viés de amostra. Cohen'sd obviamente não é excepção: é essencialmente

d=m1m2m3m42
que é razoavelmente não linear, pelo menos no que diz respeito aos termos no denominador. Cada um dos momentos pode ser considerado um estimador imparcial do que deveria estimar:
m1=1n1Eugrupo 1yEu,m2=1n2Eugrupo 2yEu,m3=1n1+n2EuyEu2,m4=1n1+n2EuyEu,
No entanto, pela desigualdade de Jensen, não há como na Terra obter um estimador imparcial da quantidade populacional de uma combinação não linear. portantoE[d] população d em amostras finitas, embora o viés seja tipicamente da ordem de O(1/n). O artigo da Wikipedia sobre tamanhos de efeito menciona os pequenos vieses da amostra na discussão de Hedges 'g.

Eu imagino que o Cohen d tem um alcance limitado (no caso extremo, se não houver variabilidade dentro dos grupos, então d deve ser igual ±2, certo?), portanto, sua distribuição amostral deve ser inclinada, o que contribui para os vieses finitos da amostra (algumas funções da assimetria da distribuição amostral são tipicamente o multiplicador na frente de 1/nque eu mencionei acima). Quanto mais próximo você estiver dos limites do intervalo permitido, mais pronunciada é a assimetria.

O que o bootstrap faz, considerando miraculosamente que é um método tão simples, é que você tem a capacidade de estimar esse viés finito da amostra através da comparação da média do bootstrap e da estimativa da amostra original. (Lembre-se, porém, de que, a menos que você faça ajustes especiais na configuração da amostra de bootstrap, o primeiro estará sujeito à variabilidade de Monte Carlo.) Forneci explicações mais detalhadas e técnicas em outra pergunta sobre o bootstrap, que pode ser lida de qualquer maneira.

Agora, se houver um viés positivo, ou seja, a estimativa baseada na amostra original é enviesada para cima em relação à população d, o bootstrap zombará disso e produzirá estimativas que são, em média, ainda mais altas que a estimativa da amostra. Na verdade, não é tão ruim quanto parece, pois você pode quantificar o viés e subtraí-lo da estimativa original. Se a estimativa original de uma quantidade fosseθ^ne a autoinicialização média da replicação de autoinicialização é θ¯n, a estimativa de viés é b^n=θ¯n-θ^ne uma estimativa corrigida de viés é θ^n-b^n=2θ^n-θ¯n.


1
Eu já sabia que o d de Cohen era uma estatística tendenciosa. Agradeço os detalhes sobre as razões pelas quais isso é tendencioso. No entanto, sou um pouco cético quanto ao fato de estar inclinado ao grau que estou observando. O artigo da Wikipedia não define 'a' na equação referenciada. Além disso, a equação referenciada e a sua parecem fazer referência à versão de duas amostras do d de Cohen. Portanto, não tenho certeza da magnitude do viés que devo esperar neste caso e se sua resposta cobre a diferença que estou vendo.
russellpierce

Também não estou claro como combinar seus dois últimos parágrafos. O Bootstrap permitirá estimar o viés, mas também produzirá resultados mais tendenciosos do que a amostra original?
russellpierce

Não há uma nas minhas fórmulas - qual é o umaa que você está se referindo? Atualizei o último parágrafo para demonstrar como obter estimativas de bootstrap corrigidas por viés. Não sou especialista em tamanhos de efeitos e você não forneceu nenhum link. Por isso, usei as melhores informações disponíveis, a Wikipedia. Se 1 amostra de Cohendé semelhante e também não linear, então minha explicação se aplica qualitativamente.
StasK 15/05

A fórmula g de Hedge no artigo vinculado usa uma. Vou atualizar minha pergunta para incluir a referência d de Cohen de uma amostra. É de fato não linear. Sua resposta prevêO(1/n)viés, mas a diferença observada foi muito mais extrema do que isso, então não acho que sua resposta cubra o problema que estou vendo. Forneci mais detalhes acima - pode ser que eu não implementei corretamente o procedimento de inicialização.
russellpierce

O(1/n)é apenas a taxa. Eu vi alguns resultados bastante tolos, onde a constante diante disso1/n o termo foi derivado (não me interpretem mal, esse levantamento muito pesado derivando essas constantes, mais difícil do que estabelecer a taxa propriamente dita), então a coisa toda parecia 1-108/n para uma probabilidade que deveria convergir para 1. uma na fórmula da Wikipedia é apenas um índice fictício, como Eu em soma ou xna integração; quem escreveu o artigo apenas o colocou lá para mostrar queJ(uma)é uma abreviação para a proporção de funções gama.
StasK
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.