Bem, se você conhecesse as variações no par e no par (o que geralmente seria bem menor), os pesos ideais para as duas estimativas de diferença nos grupos significariam ter pesos inversamente proporcionais à variação do indivíduo estimativas da diferença de médias.
[Editar: acontece que, quando as variações são estimadas, isso é chamado de estimador de Graybill-Deal. Existem alguns artigos sobre isso. Aqui está um]
A necessidade de estimar a variação causa alguma dificuldade (a proporção resultante da estimativa de variação é F, e acho que os pesos resultantes têm uma distribuição beta, e uma estatística resultante é meio complicada), mas como você está considerando o bootstrap, isso pode ser menos de uma preocupação.
Uma possibilidade alternativa que pode ser melhor em algum sentido (ou pelo menos um pouco mais robusta à não normalidade, já que estamos brincando com taxas de variação) com muito pouca perda de eficiência no normal é basear uma estimativa combinada de desvio testes de classificação pareados e não emparelhados - em cada caso, uma espécie de estimativa de Hodges-Lehmann, no caso não emparelhado com base em medianas de diferenças de amostras cruzadas em pares e no caso pareado em medianas de médias de diferenças de pares em pares. Novamente, a combinação linear ponderada pela variância mínima dos dois seria com pesos proporcionais aos inversos das variâncias. Nesse caso, eu provavelmente me inclinaria para uma permutação (/ randomização) em vez de um bootstrap - mas dependendo de como você implementa seu bootstrap, eles podem acabar no mesmo lugar.
Em qualquer um dos casos, convém robustecer suas variações / diminuir sua taxa de variação. Entrar no estádio certo para o peso é bom, mas você perderá muito pouca eficiência no normal, tornando-o levemente robusto. ---
Alguns pensamentos adicionais que eu não tinha esclarecido o suficiente na minha cabeça antes:
Esse problema tem semelhanças distintas com o problema de Behrens-Fisher, mas é ainda mais difícil.
Se fixássemos os pesos, poderíamos simplesmente bater em uma aproximação do tipo Welch-Satterthwaite; a estrutura do problema é a mesma.
Nosso problema é que queremos otimizar os pesos, o que efetivamente significa que a ponderação não é fixa - e, de fato, tende a maximizar a estatística (pelo menos aproximadamente e mais quase em grandes amostras, pois qualquer conjunto de pesos é uma quantidade aleatória que estima o mesmo numerador e estamos tentando minimizar o denominador; os dois não são independentes).
Suponho que isso pioraria a aproximação do qui-quadrado e quase certamente afetaria ainda mais o df de uma aproximação.
[Se esse problema for possível, também pode haver uma boa regra geral que diga 'você pode fazer o mesmo se usar apenas os dados emparelhados nesses conjuntos de circunstâncias, apenas os não emparelhados nesses outros conjuntos de condições e no resto, esse esquema de peso fixo geralmente é muito próximo do ideal '- mas não vou segurar a respiração esperando essa chance. Essa regra de decisão sem dúvida teria algum impacto sobre o verdadeiro significado em cada caso, mas se esse efeito não fosse tão grande, essa regra geral proporcionaria uma maneira fácil para as pessoas usarem o software legado existente, por isso seria desejável tente identificar uma regra como essa para usuários em tal situação.]
---
Edit: Note to self - Precisa voltar e preencher os detalhes do trabalho em testes de 'sobreposição de amostras', especialmente sobreposição de amostras testes t
---
Ocorre-me que um teste de randomização deve funcionar bem -
onde os dados estão emparelhados, você permite aleatoriamente os rótulos dos grupos em pares
onde os dados não estão emparelhados, mas supõe-se que tenham distribuição comum (sob o nulo), você permite as atribuições de grupo
agora você pode basear os pesos nas estimativas de dois turnos com base nas estimativas de variação relativa ( ), calcular a estimativa ponderada de deslocamento de cada amostra aleatória e ver onde a amostra se encaixa distribuição aleatória.w1=1/(1+v1v2)
(Adicionado muito mais tarde)
Artigo possivelmente relevante:
Derrick, B., Russ B., Toher, D. e White, P. (2017),
"Estatísticas de teste para comparação de médias para duas amostras que incluem observações emparelhadas e independentes"
Journal of Modern Applied Statistical Methods , maio , Vol. 16, No. 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm