Significado em linguagem simples dos testes "dependentes" e "independentes" na literatura de comparações múltiplas?

Tanto na literatura sobre a taxa de erro familiar (FWER) quanto na taxa de falsas descobertas (FDR), métodos particulares de controle da FWER ou FDR são considerados apropriados para testes dependentes ou independentes. Por exemplo, no artigo de 1979 "Um procedimento simples de teste múltiplo sequencialmente rejeitivo", Holm escreveu para contrastar seu método de Šidák de intensificação contra seu método de controle de Bonferroni:

A mesma simplicidade computacional é obtida quando as estatísticas de teste são independentes .

Em "Controlando a taxa de falsas descobertas" de Benjamini e Hochberg (1995), os autores escrevem:

Teorema 1. Para estatísticas de teste independentes e para qualquer configuração de hipóteses nulas falsas, o procedimento acima controla o FDR em . $q^{*}$

Mais tarde, em 2001, Benjamini e Yekutieli escrevem:

1.3 O problema . Ao tentar usar a abordagem FDR na prática, as estatísticas de teste dependentes são encontradas com mais frequência do que as independentes , sendo o exemplo de vários pontos de extremidade acima mencionado.

Que significados particulares de dependente e independente esses autores estão usando? Eu ficaria feliz em definições formais do que torna os testes dependentes ou independentes um do outro se eles acompanharem uma explicação clara da linguagem.

Posso pensar em alguns significados possíveis diferentes, mas não entendo bem qual, se houver algum, eles podem ser:

"Dependente" significa testes multivariados (isto é, muitas variáveis dependentes com preditores iguais ou semelhantes); independente significa testes univariados (ou seja, muitas variáveis independentes, uma variável dependente).
"Dependente" significa testes baseados em assuntos pareados / combinados (por exemplo, teste t pareado, ANOVA de medidas repetidas, etc.); "independente" significa um desenho de estudo de amostras não emparelhado / independente.
"Dependente" significa que a probabilidade de um teste ser rejeitado está correlacionada com a probabilidade de outro teste ser rejeitado e "dependência positiva" significa que essa correlação é positiva; "independente" significa probabilidades de rejeição não correlacionadas.

Referências
Benjamini, Y. e Hochberg, Y. (1995). Controlando a taxa de falsas descobertas: uma abordagem prática e poderosa para testes múltiplos . Jornal da Sociedade Estatística Real. Série B (Metodológica) , 57 (1): 289–300.

Benjamini, Y. e Yekutieli, D. (2001). O controle da taxa de descoberta falsa em vários testes sob dependência . Annals of Statistics , 29 (4): 1165-1188.

Holm, S. (1979). Um procedimento de teste múltiplo sequencialmente rejeitador . Scandinavian Journal of Statistics , 6 (65-70): 1979.

— Alexis
fonte

Uma estatística de teste é uma variável aleatória. "Independente" neste contexto tem exatamente o mesmo significado que para qualquer conjunto de variáveis aleatórias.

— whuber

Obrigado @whuber qualquer chance que você gostaria de ampliar isso em uma resposta? :)

— Alexis

$1/20$ $1/20$ $1/20$ $20$ testes diferentes.

$20$

$20$ $1/20$ $20$ $(1-0.05)^{20}\approx 0.36$ $1-0.36 = 0.64$

$20$ $20$

(A ANOVA lida com esse problema por meio de seu teste F geral. É uma espécie de comparação "para governar todos": não confiaremos na comparação de grupo para grupo, a menos que primeiro esse teste F seja significativo.)

$(p_1, p_2, \ldots, p_n)$ $n$ $n$ deles em uma única decisão. Caso contrário, o melhor que podemos fazer é confiar em limites aproximados (que é a base da correção de Bonferroni, por exemplo).

Distribuições conjuntas de variáveis aleatórias independentes são fáceis de calcular. A literatura, portanto, distingue entre essa situação e o caso da não independência.

Consequentemente, o significado correto de "independente" nas citações está no sentido estatístico usual de variáveis aleatórias independentes.

$n$ $(x_1, \ldots, x_m)$ $\mu$ $\mu=0$ $p_1$ $\mu=1$ $p_2$ $(p_1, p_2)$

— whuber
fonte

+1 Obrigado, whuber! Para o exemplo da ANOVA, seria o caso de qualquer comparação pareada após a ANOVA, em que todos os pares possíveis fossem testados, seria "dependente" ou apenas o caso em que um grupo será comparado a uma seleção de outros? (Eu acho que o primeiro, mas quero ter certeza).

— Alexis

Na ANOVA, a variação dos resíduos é estimada a partir de todos os dados. Assim, quaisquer duas comparações serão (ligeiramente) dependentes, mesmo que apenas por esse motivo, mesmo quando as comparações não têm grupos em comum. Quando as comparações têm grupos em comum (como "A" vs "C" e "B" vs "C"), a dependência é mais óbvia e pronunciada.

— whuber