Benjamini-Hochberg dependency assumptions justified?

9

Eu tenho um conjunto de dados em que testo diferenças significativas entre três populações com relação a cerca de 50 variáveis diferentes. Faço isso usando os testes de Kruskal-Wallis, por um lado, e por testes de razão de verossimilhança do modelo GLM aninhado (por e sem população como uma variável independente), por outro.

Como resultado, tenho uma lista de Kruskal-Wallis $p$ -valores por um lado, e o que eu acho que é o quadrado do Chi $p$ -valores das comparações LRT, por outro.

Preciso fazer alguma forma de correção de vários testes, pois existem> 50 testes diferentes, e o Benjamini-Hochberg FDR parece ser a escolha mais sensata.

No entanto, as variáveis provavelmente não são independentes, com vários "clãs" deles sendo correlacionados. A questão é então: como posso saber se o conjunto de estatísticas subjacentes para o meu $p$ - os valores atendem aos requisitos de dependência positiva necessários para que o procedimento de Benjamini-Hochberg ainda esteja vinculado ao FDR?

O artigo de Benjamini-Hochberg-Yekutieli de 2001 afirma que a condição PRDS é válida para distribuição normal e estudada multivariada. E o meu teste de razão de verossimilhança para os valores do quadrado de Chi para a comparação do modelo? E o $p$ -valores que tenho para os testes de Kruskal-Wallis?

Posso usar a correção de FDR de pior caso de Benjamini-Hochberg-Yekutieli que não assume nada na dependência, mas acho que pode ser muito conservadora nesse caso e perder alguns sinais relevantes.

— user14867
fonte

3

A validade do procedimento de BH depende dos testes de hipóteses serem positivamente dependentes. Se você lesse o artigo de 2001, veria que não é necessário ser normal multivariado, eles apresentaram condições fracas no artigo:

A associação condicional (positiva) de Rosenbaum (1984) é suficiente para implicar PRDS: $X$ está associado condicionalmente, se for para qualquer partição $(X1,$ $X2)$ do $X$ e qualquer função $h(X1), X2$ dado $h(X1)$ está positivamente associado.

Se isso parecer uma suposição razoável a respeito dos seus dados, declare-os como uma suposição e tente criar cenários onde eles estão e não são atendidos para esclarecer a si mesmo.

— guest47
fonte

can you give a reference to this paper?

— user603

3

O PRDS é uma condição suficiente, mas não necessária, para BH controlar o FDR. Eu sugiro que você o use e também use o procedimento Benjamini-Yekutieli para dependência geral. Se a diferença de inferência for grande, tente demonstrar que BH controla o FDR em sua configuração específica usando permutações ou técnicas baseadas em reamostragem que conservam sua estrutura de dependência.

— JohnRos
fonte