Benjamini-Hochberg dependency assumptions justified?


9

Eu tenho um conjunto de dados em que testo diferenças significativas entre três populações com relação a cerca de 50 variáveis ​​diferentes. Faço isso usando os testes de Kruskal-Wallis, por um lado, e por testes de razão de verossimilhança do modelo GLM aninhado (por e sem população como uma variável independente), por outro.

Como resultado, tenho uma lista de Kruskal-Wallis p-valores por um lado, e o que eu acho que é o quadrado do Chi p-valores das comparações LRT, por outro.

Preciso fazer alguma forma de correção de vários testes, pois existem> 50 testes diferentes, e o Benjamini-Hochberg FDR parece ser a escolha mais sensata.

No entanto, as variáveis ​​provavelmente não são independentes, com vários "clãs" deles sendo correlacionados. A questão é então: como posso saber se o conjunto de estatísticas subjacentes para o meup- os valores atendem aos requisitos de dependência positiva necessários para que o procedimento de Benjamini-Hochberg ainda esteja vinculado ao FDR?

O artigo de Benjamini-Hochberg-Yekutieli de 2001 afirma que a condição PRDS é válida para distribuição normal e estudada multivariada. E o meu teste de razão de verossimilhança para os valores do quadrado de Chi para a comparação do modelo? E op-valores que tenho para os testes de Kruskal-Wallis?

Posso usar a correção de FDR de pior caso de Benjamini-Hochberg-Yekutieli que não assume nada na dependência, mas acho que pode ser muito conservadora nesse caso e perder alguns sinais relevantes.

Respostas:


3

A validade do procedimento de BH depende dos testes de hipóteses serem positivamente dependentes. Se você lesse o artigo de 2001, veria que não é necessário ser normal multivariado, eles apresentaram condições fracas no artigo:

A associação condicional (positiva) de Rosenbaum (1984) é suficiente para implicar PRDS: X está associado condicionalmente, se for para qualquer partição (X1 1, X2) do Xe qualquer função h(X1 1),X2 dado h(X1 1) está positivamente associado.

Se isso parecer uma suposição razoável a respeito dos seus dados, declare-os como uma suposição e tente criar cenários onde eles estão e não são atendidos para esclarecer a si mesmo.


can you give a reference to this paper?
user603

3

O PRDS é uma condição suficiente, mas não necessária, para BH controlar o FDR. Eu sugiro que você o use e também use o procedimento Benjamini-Yekutieli para dependência geral. Se a diferença de inferência for grande, tente demonstrar que BH controla o FDR em sua configuração específica usando permutações ou técnicas baseadas em reamostragem que conservam sua estrutura de dependência.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.