valor-p como distância?

8

Os valores de p entre vários testes em pares podem ser considerados como uma medida de similaridade / distância e o dimensionamento multidimensional pode ser aplicado sobre uma matriz em pares de valores de p para reduzir a dimensionalidade? Essa é uma pergunta fácil, mas qual seria o maior problema aqui e como isso poderia ser melhor superado? (ex: desigualdade triangular?)

multivariate-analysis p-value dimensionality-reduction

— qlinck
fonte

2

Minha resposta curta para sua primeira pergunta sobre "distância de similaridade" seria Não, você pode consultar uma pergunta semelhante sobre um assunto diferente aqui: stats.stackexchange.com/questions/32890/… . Portanto, essas postagens sugerem outras "divergências" ou medidas de distância. Eu acho que é melhor primeiro abordar sua primeira pergunta.

— JDav #

3

$\chi ^2$

— carro fúnebre
fonte

3

Se todas as "distâncias verdadeiras" forem 0, os valores-p seguirão uma distribuição uniforme e seriam apenas distâncias aleatórias e incorretas.
Se as distâncias reais não forem 0, você ainda terá problemas de dimensionamento nos quais uma estatística de teste pode ser mais significativa. Os valores de p de 0,9 e 0,6 não são muito diferentes na interpretação, enquanto os valores de p de 0,06 e 0,01 são muito diferentes na interpretação, mas os algoritmos mds colocariam mais distância entre o primeiro do que o posterior. Você também deve considerar a potência, pode ter dois grupos com uma distância muito pequena entre eles, mas com amostras grandes para obter um valor p pequeno; depois outro par com uma grande diferença entre eles, mas devido ao pequeno tamanho da amostra (baixa potência), você obtém um valor p maior.

— Greg Snow
fonte

2

Eu acredito que a resposta é sim.

Pode-se pensar na "semelhança" entre duas variáveis a serem medidas por (digamos) correlação. E para que o valor p seja o significado da correlação diferente de 0. Nesse caso, um pequeno valor p (próximo de zero) é aquele que reflete uma grande distância ("diferença") entre as variáveis.

Você pode transformar os valores-p em escores z (onde a "distância" deles terá que ser na direção "usual") e ver se os métodos que você mencionou farão sentido nisso ...

— Tal Galili
fonte

1

Não sei ao certo o que você quer dizer com "valores-p entre vários testes em pares". O valor p é uma medida de quão provável / improvável para um teste específico seria ver um valor extremo ou mais extremo do que o que foi realmente observado se a hipótese nula for verdadeira. Ao fazer o teste em pares, não há conexão específica entre um valor-p e outro. Não vejo como qualquer valor p possa ser visto como uma medida de similaridade entre testes em pares.

— Michael R. Chernick
fonte