Você pode usar o teste Kolmogorov-Smirnov para testar diretamente a equivalência de duas distribuições?

Falou-se sobre outras questões de como alguém poderia usar a abordagem Testa (dois testes unilaterais) para o teste de Kolmogorov-Smirnov (KS), mas eu queria saber se era possível usar diretamente a estatística de teste para mostrar que dois distribuições foram semelhantes?

Pelo que entendi, a estatística do teste KS representa a maior diferença entre dois CDFs, com a versão de uma amostra sendo usada originalmente como um teste de qualidade do ajuste. Isso é mostrado em [1] como sendo quando a distribuição empírica ultrapassa o intervalo de confiança (ou seja, qualquer ponto está muito longe da distribuição hipotética em que está testando).

Se a versão de duas amostras é frequentemente usada para mostrar que duas distribuições são significativamente diferentes uma da outra, de maneira semelhante à versão de uma amostra, podemos inverter o cálculo dos intervalos de confiança usando para usar , como forma de mostrar que a diferença máxima entre as duas distribuições é significativamente semelhante? $(1-\alpha) = 0.05$ $(1-\alpha) = 0.95$

[1] Massey, F. "O teste de Kolmogorov-Smirnov para a adequação", Journal of the American Statistical Association , vol. 46, n. 253, pp. 68-78, março de 1951

— jamesyjamesjames
fonte

$H_0:$ $p$ $H_0$ $H_A:$

$p$ $p$ $p$

$p$ $p=0.99.$ $\alpha=0.95$ $p>\alpha$

$p$ $p$ $n$

Não é exatamente a resposta que você provavelmente estava procurando, mas também não é uma lavagem total. Espero que isto ajude!

— Matt Brems
fonte

(1/2) Eu entendo que não podemos simplesmente usar um valor de p> 0,98 .. etc. - o que eu queria saber é que, se o teste KS está realmente medindo a distância máxima entre as duas distribuições, parece como se estivesse em uma posição única para realizar testes de equivalência diretamente. Por exemplo, se a estatística de teste D = 0, certamente as duas distribuições devem ser idênticas? E se for esse o caso, e D <0,0001? Parece que deve haver um ponto crítico (como quando p atravessa 0,05), em que já não pode ter a certeza de que eles são a mesma distribuição, e

— jamesyjamesjames

(2/2) ... então pode virar isso de cabeça para baixo e usar 0 <D <0,05 (por exemplo) para dizer que as duas distribuições são significativamente semelhantes.

— Jamesyjamesjames

D = 0

$D=0$

p

$p$

n

$n$

... as distribuições são idênticas, mas você não pode estabelecer conclusivamente esse fato.

— Matt Brems

Ah, é claro - porque é um ECDF. Sim, isso faz sentido.

— Jamesyjamesjames