Existe uma versão simples do teste de equivalência do teste Kolmogorov – Smirnov?


13

Dois testes unilaterais de equivalência (TOST) foram estruturados para o teste de Kolmogorov – Smirnov para testar a hipótese nula negativista de que duas distribuições diferem pelo menos em algum nível especificado pelo pesquisador?

Se não for TOST, alguma outra forma de teste de equivalência?

Nick Stauner salienta sabiamente que (eu já deveria saber;) que existem outros testes de equivalência TOST não paramétricos para hipóteses nulas para equivalência estocástica e, com suposições mais restritivas, para equivalência mediana.


Respostas:


9

Ok, aqui está minha primeira tentativa. Apreciação minuciosa e comentários apreciados!

As hipóteses de duas amostras
Se podemos enquadrar testes de hipótese de Kolmogorov-Smirnov de duas amostras com uma face , com hipóteses nulas e alternativas ao longo destas linhas:

H 0F Y ( t )F X ( t ) , e0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , por pelo menos um t , em que:AFY(t)<FX(t)t

  • a estatística de teste D=|mint(FY(t)FX(t))| corresponde a H 0F Y ( t )F X ( t ) ;0FY(t)FX(t)

  • a estatística de teste D+=|maxt(FY(t)FX(t))|corresponde a H 0F Y ( t )F X ( t ) ; e0FY(t)FX(t)

  • FY(t) eFX(t) são osCDFs empíricosdas amostrasY eX ,

deve ser razoável criar uma hipótese geral de intervalo para um teste de equivalência ao longo destas linhas (assumindo que o intervalo de equivalência seja simétrico no momento):

H - 0| F Y ( t ) - F X ( t ) | Δ , e0|FY(t)FX(t)|Δ

H - A| F Y ( t ) - F X ( t ) | < Δ , por pelo menos um t .A|FY(t)FX(t)|<Δt

Isto se traduziria para o específico dois unilateral "negativista" hipóteses nulas para teste de equivalência (estas duas hipóteses assumir a mesma forma, uma vez que ambos e D - são estritamente não-negativo):D+D

H - 01D +Δ , ou01D+Δ

H - 02D -Δ .02DΔ

Rejeitando ambos H - 01 e H - 02 iria levar à conclusão de que - Δ < F Y ( t ) - F X ( t ) < Δ . Obviamente, o intervalo de equivalência não precisa ser simétrico, e - Δ e Δ podem ser substituídos por Δ 2 (inferior) e Δ 1 (superior) para as respectivas hipóteses nulas unilaterais.01 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

As estatísticas de teste (atualizadas: Delta estão fora do sinal de valor absoluto)
As estatísticas de teste e D - 2 (deixando implícitos n Y e n X ) correspondem a H - 01 e H - 02 , respectivamente, e são:D1+D2nYnX0102

D1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|, and

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

O limiar de equivalência / relevância
O intervalo - ou [ Δ 2 , Δ 1 ] , se estiver usando um intervalo de equivalência assimétrico - é expresso em unidades de D + e D - ou a magnitude das probabilidades diferenciadas. À medida que n Y e n X se aproximam do infinito, o CDF de D + ou D - para n Y , n X se aproxima de 0 para t[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0, and for t0:

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF of $D^{+}$ (or $D^{-}$)

So it seems to me that the PDF for sample size-scaled D+ (or sample size-scaled D) must be 0 for t<0, and for t0:

f(t)=1e2t2ddt=4te2t2

PDF of $D^{+}$ (or $D^{-}$)

Glen_b points out that this is a Rayleigh distribution with σ=12. So the large sample quantile function for sample size-scaled D+ and D is:

CDF1=Q(p)=ln(1p)2

and a liberal choice of Δ might be the critical value Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18.


1
In the line where you pass from the cdf to the pdf, I think you got that wrong. Let KnY,nX=nYnXnY+nXD+, so (abusing notation), in the limit P(K,t)=1e2t2. Then fK(t)=ddt1e2t2=4te2t2 (note the t after the 4). (note also a missing sign in the exponent in the line above the taking of the derivative. Also I'm not sure why you have an integral symbol there, but maybe I misunderstood something.)
Glen_b -Reinstate Monica

2
@stochazesthai D1 and D2 are two one-sided test statistics. Per TOST you need to reject both the null hypotheses to which these test statistics apply. Qα is a critical value from CDF1 on the above line, and where you want to sub in 1α for p (e.g. Qα=ln(1(1α))2). The choice of Δ depends on how far past Qα (the critical rejection value for a plain old positivist H0) you need to go, before you conclude relevant difference (e.g. liberal 'equivalence' is 14 σ beyond Qα).
Alexis

2
@stochazesthai (Continuing) So if both D1Δ and D2Δ, then you reject H0.
Alexis

2
@stochazesthai Whoops! I should have put the quotes around the word liberal rather than equivalence two comments back. :)
Alexis

2
@stochazesthai If D1Δ, then reject H01, if D1<Δ, then fail to reject H01. If D2Δ, then reject H02, if D2<Δ, then fail to reject H02. If reject both H01 and H02, then reject H0, otherwise fail to reject H0.
Alexis

6

An alternative to TOST in equivalence testing is based on the confidence interval approach:

Let Δ denote the prespecified equivalence margin and

θ:=supt|FX(t)FY(t)|
the Kolmogorov-Smirnov distance between the unknown underlying distribution functions.

Now, if a 90% confidence interval for θ is completely within [Δ,Δ], then we may be 95% certain that θ is enough close to 0 to speak of "equivalence".

Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairs X and Y. (I don't want to find conditions for their validity in this particular application though...)


Excellent. Do you have a citation for anyone undertaking the CI of Dn1,n2 (bootstrap or otherwise)?
Alexis

1
Good point... The short paper tomswebpage.net/images/K-S_test.doc mentions the "Handbook of Parametric and Nonparametric Statistical Procedures, Fifth Edition by David J.Sheskin (Apr 27, 2011)." to offer a two-sample case construcion for D. But at the moment, I don't have access to this book.
Michael M
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.