este artigo pode ser do seu interesse:
http://arxiv.org/pdf/0906.4032v1.pdf
Ele fornece um bom resumo de algumas abordagens freqüentistas e bayesianas para o problema de duas amostras e discute os casos paramétricos e não paramétricos.
Pode adicionar algo às outras respostas para dar um exemplo simples. Digamos que você tenha dois conjuntos de dados e y em que cada x i e cada y j sejam 0 ou 1 . Você assume um modelo iid Bernoulli nos dois casos, então cada x i ∼ B e r n ( pxyxiyj01 e cada y i ∼ B e r n ( q ) . Sua hipótese de testar cenário emamboso frequencista e configurações Bayesian pode ser:xi∼Bern(p)yi∼Bern(q)
H0:p=q
H1:p,q
As probabilidades para os dados em cada caso são:
Sob : G 0 ( p ) = f ( x , y ; p ) = Π i p i ( 1 - P ) 1 - i Π jH0L0(p)=f(x,y;p)=∏ipi(1−p)1−i∏jpj(1−p)1−j
H1L1(p,q)=f(x,y;p,q)=∏ipi(1−p)1−i∏jqj(1−q)1−j
H0q=p
W=−2log{L0(pmax)L1(pmax,qmax)},
onde denotam as estimativas de verossimilhança máxima para p e q sob a hipótese relevante (então p m a x no numerador pode não ser o mesmo que p m a x no denominador). W segue assintoticamente um χ 2pmax,qmaxpqpmaxpmaxWdistribuição 1 (consulte, por exemplo, Pawitan, 2001), portanto você deve especificar um nível de significância e rejeitar / deixar de rejeitarH0conforme apropriado.χ21H0
Tradicionalmente, na abordagem bayesiana, a estatística do teste seria o fator Bayes. Primeiro você assumiria alguns estudos anteriores relevantes sob H 0 e p , qp∼π0H0 sob H 1 . O fator Bayes é a razão de verossimilhanças marginais, dada por:p,q∼π1H1
BF=f(x,y|H0)f(x,y|H1)=∫10L0(p)π0(p)dp∫10∫10L1(p,q)π1(p,q)dpdq
H0H1H0H1 p(H0)=p(H1)=1/2
p(H0|x,y)p(H1|x,y)=BF×p(H0)p(H1)=BF×1/21/2=BF.
>1H0H1H0
H1
Espero que ajude junto com as outras respostas já postadas.