Estou tentando entender o cálculo de potência para o caso do teste t de duas amostras independentes (não assumindo variações iguais, então usei Satterthwaite).
Aqui está um diagrama que eu encontrei para ajudar a entender o processo:
Então, assumi que, considerando o seguinte sobre as duas populações e os tamanhos das amostras:
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
Eu poderia calcular o valor crítico sob o valor nulo relacionado a ter 0,05 de probabilidade na cauda superior:
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df) #equals 1.730018
e depois calcule a hipótese alternativa (que para este caso eu aprendi é uma "distribuição não central t"). Calculei beta no diagrama acima usando a distribuição não central e o valor crítico encontrado acima. Aqui está o script completo em R:
#under alternative
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
#Under null
Sp<-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2))
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df)
#under alternative
diff<-mu1-mu2
t<-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2))
ncp<-(diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
#power
1-pt(t, df, ncp)
Isso fornece um valor de energia de 0,4935132.
Essa é a abordagem correta? Acho que se eu usar outro software de cálculo de energia (como o SAS, que acho que configurei equivalentemente ao meu problema abaixo), recebo outra resposta (do SAS é 0,33).
CÓDIGO SAS:
proc power;
twosamplemeans test=diff_satt
meandiff = 1
groupstddevs = 3 | 2
groupweights = (1 1)
ntotal = 40
power = .
sides=1;
run;
Por fim, gostaria de obter um entendimento que me permita analisar as simulações para procedimentos mais complicados.
EDIT: Encontrei o meu erro. deveria ter ficado
1 ponto (CV, df, ncp) NÃO 1 ponto (t, df, ncp)