Estou lendo os slides "Doing Bayesian Data Analysis" de John Kruschke , mas na verdade tenho uma pergunta sobre sua interpretação dos testes t e / ou toda a estrutura de testes de significância de hipóteses nulas. Ele argumenta que os valores de p estão mal definidos porque dependem das intenções do investigador.
Em particular, ele fornece um exemplo (páginas 3-6) de dois laboratórios que coletam conjuntos de dados idênticos comparando dois tratamentos. Um laboratório compromete-se a coletar dados de 12 indivíduos (6 por condição), enquanto o outro coleta dados por um período fixo, o que também gera 12 indivíduos. De acordo com os slides, o valor crítico para difere entre esses dois esquemas de coleta de dados: para o primeiro, mas para o último !t crit = 2,33 t crit = 2,45
Uma postagem no blog - que agora não consigo encontrar - sugeriu que o cenário de duração fixa tem mais graus de liberdade, pois eles poderiam ter coletado dados de 11, 13 ou qualquer outro número de assuntos, enquanto o cenário de N fixo, por definição, tem .
Alguém poderia me explicar:
Por que o valor crítico diferiria entre essas condições?
(Supondo que seja um problema) Como alguém corrige / compara os efeitos de diferentes critérios de parada?
Eu sei que definir os critérios de parada com base na significância (por exemplo, amostra até ) pode aumentar as chances de um erro do tipo I, mas isso não parece estar acontecendo aqui, pois nenhuma regra de parada depende do resultado de a análise.