Na minha pesquisa, encontrei o seguinte problema geral: tenho duas distribuições e no mesmo domínio e um grande (mas finito) número de amostras dessas distribuições. As amostras são distribuídas de forma independente e idêntica a partir de uma dessas duas distribuições (embora as distribuições possam estar relacionadas: por exemplo, pode ser uma mistura de e alguma outra distribuição). A hipótese nula é de que as amostras provêm de ; a hipótese alternativa é que amostras vêm de .
Estou tentando caracterizar o tipo I e tipo II erros no teste da amostra, conhecendo as distribuições e . Particularmente, eu estou interessado em delimitadora um erro dada a outro, além do conhecimento de e .
Fiz uma pergunta sobre math.SE sobre a relação entre a distância total da variação entre e e o teste de hipóteses, e recebi uma resposta que aceitei. Essa resposta faz sentido, mas ainda não fui capaz de compreender o significado mais profundo por trás da relação entre teste de distância e hipótese de variação total no que se refere ao meu problema. Assim, eu decidi recorrer a este fórum.
Minha primeira pergunta é: a variação total está vinculada à soma das probabilidades de erros do tipo I e do tipo II, independentemente do método de teste de hipóteses empregado? Em essência, desde que haja uma probabilidade diferente de zero de que a amostra possa ter sido gerada por qualquer uma das distribuições, a probabilidade de pelo menos um dos erros deve ser diferente de zero. Basicamente, você não pode escapar da possibilidade de seu testador de hipóteses cometer um erro, não importa quanto processamento de sinal você faça. E a variação total limita essa possibilidade exata. Meu entendimento está correto?
Há também outra relação entre os erros do tipo I e II e as distribuições de probabilidade subjacentes e : a divergência de KL . Assim, minha segunda pergunta é: a divergência de KL é apenas aplicável a um método específico de teste de hipóteses (parece surgir muito em torno do método da razão de verossimilhança de log) ou pode-se aplicá-la geralmente em todos os métodos de teste de hipóteses? Se é aplicável a todos os métodos de teste de hipóteses, por que parece ser tão diferente do limite da Variação Total? Ele se comporta de maneira diferente?
E a minha pergunta subjacente é: existe um conjunto prescrito de circunstâncias em que devo usar um ou outro, ou é apenas uma questão de conveniência? Quando o resultado derivado usando um limite deve ser mantido usando o outro?
Peço desculpas se essas perguntas são triviais. Eu sou um cientista da computação (então isso parece um problema sofisticado de correspondência de padrões para mim :).) Conheço a teoria da informação razoavelmente bem e também tenho formação em teoria da probabilidade. No entanto, estou apenas começando a aprender todas essas coisas de teste de hipóteses. Se necessário, farei o possível para esclarecer minhas perguntas.