Encontrei um novo artigo do grupo de PNL de Berkeley sobre testes estatísticos, Uma Investigação Empírica de Significância Estatística na PNL .
Existe um pseudocódigo para calcular um valor-p no artigo, basicamente, a ideia é que o conjunto de amostras de seja amostrado com a substituição dos dados . Então x
, em que é um ganho métrico.
Eu pude entender a fórmula para calcular o valor-p no artigo de Koehn, testes de significância estatística para avaliação de tradução automática , na qual:
, onde e são o ganho de métrica para o sistema de e respectivamente.δ b a b
Existe alguma explicação ou de referência para a fórmula . Os autores também observaram que se a média de é e é simétrica, as duas fórmulas acima são equivalentes.δ ( x i ) δ ( x ) δ ( x i )