Me deparei com a fórmula para obter limites superiores de confiança no problema dos bandidos armados com k:
onde é a quantidade de amostras que temos para esse bandido específico e é a quantidade total de amostras que temos de todos os bandidos. O mesmo algoritmo é usado na Pesquisa em árvore de Monte Carlo também para obter o limite de confiança superior.n i
Entendo muito claramente o que é um limite superior de confiança, mas o que não entendo é de onde vem essa fórmula. Tentei procurar on-line em vários lugares, mas não consegui encontrar uma explicação clara de como essa fórmula é derivada. Alguém pode explicar de onde vem esta fórmula? Por favor, assuma que eu não tenho um ótimo histórico em estatística.