Eu tenho uma variável aleatória que recebe valores nos números inteiros não negativos , chame as probabilidades para cada resultado . Eu posso provar da distribuição de de forma independente e barata; Atualmente, tenho um tamanho de amostra de . Parece que , com decaimento aproximadamente exponencial.
Eu tenho uma sequência de formas quadráticas com coeficientes positivos:
- ...
- ...
O que eu gostaria de ter é um intervalo de confiança para os menos de largura, mas aceitarei o que puder.
Eu tenho limites rigorosos no , e como os coeficientes dos 's são todos positivos, é fácil transformá-los em limites rigorosos para os 's. Mas não sei como fazer isso corretamente com intervalos de confiança.
Isso é sobre o quê? Encontrei um fenômeno bizarro na teoria dos números e sei como provar que isso realmente acontece, mas, na verdade, isso exigirá algum esforço de programação da minha parte e uma quantidade considerável de tempo em nosso cluster local. Antes de investir esse tempo e entupir nossa máquina, gostaria de ter mais certeza do que sou de que o fenômeno é real.
Quero quantificar a razoabilidade da minha afirmação de que e . Minhas estimativas indicam que é de cerca de , e é por isso que eu queria ICs nessa resolução.
Corrija um número inteiro grande e deixe ser um subconjunto uniformemente escolhido de (ou seja, cada subconjunto específico tem probabilidade de ser escolhido). Seja a probabilidade de que exatamente dos números de não possa ser escrito como uma soma de dois elementos de ; deixe . É um pouco complicado de provar, mas esses limites existem e . Agora não é surpresa que seja pequeno e, à medida que aumenta,aumenta, tem um pico e decai exponencialmente. A parte bizarra é que existe um viés contra 7. Ou seja, experimentalmente e . Ou seja, o que não foi uma surpresa na verdade não é verdade: a distribuição é bimodal.
Eu posso expressar os 's (usando alguma teoria) como acima, sem o limite em termos dessa outra distribuição, definida pelos ' s. Isso é útil porque tenho uma maneira de vincular rigorosamente os usando, como mencionei acima, alguns cálculos grandes. Além disso, eu tenho um conjunto de dados muito grande para a variável