A pergunta que quero fazer é a seguinte: como a proporção de amostras dentro de 1 DP da média de uma distribuição normal varia à medida que o número de variáveis aumenta?
(Quase) todo mundo sabe que em uma distribuição normal unidimensional, 68% das amostras podem ser encontradas com um desvio padrão da média. E em 2, 3, 4, ... dimensões? Eu sei que fica menos ... mas por quanto (precisamente)? Seria útil ter uma tabela mostrando as figuras para 1, 2, 3 ... 10 dimensões, bem como 1, 2, 3 ... 10 SDs. Alguém pode apontar para essa mesa?
Um pouco mais de contexto - eu tenho um sensor que fornece dados em até 128 canais. Cada canal está sujeito a ruído elétrico (independente). Quando sinto um objeto de calibração, posso calcular a média de um número suficiente de medições e obter um valor médio entre os 128 canais, juntamente com 128 desvios padrão individuais.
MAS ... quando se trata de leituras instantâneas individuais, os dados não respondem tanto como 128 leituras individuais quanto uma única leitura de uma quantidade de vetor (até) 128-dimensonal. Certamente, esta é a melhor maneira de tratar as poucas leituras críticas que fazemos (tipicamente 4-6 das 128).
Quero ter uma idéia do que é variação "normal" e do que é "discrepante" nesse espaço vetorial. Tenho certeza de que vi uma tabela como a que descrevi que se aplicaria a esse tipo de situação - alguém pode apontar para uma?