O pôster original pedia uma resposta "explique como se eu tivesse 5 anos". Digamos que seu professor convida você e seus colegas para adivinhar a largura da mesa do professor. Cada um dos 20 alunos da turma pode escolher um dispositivo (régua, balança, fita ou critério) e pode medir a tabela 10 vezes. Todos são convidados a usar diferentes locais de partida no dispositivo para evitar a leitura repetida do mesmo número; a leitura inicial deve ser subtraída da leitura final para finalmente obter uma medição de largura (você aprendeu recentemente como fazer esse tipo de matemática).
No total, foram realizadas 200 medidas de largura realizadas pela classe (20 alunos, 10 medidas cada). As observações são entregues ao professor que analisará os números. Subtrair as observações de cada aluno de um valor de referência resultará em outros 200 números, chamados desvios . O professor calcula a média da amostra de cada aluno separadamente, obtendo 20 médias . Subtrair as observações de cada aluno de sua média individual resultará em 200 desvios da média, chamados resíduos . Se o resíduo médio fosse calculado para cada amostra, você notaria que é sempre zero. Se, em vez disso, quadrado cada resíduo, calculá-lo pela média e, finalmente, desfazer o quadrado, obtemos o desvio padrão. (A propósito, chamamos esse último cálculo de raiz quadrada (pense em encontrar a base ou o lado de um determinado quadrado); portanto, toda a operação é chamada de raiz quadrada média , para abreviar; o desvio padrão das observações é igual a raiz quadrada média dos resíduos.)
Mas o professor já sabia a verdadeira largura da tabela, com base em como ela foi projetada, construída e verificada na fábrica. Portanto, outros 200 números, chamados de erros , podem ser calculados como o desvio das observações em relação à largura real. Um erro médio pode ser calculado para cada amostra de aluno. Da mesma forma, 20 desvios padrão do erro , ou erro padrão , podem ser calculados para as observações. Mais 20 erros de raiz quadrada médiaos valores também podem ser calculados. Os três conjuntos de 20 valores estão relacionados como sqrt (me ^ 2 + se ^ 2) = rmse, em ordem de aparência. Com base no rmse, o professor pode julgar qual aluno forneceu a melhor estimativa para a largura da tabela. Além disso, analisando separadamente os 20 erros médios e os 20 valores de erro padrão, o professor pode instruir cada aluno sobre como melhorar suas leituras.
Como verificação, o professor subtraiu cada erro de seu respectivo erro médio, resultando em mais 200 números, que chamaremos de erros residuais (isso geralmente não é feito). Como acima, o erro residual médio é zero, portanto o desvio padrão dos erros residuais ou do erro residual padrão é o mesmo que o erro padrão e, de fato, também é o erro residual da raiz quadrada da média quadrada . (Veja abaixo para detalhes.)
Agora, aqui está algo de interesse para o professor. Podemos comparar a média de cada aluno com o restante da turma (20 significa total). Assim como definimos antes desses valores de ponto:
- m: média (das observações),
- s: desvio padrão (das observações)
- eu: erro médio (das observações)
- se: erro padrão (das observações)
- rmse: erro da raiz quadrada da média (das observações)
também podemos definir agora:
- mm: média das médias
- sm: desvio padrão da média
- mem: erro médio da média
- sem: erro padrão da média
- rmsem: erro raiz quadrático médio da média
Somente se a classe dos alunos for considerada imparcial, ou seja, se mem = 0, então sem = sm = rmsem; isto é, erro padrão da média, desvio padrão da média e erro da raiz quadrada da média, a média pode ser a mesma desde que o erro médio da média seja zero.
Se tivéssemos tirado apenas uma amostra, ou seja, se houvesse apenas um aluno em sala de aula, o desvio padrão das observações poderia ser usado para estimar o desvio padrão da média (sm), como sm ^ 2 ~ s ^ 2 / n, onde n = 10 é o tamanho da amostra (o número de leituras por aluno). Os dois concordam melhor à medida que o tamanho da amostra aumenta (n = 10,11, ...; mais leituras por aluno) e o número de amostras cresce (n '= 20,21, ...; mais alunos na sala de aula). (Uma ressalva: um "erro padrão" não qualificado se refere mais frequentemente ao erro padrão da média, e não ao erro padrão das observações.)
Aqui estão alguns detalhes dos cálculos envolvidos. O valor verdadeiro é denotado t.
Operações de ponto a ponto:
- mean: MEAN (X)
- raiz quadrada média: RMS (X)
- desvio padrão: SD (X) = RMS (X-MEAN (X))
CONJUNTOS INTRA-AMOSTRA:
- observações (dadas), X = {x_i}, i = 1, 2, ..., n = 10.
- desvios: diferença de um conjunto em relação a um ponto fixo.
- resíduos: desvio das observações em relação à sua média, R = Xm.
- erros: desvio das observações do valor verdadeiro, E = Xt.
- erros residuais: desvio dos erros em relação à sua média, RE = E-MEAN (E)
PONTOS INTRA-AMOSTRA (consulte a tabela 1):
- m: média (das observações),
- s: desvio padrão (das observações)
- eu: erro médio (das observações)
- se: erro padrão das observações
- rmse: erro da raiz quadrada da média (das observações)
CONJUNTOS INTER-AMOSTRA (CONJUNTO):
- significa, M = {m_j}, j = 1, 2, ..., n '= 20.
- resíduos da média: desvio das médias de sua média, RM = M-mm.
- erros da média: desvio da média da "verdade", EM = Mt.
- erros residuais da média: desvio dos erros da média em relação à média, REM = EM-MEAN (EM)
PONTOS INTER-AMOSTRA (ENSEMBLE) (consulte a tabela 2):
- mm: média das médias
- sm: desvio padrão da média
- mem: erro médio da média
- sem: erro padrão (da média)
- rmsem: erro raiz quadrático médio da média