Estou tentando aprender estatística porque acho que ela é tão prevalente que me proíbe de aprender algumas coisas, se não entendi direito. Estou tendo problemas para entender essa noção de distribuição amostral dos meios amostrais. Não consigo entender como alguns livros e sites explicaram isso. Acho que tenho um entendimento, mas não tenho certeza se está correto. Abaixo está minha tentativa de entendê-lo.
Quando falamos de algum fenômeno assumindo uma distribuição normal, geralmente é (nem sempre) referente à população.
Queremos usar estatísticas inferenciais para prever algumas coisas sobre alguma população, mas não temos todos os dados. Utilizamos amostragem aleatória e cada amostra de tamanho n tem a mesma probabilidade de ser selecionada.
Então, coletamos muitas amostras, digamos 100 e, em seguida, a distribuição das médias dessas amostras será aproximadamente normal, de acordo com o teorema do limite central. A média das médias da amostra aproximará a média da população.
Agora, o que eu não entendo é que muitas vezes você vê "Uma amostra de 100 pessoas ..." Não precisaríamos de 10 ou 100 amostras de 100 pessoas para aproximar a população da média? Ou é o caso de podermos colher uma amostra grande o suficiente, digamos 1000 e depois dizer que a média se aproximará da média da população? OU coletamos uma amostra de 1000 pessoas e, em seguida, coletamos 100 amostras aleatórias de 100 pessoas em cada amostra das 1000 pessoas originais que pegamos e depois usamos isso como nossa aproximação?
Tomar uma amostra grande o suficiente para aproximar a média (quase) sempre funciona? A população precisa ser normal para que isso funcione?