As respostas de Robert e Bey dão parte da história (ou seja, momentos tendem a ser considerados propriedades básicas de distribuições, e o desvio padrão convencional é definido em termos do segundo momento central e não o contrário), mas até que ponto esses as coisas são realmente fundamentais depende em parte do que queremos dizer com o termo.
Não haveria problema insuperável, por exemplo, se nossas convenções seguissem o contrário - não há nada que nos impeça de definir convencionalmente alguma outra sequência de quantidades no lugar dos momentos habituais, digamos para (observe que se encaixa tanto na sequência do momento quanto na presente como o primeiro termo) e depois definindo os momentos - e todo tipo de cálculo em relação a momentos - em termos deles. Note-se que estas quantidades são todos medidos nas unidades originais, o que é uma vantagem em relação aos momentos (que estão em poderes -ésimo das unidades originais, e assim mais difícil de interpretar). Isso tornaria o desvio padrão da população a quantidade e a variação definidas em termos dela.E[(X−μ)p]1/pp=1,2,3,...μp
No entanto, isso tornaria quantidades como a função geradora de momento (ou algum equivalente relacionado às novas quantidades definidas acima) um pouco menos "naturais", o que tornaria as coisas um pouco mais estranhas (mas algumas convenções são um pouco assim). Existem algumas propriedades convenientes do MGF que não seriam tão convenientes para o elenco.
Mais básico, a meu ver (mas relacionado a isso), é que existem várias propriedades básicas de variação que são mais convenientes quando escritas como propriedades de variação do que quando escritas como propriedades de desvio padrão (por exemplo, a variação de somas de valores independentes). variáveis aleatórias é a soma das variações).
Essa aditividade é uma propriedade que não é compartilhada por outras medidas de dispersão e tem várias consequências importantes.
[Existem relações semelhantes entre os outros cumulantes, portanto é um sentido em que podemos querer definir as coisas em relação aos momentos de maneira mais geral.]
Todas essas razões são, sem dúvida, convenções ou conveniências, mas, até certo ponto, é uma questão de ponto de vista (por exemplo, de alguns pontos de vista, os momentos são quantidades muito importantes, de outros, não são tão importantes). Pode ser que o bit "em um nível profundo" tenha a intenção de implicar nada mais do que o de "no desenvolvimento da teoria" de kjetil.
Concordo com o argumento de kjetil que você levantou na sua pergunta; até certo ponto, essa resposta é apenas uma discussão ondulatória sobre ela.