Infelizmente, os termos são usados de maneira diferente em campos diferentes, por pessoas diferentes dentro do mesmo campo etc., portanto, não tenho certeza de como isso pode ser respondido aqui. Você deve ter certeza de que conhece a definição que seu instrutor / livro está usando para "normalizado". No entanto, aqui estão algumas definições comuns:
Centralizado:
Padronizado: Normalizado: normalização nesse sentido redimensiona seus dados para o intervalo da unidade. A padronização transforma seus dados em escores, como observa @Jeff. E centralizar apenas torna a média dos seus dados igual a .
X−mean
X−meansd
X−min(X)max(X)−min(X)
z0
Vale a pena reconhecer aqui que todos os três são transformações lineares ; como tal, eles não alteram a forma da sua distribuição . Ou seja, às vezes as pessoas chamam a transformação score de "normalização" e acreditam que, devido à associação dos scores com a distribuição normal, isso fez com que seus dados normalmente fossem distribuídos. Isso não é assim (como @Jeff também observa, e como você poderia dizer, plotando seus dados antes e depois). Se você estiver interessado, poderá alterar a forma dos seus dados usando a família de transformações Box-Cox , por exemplo. zz
Com relação a como você pode verificar essas transformações, isso depende exatamente do que isso significa. Se eles pretendem simplesmente verificar se o código foi executado corretamente, você pode verificar meios, SDs, mínimos e máximos.