Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


7
Ao realizar uma regressão múltipla, quando você deve centralizar suas variáveis ​​preditoras e quando deve padronizá-las?
Em alguma literatura, li que uma regressão com múltiplas variáveis ​​explicativas, se em unidades diferentes, precisava ser padronizada. (A padronização consiste em subtrair a média e dividir pelo desvio padrão.) Em quais outros casos eu preciso padronizar meus dados? Existem casos em que eu deveria centralizar apenas meus dados (ou …


6
Como normalizar os dados no intervalo 0-1?
Estou perdido na normalização, alguém poderia me guiar por favor. Eu tenho um valor mínimo e máximo, digamos -23.89 e 7.54990767, respectivamente. Se eu receber um valor de 5,6878, como posso escalar esse valor em uma escala de 0 a 1.

11
Como entender os graus de liberdade?
Da Wikipedia , existem três interpretações dos graus de liberdade de uma estatística: Nas estatísticas, o número de graus de liberdade é o número de valores no cálculo final de uma estatística que pode variar livremente . As estimativas de parâmetros estatísticos podem ser baseadas em diferentes quantidades de informações …




8
Por que a distância euclidiana não é uma boa métrica em grandes dimensões?
Li que "a distância euclidiana não é uma boa distância em grandes dimensões". Acho que essa afirmação tem algo a ver com a maldição da dimensionalidade, mas o que exatamente? Além disso, o que são 'altas dimensões'? Tenho aplicado clustering hierárquico usando distância euclidiana com 100 recursos. Até quantos recursos …


2
Interpretação da saída lm () de R
As páginas de ajuda em R pressupõem que eu sei o que esses números significam, mas não sei. Estou tentando entender intuitivamente todos os números aqui. Vou postar a saída e comentar o que descobri. Pode haver (haverá) erros, pois vou escrever o que presumo. Gostaria principalmente de saber o …

6
É
Eu estava folheando algumas anotações de aula de Cosma Shalizi (em particular, seção 2.1.1 da segunda aula ), e me lembrei de que você pode obter muito baixo, mesmo quando você tem um modelo completamente linear.R2R2R^2 Parafraseando o exemplo de Shalizi: suponha que você tenha um modelo , em que …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.