Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados





3
se deve redimensionar o indicador / binário / preditores fictícios para o LASSO
Para o LASSO (e outros procedimentos de seleção de modelo), é crucial redimensionar os preditores. A recomendação geral que sigo é simplesmente usar uma média de 0, 1 normalização de desvio padrão para variáveis ​​contínuas. Mas o que há com manequins? Por exemplo, alguns exemplos aplicados da mesma (excelente) escola …

3
Qual fator de inflação de variação devo usar: ou ?
Estou tentando interpretar fatores de inflação de variância usando a viffunção no pacote de R car. A função imprime um generalizado e também . De acordo com o arquivo de ajuda , esse último valorVIFVIF\text{VIF}GVIF1 / ( 2 ⋅ df )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Para ajustar a dimensão do elipsóide de confiança, a …

3
Por que uma matriz de covariância de amostra é singular quando o tamanho da amostra é menor que o número de variáveis?
Digamos que eu tenha uma distribuição Gaussiana multivariada em dimensional. E tomo observações (cada uma delas um vetor ) dessa distribuição e calculo a matriz de covariância da amostra . Neste artigo , os autores afirmam que a matriz de covariância da amostra calculada com é singular.pppnnnpppSSSp>np>np > n Como …


5
Como uso o SVD na filtragem colaborativa?
Estou um pouco confuso com o modo como o SVD é usado na filtragem colaborativa. Suponha que eu tenha um gráfico social e construa uma matriz de adjacência a partir das bordas e faça um SVD (vamos esquecer a regularização, as taxas de aprendizado, as otimizações de escassez etc.), como …




5
Como derivar o estimador de mínimos quadrados para regressão linear múltipla?
No caso de regressão linear simples , é possível derivar o estimador de mínimos quadrados que você não precise conhecer para estimarβ 1 = Σ ( x i - ˉ x ) ( y i - ˉ y )y=β0+β1xy=β0+β1xy=\beta_0+\beta_1xβ 0 β 1β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 Suponha que eu tenha , …

5
O que significa profundidade de interação no GBM?
Eu tinha uma pergunta sobre o parâmetro de profundidade de interação em gbm em R. Esta pode ser uma pergunta noob, pela qual peço desculpas, mas como o parâmetro, que acredito denota o número de nós terminais em uma árvore, indica basicamente X-way interação entre os preditores? Apenas tentando entender …

2
O que significa o termo não linearidades saturantes?
Eu estava lendo o artigo Classificação ImageNet com redes neurais profundas convolucionais e, na seção 3, eles explicaram a arquitetura de sua rede neural convolucional e explicaram como preferiam usar: não saturante não linearidade f(x)=max(0,x).f(x)=max(0,x).f(x) = max(0, x). porque era mais rápido treinar. Nesse papel eles parecem referir-se não-linearidades saturantes …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.