Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


2
Qual é a diferença entre PCA e PCA assintótico?
Em dois trabalhos em 1986 e 1988 , Connor e Korajczyk propuseram uma abordagem para modelar o retorno de ativos. Como essas séries temporais geralmente têm mais ativos do que as observações do período, eles propuseram realizar um PCA nas covariâncias transversais dos retornos dos ativos. Eles chamam esse método …
23 pca  econometrics 


2
Forense estatístico: Benford e além
Que métodos amplos existem para detectar fraudes, anomalias, falsificações etc. em trabalhos científicos produzidos por terceiros? (Fui motivado a perguntar isso pelo recente caso de Marc Hauser .) Geralmente, por fraude eleitoral e contábil, é citada alguma variante da Lei de Benford . Não tenho certeza de como isso poderia …

5
Alternativas às árvores de classificação, com melhor desempenho preditivo (por exemplo: CV)?
Estou procurando uma alternativa para as árvores de classificação que possam gerar melhor poder preditivo. Os dados com os quais estou lidando têm fatores para as variáveis ​​explicativas e explicadas. Lembro-me de cruzar florestas aleatórias e redes neurais nesse contexto, embora nunca as tenha experimentado antes. Existe outro bom candidato …




1
Explicação do min_child_weight no algoritmo xgboost
A definição do parâmetro min_child_weight no xgboost é fornecida como: soma mínima do peso da instância (hessian) necessária em uma criança. Se a etapa de partição em árvore resultar em um nó folha com a soma do peso da instância menor que min_child_weight, o processo de criação desistirá de particionar …

1
Quais são exatamente os mecanismos de atenção?
Mecanismos de atenção têm sido utilizados em vários trabalhos de Deep Learning nos últimos anos. Ilya Sutskever, chefe de pesquisa da Open AI, elogiou-os com entusiasmo: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 Eugenio Culurciello, da Universidade de Purdue, afirmou que RNNs e LSTMs deveriam ser abandonados em favor de redes neurais puramente baseadas na atenção: …


2
Por que existem duas formulações / notações de perda logística diferentes?
Eu já vi dois tipos de formulações de perda logística. Podemos mostrar facilmente que eles são idênticos, a única diferença é a definição do rótulo .yyy Formulação / notação 1, :y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) onde , em que a função logística mapeia um número real para um intervalo …

3
Um
Esta pergunta foi migrada do Stack Overflow porque pode ser respondida em Validação cruzada. Migrou há 3 anos . Nas estatísticas, estamos fazendo regressões lineares, o próprio começo delas. Em geral, sabemos que quanto maior o , melhor, mas existe um cenário em que um alto seria um modelo inútil?R2R2R^2R2R2R^2


3
Coordenada vs. descida de gradiente
Eu queria saber quais são os diferentes casos de uso para os dois algoritmos, descida de coordenadas e descida de gradiente . Eu sei que a descida de coordenadas tem problemas com funções não suaves, mas é usada em algoritmos populares como SVM e LASSO. Acho que a descida em …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.