Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



3
K-fold vs. validação cruzada de Monte Carlo
Estou tentando aprender vários métodos de validação cruzada, principalmente com a intenção de aplicar a técnicas de análise multivariada supervisionada. Dois que eu encontrei são as técnicas de validação cruzada K-fold e Monte Carlo. Eu li que o K-fold é uma variação de Monte Carlo, mas não tenho certeza de …


3







2
O Statistics.com publicou a resposta errada?
O Statistics.com publicou um problema da semana: A taxa de fraude em seguros residenciais é de 10% (uma em cada dez reivindicações é fraudulenta). Um consultor propôs um sistema de aprendizado de máquina para revisar reivindicações e classificá-las como fraude ou não-fraude. O sistema tem 90% de eficiência na detecção …

2
Qual é o modelo estatístico por trás do algoritmo SVM?
Aprendi que, ao lidar com dados usando a abordagem baseada em modelo, o primeiro passo é modelar o procedimento de dados como um modelo estatístico. O próximo passo é desenvolver um algoritmo eficiente / rápido de inferência / aprendizado com base nesse modelo estatístico. Então, eu quero perguntar qual modelo …

3
Quebra-cabeças: Qual é o comprimento esperado de uma sequência iid que aumenta monotonicamente quando extraída de uma distribuição uniforme [0,1]?
Esta é uma pergunta de entrevista para uma posição quantitativa de analista, relatada aqui . Suponhamos que estamos desenhando a partir de uma distribuição uniforme [0,1][0,1][0,1] e os empates são iid, qual é o comprimento esperado de uma distribuição que aumenta monotonicamente? Ou seja, paramos de desenhar se o desenho …

3
Por que uma mistura de duas variáveis ​​normalmente distribuídas é apenas bimodal se suas médias diferem em pelo menos duas vezes o desvio padrão comum?
Sob mistura de duas distribuições normais: https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions "Uma mistura de duas distribuições normais tem cinco parâmetros para estimar: as duas médias, as duas variações e o parâmetro de mistura. Uma mistura de duas distribuições normais com desvios padrão iguais é bimodal somente se suas médias diferirem pelo menos duas vezes …
28 bimodal 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.