Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

3
Avaliação da regressão logística e interpretação da qualidade de ajuste de Hosmer-Lemeshow
Como todos sabemos, existem 2 métodos para avaliar o modelo de regressão logística e eles estão testando coisas muito diferentes Poder preditivo: Obtenha uma estatística que mede o quão bem você pode prever a variável dependente com base nas variáveis ​​independentes. Os bem conhecidos Pseudo R ^ 2 são McFadden …

2
Mudar de Modelar um processo usando uma distribuição Poisson para usar uma distribuição binomial negativa?
\newcommand{\P}{\mathbb{P}} Temos um processo aleatório que pode-ou-pode-não ocorrer várias vezes num período de tempo . Temos um feed de dados de um modelo preexistente desse processo, que fornece a probabilidade de vários eventos ocorrerem no período . Esse modelo existente é antigo e precisamos executar verificações ativas nos dados de …

4
O que podemos aprender sobre o cérebro humano a partir de redes neurais artificiais?
Sei que minha pergunta / título não é muito específico, tentarei esclarecê-la: As redes neurais artificiais têm projetos relativamente rígidos. É claro que, geralmente, eles são influenciados pela biologia e tentam construir um modelo matemático de redes neurais reais, mas nosso entendimento das redes neurais reais é insuficiente para a …

3
Por que as transformações de potência ou log não são ensinadas muito no aprendizado de máquina?
O aprendizado de máquina (ML) usa fortemente técnicas de regressão linear e logística. Ele também se baseia em técnicas de engenharia recurso ( feature transform, kernel, etc.). Porque é que nada sobre variable transformation(por exemplo power transformation) mencionados no ML? (Por exemplo, eu nunca ouvi falar em criar raiz ou …


1
Um Multinomial (1 / n,…, 1 / n) pode ser caracterizado como um Dirichlet discretizado (1, .., 1)?
Portanto, essa pergunta é um pouco confusa, mas incluirei gráficos coloridos para compensar isso! Primeiro os antecedentes e depois as perguntas. fundo Digamos que você tenha uma distribuição multinomial dimensional com probailites iguais nas categorias. Seja as contagens normalizadas ( ) dessa distribuição, ou seja:nnnnnnπ=(π1,…,πn)π=(π1,…,πn)\pi = (\pi_1, \ldots, \pi_n)ccc (c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c_1, …

2
Laço bayesiano vs laço comum
Diferentes softwares de implementação estão disponíveis para o laço . Sei muito discutido sobre abordagem bayesiana versus abordagem freqüentista em diferentes fóruns. Minha pergunta é muito específica para o laço - Quais são as diferenças ou vantagens de laço baysiano vs laço regular ? Aqui estão dois exemplos de implementação …


4
Algoritmos para detecção de anomalias de séries temporais
Atualmente, estou usando o AnomalyDetection do Twitter em R: https://github.com/twitter/AnomalyDetection . Esse algoritmo fornece detecção de anomalia de séries temporais para dados com sazonalidade. Pergunta: existem outros algoritmos semelhantes a este (controlar a sazonalidade não importa)? Estou tentando pontuar o maior número possível de algoritmos de séries temporais nos meus …







Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.