Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

16
Quais termos estatísticos mal utilizados valem a pena corrigir?
Estatísticas estão em todo lugar; o uso comum de termos estatísticos é, no entanto, frequentemente incerto. Os termos probabilidade e probabilidades são usados ​​intercambiáveis ​​no inglês leigo, apesar de suas expressões matemáticas bem definidas e diferentes. Não separar o termo probabilidade de probabilidade confunde rotineiramente os médicos que tentam quantificar …
103 terminology 


19
Como irritar um árbitro estatístico?
Recentemente, fiz uma pergunta sobre princípios gerais em torno da revisão de estatísticas em artigos . O que eu gostaria agora de perguntar é o que o irrita particularmente ao revisar um artigo, ou seja, qual é a melhor maneira de realmente irritar um árbitro estatístico! Um exemplo por resposta, …

2
A remoção do termo de interceptação estatisticamente significativo aumenta no modelo linear
Em um modelo linear simples com uma única variável explicativa, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Acho que remover o termo de interceptação melhora muito o ajuste (o valor de varia de 0,3 a 0,9). No entanto, o termo de interceptação parece ser estatisticamente significativo.R2R2R^2 Com interceptação: Call: …

3
Descida em gradiente em lote versus descida em gradiente estocástico
Suponha que tenhamos algum conjunto de treinamento para . Suponha também que executemos algum tipo de algoritmo de aprendizado supervisionado no conjunto de treinamento. As hipóteses são representadas como . Precisamos encontrar os parâmetros que minimizem a "distância" entre e . Seja(x(i),y(i))(x(i),y(i))(x_{(i)}, y_{(i)})i=1,…,mi=1,…,mi = 1, \dots, mhθ(x(i))=θ0+θ1x(i)1+⋯+θnx(i)nhθ(x(i))=θ0+θ1x(i)1+⋯+θnx(i)nh_{\theta}(x_{(i)}) = \theta_0+\theta_{1}x_{(i)1} + …




25
Localizando amostras de dados disponíveis gratuitamente
Eu tenho trabalhado em um novo método para analisar e analisar conjuntos de dados para identificar e isolar subgrupos de uma população sem conhecer as características de nenhum subgrupo. Embora o método funcione bem o suficiente com amostras de dados artificiais (ou seja, conjuntos de dados criados especificamente com o …






3
Explicação intuitiva da raiz da unidade
Como você explicaria intuitivamente o que é uma raiz unitária, no contexto do teste de raiz unitária? Estou pensando em maneiras de explicar, da mesma maneira que fundei nesta questão . O caso da raiz unitária é que eu sei (a propósito, pouco) que o teste da raiz unitária é …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.