Perguntas com a marcação «outliers»

Um outlier é uma observação que parece incomum ou não está bem descrita em relação a uma simples caracterização de um conjunto de dados. Uma possibilidade desconcertante é que esses dados venham de uma população diferente daquela que se pretende estudar.

4
Detectando outliers usando desvios padrão
Seguindo a minha pergunta aqui , pergunto-me se há pontos de vista fortes a favor ou contra o uso do desvio padrão para detectar discrepâncias (por exemplo, qualquer ponto de dados com mais de 2 desvios padrão é discrepante). Eu sei que isso depende do contexto do estudo, por exemplo, …
27 outliers 


4
Por que o RANSAC não é mais amplamente usado em estatística?
Vindo do campo da visão computacional, frequentemente utilizei o método RANSAC (Random Sample Consensus) para ajustar modelos a dados com muitos outliers. No entanto, nunca o vi usado por estatísticos, e sempre tive a impressão de que não era considerado um método "estatisticamente correto". Por que? É de natureza aleatória, …

3
Aplicação de wavelets a algoritmos de detecção de anomalias baseados em séries temporais
Comecei a trabalhar nos tutoriais de mineração de dados estatísticos de Andrew Moore (altamente recomendado para quem mais se aventurar nesse campo). Comecei lendo este PDF extremamente interessante, intitulado "Visão geral introdutória dos algoritmos de detecção de anomalias baseados em séries temporais", nos quais Moore acompanha muitas das técnicas usadas …



2
Distribuição da distância de Mahalanobis no nível de observação
Se eu tiver uma amostra de amostra normal multivariada X1,…,Xn∼Np(μ,Σ)X1,…,Xn∼Np(μ,Σ)X_1, \ldots, X_n \sim N_p(\mu,\Sigma) e definir d2i(b,A)=(Xi−b)′A−1(Xi−b)di2(b,A)=(Xi−b)′A−1(Xi−b)d_i^2(b,A) = (X_i - b)' A^{-1} (X_i - b) (que é uma distância de Mahalanobis [ao quadrado] de um ponto de amostra ao vetor aaa usando a matriz para ponderação),AAAqual é a distribuição de …


1
Detectando outliers em dados de contagem
Eu tenho o que eu ingenuamente pensei ser um problema bastante direto que envolve a detecção de valores extremos para muitos conjuntos diferentes de dados de contagem. Especificamente, quero determinar se um ou mais valores em uma série de dados de contagem são maiores ou menores que o esperado em …

3
Como avaliar a assimetria de um boxplot?
Como decidir a assimetria observando um boxplot construído com esses dados: 340, 300, 520, 340, 320, 290, 260, 330 Um livro diz: "Se o quartil inferior estiver mais distante da mediana do que o quartil superior, a distribuição será distorcida negativamente". Várias outras fontes disseram mais ou menos o mesmo. …

2
Bootstrapping - preciso remover os outliers primeiro?
Realizamos um teste de divisão de um novo recurso do produto e queremos avaliar se o aumento da receita é significativo. Definitivamente, nossas observações não são distribuídas normalmente (a maioria de nossos usuários não gasta e, naquelas que gastam, é fortemente direcionada a muitos pequenos gastadores e alguns grandes). Decidimos …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.