Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


1
Detectando Outliers em Séries Temporais (LS / AO / TC) usando o pacote tsoutliers em R. Como representar outliers no formato de equações?
Comentários: Em primeiro lugar gostaria de dizer um grande obrigado ao autor do novo tsoutliers pacote que implementos de Chen e Liu detecção de séries temporais outlier, que foi publicado no Jornal da Associação Americana de Estatística em 1993 em software Open Source .RRR O pacote detecta iterativamente 5 tipos …


8
Passeio aleatório nas bordas de um cubo
Uma formiga é colocada no canto de um cubo e não pode se mover. Uma aranha começa no canto oposto e pode se mover pelas bordas do cubo em qualquer direção com igual probabilidade . Em média, quantos passos a aranha precisará para chegar à formiga?(x,y,z)(x,y,z)(x,y,z)1/31/31/3 (Isso não é tarefa …

1
Regressão logística: teste de qui-quadrado de anova vs. significância dos coeficientes (anova () vs resumo () em R)
Eu tenho um modelo GLM logístico com 8 variáveis. Fiz um teste do qui-quadrado em R anova(glm.model,test='Chisq')e 2 das variáveis ​​se mostraram preditivas quando ordenadas no início do teste e não tanto quando ordenadas na parte inferior. O summary(glm.model)sugere que os seus coeficientes são insignificantes (elevado valor de p). Nesse …

3
Contradição de significância na regressão linear: teste t significativo para um coeficiente versus estatística F não significativa
Estou ajustando um modelo de regressão linear múltipla entre 4 variáveis ​​categóricas (com 4 níveis cada) e uma saída numérica. Meu conjunto de dados tem 43 observações. A regressão fornece os seguintes valores de do teste para cada coeficiente de inclinação: . Assim, o coeficiente do 4º preditor é significativo …

3
Como provar que a função base radial é um núcleo?
Como provar que a função de base radial é um kernel? Tanto quanto eu entendo, para provar isso, temos que provar um dos seguintes:k(x,y)=exp(−||x−y||2)2σ2)k(x,y)=exp⁡(−||x−y||2)2σ2)k(x, y) = \exp(-\frac{||x-y||^2)}{2\sigma^2}) Para qualquer conjunto de vetores matriz = é semidefinido positivo.x1,x2,...,xnx1,x2,...,xnx_1, x_2, ..., x_nK(x1,x2,...,xn)K(x1,x2,...,xn)K(x_1, x_2, ..., x_n)(k(xi,xj))n×n(k(xi,xj))n×n(k(x_i, x_j))_{n \times n} Um mapeamento pode ser …
35 svm  kernel-trick 



3
O que é erro padrão residual?
Ao executar um modelo de regressão múltipla em R, uma das saídas é um erro padrão residual de 0,0589 em 95.161 graus de liberdade. Eu sei que os 95.161 graus de liberdade são dados pela diferença entre o número de observações na minha amostra e o número de variáveis ​​no …




3
R - Confuso com Terminologia Residual
Erro quadrático médio da raiz soma residual de quadrados erro padrão residual erro quadrático médio erro de teste Eu achava que costumava entender esses termos, mas quanto mais eu faço problemas estatísticos, mais me confundei com o que acho. Gostaria de alguma garantia e um exemplo concreto Posso encontrar facilmente …

2
Modelo de efeitos mistos com aninhamento
Eu tenho dados coletados de um experimento organizado da seguinte maneira: Dois locais, cada um com 30 árvores. 15 são tratados, 15 são controle em cada local. De cada árvore, amostramos três pedaços do caule e três pedaços das raízes, de modo que 6 amostras de nível 1 por árvore …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.