Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



4
Problema com a prova da expectativa condicional como melhor preditor
Eu tenho um problema com a prova de E(Y|X)∈argming(X)E[(Y−g(X))2]E(Y|X)∈arg⁡ming(X)E[(Y−g(X))2]E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big] que muito provavelmente revelam um mal-entendido mais profundo de expectativas e expectativas condicionais. A prova que eu conheço é a seguinte (outra versão dessa prova pode ser encontrada aqui ) ===argming( X)E[ ( Y- g( …




3
Qual é a diferença prática entre regras de associação e árvores de decisão na mineração de dados?
Existe uma descrição realmente simples das diferenças práticas entre essas duas técnicas? Ambos parecem ser usados ​​para aprendizado supervisionado (embora as regras de associação também possam lidar com supervisão). Ambos podem ser usados ​​para previsão O mais próximo que encontrei de uma descrição 'boa' é do livro de texto Statsoft …


2
Uso mais eficaz da cor em mapas de calor / contorno
É bastante comum usar mapas de calor / contorno ao apresentar achados de EEG com frequência de tempo. O esquema de cores frequentemente escolhido (e um que eu gosto e uso) é o esquema de cores "jet" (consulte, por exemplo, EEG de frequência de pesquisa de imagens do Google ). …

1
O lmer () pode usar splines como efeitos aleatórios?
Digamos que estamos trabalhando em um modelo de efeitos aleatórios de alguns dados de contagem ao longo do tempo e queremos controlar algumas tendências. Normalmente, você faria algo como: lmer(counts ~ dependent_variable + (1+t+I(t^2)|ID), family="poisson") para incluir uma forma quadrática para t. É possível usar algumas técnicas de suavização mais …


2
Se o princípio da probabilidade colidir com a probabilidade freqüentista, descartamos um deles?
Em um comentário recentemente publicado aqui, um comentarista apontou para um blog de Larry Wasserman, que aponta (sem nenhuma fonte) que a inferência freqüentista colide com o princípio da probabilidade. O princípio da verossimilhança simplesmente diz que experimentos que produzem funções semelhantes de verossimilhança devem produzir inferência semelhante. Duas partes …


3
Interpretando três formas de um "modelo misto"
Há uma distinção que está me atrapalhando com modelos mistos, e eu estou me perguntando se eu poderia ter alguma clareza sobre isso. Vamos supor que você tenha um modelo misto de dados de contagem. Há uma variável que você sabe que deseja como efeito fixo (A) e outra variável …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.