Existem diferenças nas abordagens bayesiana e freqüentista da AED?

Simplificando: existem diferenças nas abordagens bayesiana e freqüentista da análise exploratória de dados?

Não conheço nenhum viés inerente nos métodos de EDA, pois um histograma é um histograma, um gráfico de dispersão é um gráfico de dispersão etc., nem encontrei exemplos de diferenças em como a EDA é ensinada ou apresentada (ignorando um artigo particularmente teórico de A. Gelman) . Finalmente, olhei para o CRAN, o árbitro de todas as coisas aplicadas: não encontrei pacotes adaptados a uma abordagem bayesiana. No entanto, eu pensei que o CV poderia ter algumas pessoas que poderiam esclarecer isso.

Por que deveria haver diferenças?

Para iniciantes:

Ao identificar distribuições anteriores apropriadas, não se deve investigar isso visualmente?
Ao resumir os dados e sugerir a utilização de um modelo freqüentista ou bayesiano, a EDA não deveria sugerir que direção seguir?
As duas abordagens têm diferenças muito claras sobre como lidar com modelos de mistura. Identificar que uma amostra provavelmente provém de uma mistura de populações é desafiador e está diretamente relacionado à metodologia usada para estimar os parâmetros da mistura.
Ambas as abordagens incorporam modelos estocásticos e a seleção do modelo é orientada pela compreensão dos dados. Dados mais complexos ou modelos mais complexos exigem mais tempo na EDA. Com tais distinções entre modelos estocásticos ou processos geradores, existem diferenças nas atividades de EDA; portanto, não deveriam existir distinções decorrentes de diferentes abordagens estocásticas?

Nota 1: Não estou preocupado com as filosofias de nenhum dos "campos" - quero apenas solucionar quaisquer lacunas no meu kit de ferramentas e métodos EDA.

bayesian frequentist eda

— Iterador
fonte

Respostas:

Na minha opinião, Bayes vs frequentista é sobre inferência formal, e análise exploratória de dados também não é.

Certamente, quando se trata de modelo de avaliação / qualidade do ajuste e análise de sensibilidade, na qual eu classificaria seus pontos (1), (3) e (4), haverá diferenças em como alguém procederia, mas isso ocorre porque a natureza das diferenças entre os métodos de análise e computacional e não sobre a filosofia.

Em relação ao seu (2), geralmente não vejo os resultados da AED apontando você para a abordagem bayesiana ou frquentista, mas acho que esse era o objetivo do estudo que mais importava.

Para mim, pessoalmente, a AED (além de uma profunda introspecção) me indicaria um modelo, e se eu pudesse encontrar uma abordagem freqüentista natural que respondesse razoavelmente bem à pergunta científica, eu aceitaria isso, mas se pela natureza da situação , nenhum método frequentista funcionaria bem e, se houvesse um razoável razoável, eu usaria Bayes.

— Karl
fonte

(+1) Muito bem dito - especialmente "A EDA (mais a introspecção profunda) me indicaria um modelo"

— suncoolsu 03/09/11

+1 também. A EDA realmente não é sobre escolher uma perspectiva, é sobre entender seus dados para tomar decisões mais informadas.

— Fomite

+1 Para uma boa resposta. Infelizmente, acho que a pergunta original foi mal compreendida. Eu não estava perguntando sobre o uso da EDA para decidir entre modelos bayesianos ou frequentistas. Precisarei revisar como redigi isso, se parecer que várias pessoas têm o mesmo mal-entendido.

— Iterator

@Iterator Entendo sua principal pergunta: existem diferenças entre as abordagens bayesianas e freqüentistas da EDA? Minha resposta para isso é: não; A EDA não é freqüentista nem bayesiana.

— Karl

Eu acho que minha definição de "análise exploratória de dados" é mais restrita que a sua. Na minha opinião, toda boa análise de dados envolve exploração. O que distingue "análise exploratória de dados" é a falta de um modelo ou qualquer esforço em direção à inferência formal.

— Karl

Eu acho que a EDA ajuda você a construir um modelo, fazer algumas suposições e (se necessário) atualizar o modelo e suas suposições. Eu seleciono uma abordagem pragmática para usar no ajuste e avaliação do modelo.

— hbaghishani
fonte