Compreendendo a teoria e as aplicações estatísticas


13

Recentemente, me formei com mestrado em modelagem médica e biológica, acompanhada de engenharia matemática como pano de fundo. Embora meu programa educacional incluísse uma quantidade significativa de cursos de estatística matemática (veja abaixo uma lista), que gerenciei com notas bastante altas, freqüentemente acabo completamente perdida olhando a teoria e as aplicações da estatística. Devo dizer que, comparada à matemática "pura", a estatística realmente faz pouco sentido para mim. Especialmente as notações e a linguagem usadas pela maioria dos estatísticos (incluindo meus ex-palestrantes) são irritantemente complicadas e quase nenhum dos recursos que eu vi até agora (incluindo a Wikipedia) tinha exemplos simples com os quais se poderia relacionar facilmente e associar à teoria apresentada. ..

Sendo este o pano de fundo; Também percebo a amarga realidade de que não posso ter carreira como pesquisador / engenheiro sem um forte domínio das estatísticas, especialmente no campo da bioinformática.

Eu esperava conseguir algumas dicas de estatísticos / matemáticos mais experientes. Como posso superar esse problema que mencionei acima? Você conhece algum bom recurso; como livros, e-books, cursos abertos (via iTunes ou OpenCourseware para ex) etc.

EDIT: Como mencionei, sou bastante tendenciosa (negativamente) em relação à maioria da literatura sob o título geral de estatística, e como não posso comprar vários livros de cursos grandes (e caros) por ramo de estatística, o que eu precisaria em termos de livro é algo semelhante ao que Tipler & Mosca é para a Física, mas para as estatísticas.

Para quem não conhece o Tipler; é um grande livro que abrange uma grande maioria dos assuntos que se pode encontrar durante os estudos superiores e os apresenta desde a introdução básica até detalhes um pouco mais profundos. Basicamente, um livro de referência perfeito, o comprei durante meu primeiro ano na universidade, ainda o uso de vez em quando.


Os cursos que fiz em estatística:

  • um grande curso de introdução,
  • processos estocásticos estacionários,
  • Processos de Markov,
  • Métodos de Monte Carlo
  • Análise de sobrevivência

Respostas:


4

Eu posso entender completamente sua situação. Embora eu seja aluno de doutorado, às vezes acho difícil relacionar teoria e aplicação. Se você está disposto a mergulhar na compreensão da teoria, é definitivamente gratificante pensar em problemas do mundo real. Mas o processo pode ser frustrante.

Uma das muitas referências de que gosto é a Análise de dados de Gelman e Hill, usando modelos hierárquicos / multiníveis . Eles evitam a teoria em que podem expressar o conceito subjacente usando simulações. Definitivamente, você será beneficiado por ter experiência no MCMC etc. Como você diz, você está trabalhando em bioinformática, provavelmente as Estratégias de Modelagem de Regressão da Harrell também são uma ótima referência.

Vou fazer deste um wiki da comunidade e deixar que outros adicionem.


Obrigado pela atenção no assunto. É bom ver que não sou o único a ficar confuso com as coisas. Dito isto, acho que você superestimou minha situação; enquanto eu fiz vários cursos e estou familiarizado com a existência de várias maneiras diferentes de análise estatística; eles nunca ficam comigo depois dos cursos. Alguns meses após os exames, fico pensando; "Eu já vi / ouvi isso em algum lugar, mas como funcionou realmente?" Isso para mim sugere que eu preciso derrubar tudo e começar a construí-lo com uma base mais forte.
posdef 02/02

Eu acrescentaria um retumbante "concordo" ao texto de Harrell (ortografia da nota). É excelente, assim como a combinação de dois pacotes do código R que o acompanha. Eu também acho que "Estatística Aplicada Moderna com S" de Venables e Ripley seria uma boa aquisição. Eu tinha uma formação em nível de mestrado (com graduação em física) antes de usar o MASS para aprender R. Há uma grande quantidade de sabedoria de aplicação nesse texto.
Dwin

O livro de regressão de Gelman é maravilhoso, ele explica tudo muito bem e fornece um código R que é realmente útil para verificar sua compreensão do material.
223116 richardorrisroe

2

Você está familiarizado com a análise de dados bayesiana (de Gelman, Carlin, Stern e Rubin)? Talvez seja disso que você precisa de uma dose.


2

Todos os problemas estatísticos resumem-se a seguir quatro etapas (que eu emprestei da @whuber responder em outra pergunta ):

  1. Estime o parâmetro.

  2. Avalie a qualidade dessa estimativa.

  3. Explore os dados.

  4. Avalie o ajuste.

Você pode trocar o parâmetro da palavra com o modelo da palavra .

Os livros de estatística geralmente apresentam os dois primeiros pontos para várias situações. O problema de cada aplicativo do mundo real exige uma abordagem diferente, portanto, um modelo diferente; portanto, grande parte dos livros acaba catalogando esses diferentes modelos. Isso tem um efeito indesejado de que é fácil se perder nos detalhes e perder a visão geral.

O grande livro que recomendo sinceramente é a estatística assintótica . Ele fornece um tratamento rigoroso do tópico e é matematicamente "puro". Embora seu título mencione estatísticas assintóticas, o grande segredo não contado é que a maioria dos métodos estatísticos clássicos é essencialmente baseada em resultados assintóticos.


2

Eu acho que a coisa mais importante aqui é desenvolver uma intuição sobre estatística e alguns conceitos estatísticos gerais. Talvez a melhor maneira de fazer isso seja ter algum domínio que você possa "possuir". Isso pode fornecer um ciclo de feedback positivo, no qual o entendimento sobre o domínio ajuda a entender mais sobre as estatísticas subjacentes, o que ajuda a entender mais sobre o domínio etc.

Para mim, esse domínio era estatísticas de beisebol. Eu entendi que um batedor que vai de 3 a 4 em um jogo não é um rebatedor "verdadeiro" .750. Isso ajuda a entender o ponto mais geral de que os dados de amostra não são iguais à distribuição subjacente. Eu também sei que ele provavelmente está mais perto de um jogador médio do que de um rebatedor 0,750, então isso ajuda a entender conceitos como regressão à média. A partir daí, posso chegar à inferência bayesiana completa, onde minha distribuição de probabilidade anterior tinha uma média da média do jogador de beisebol, e agora tenho 4 novas amostras para atualizar minha distribuição posterior.

Não sei qual é esse domínio para você, mas acho que seria mais útil do que um mero livro. Os exemplos ajudam a entender a teoria, o que ajuda a entender os exemplos. Um livro didático com exemplos é bom, mas, a menos que você possa torná-los "seus", pergunto-me se você obterá o suficiente deles.



1

Todo mundo aprende de maneira diferente, mas acho seguro dizer que exemplos, exemplos, exemplos ajudam muito nas estatísticas. Minha sugestão seria aprender R (apenas o básico é suficiente para ajudar bastante) e então você pode tentar todo e qualquer exemplo até que seus olhos sangrem. Você pode classificá-lo, ajustá-lo, plotá-lo, nomeá-lo. E, como R é voltado para estatísticas, à medida que você aprende R, você aprenderá estatísticas. Os livros que você listou podem ser atacados do ponto de vista "me mostre".

Como o R é gratuito e muito material de origem é gratuito, tudo que você precisa investir é seu tempo.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

Existem muitos bons livros sobre R que você pode comprar, aqui está um que eu usei:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Editar ============

Esqueci de adicionar alguns links. Se você estiver usando o Windows, um bom editor para alimentar R é o Tinn-R (outra pessoa pode adicionar links para editores em um Mac ou Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


obrigado pelos links, vou tentar examiná-los o máximo que puder nas próximas semanas ... Fui exposto ao R uma vez antes, no curso de análise de sobrevivência em que fizemos muita regressão multivariada (cox e aelen modelos) e um monte de outras coisas que eu realmente não consigo me lembrar. Minha impressão de R, como uma pessoa que está muito acostumada com o MATLAB, foi bastante negativa, mas eu tinha muito a ver com o fato de termos sido mais ou menos jogados para o fundo da piscina e depois esperávamos aprender a nadar por conta própria, o que naturalmente levou a me odiar o software a partir de então :) Hora de mudar que talvez
posdef

1

Pessoalmente, adorei isso, com uma mistura muito boa de teoria e aplicação (com muitos exemplos). Foi uma boa combinação com casella e berger para uma abordagem mais teórica. E para uma ampla visão geral do pincel, isso .


Ambos os livros parecem ter boas críticas sobre a amazon. Alguém pode acrescentar opiniões (talvez um pouco mais detalhadas) sobre elas? btw; por casella e berger você quer dizer "Inferência Estatística"?
posdef

Sim 'inferência estatística'. Para mim, um grande passo foi passar do entendimento de modelos de probabilidade para entender como usar dados para testar modelos e estimar parâmetros de modelos. Especialmente o livro de Davison realmente se concentra nesse ponto.
alwaysean
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.