Manipulando grandes conjuntos de dados em R - tutoriais, práticas recomendadas etc.


11

Eu sou um R noob que é obrigado a fazer vários tipos de análise em grandes conjuntos de dados em R. Então, enquanto olhava este site e outros lugares, me pareceu que há muitos problemas esotéricos e menos conhecidos envolvidos aqui - como qual pacote usar quando, quais transformações (não) se aplicam aos dados etc.

Só estou me perguntando se existe um livro / tutorial / guia que desmistifica tudo isso e apresenta as informações de maneira sistemática? Prefiro fazer isso em vez de olhar em volta e coletar informações de diferentes fontes online.

Desde já, obrigado.



1
Pode ajudar a compartilhar alguns exemplos de que tipo de análise você deseja fazer e como são os seus dados. Estatísticas simples, como médias ou regressões complexas? 200 variáveis ​​em mil linhas, ou 4 variáveis ​​e 20 milhões de linhas?
PaulHurleyuk 9/09/11

1
Se você tem realmente "grandes" conjuntos de dados, talvez deva dar uma olhada nos bancos de dados relacionais. Um ponto de partida para isso pode ser o manual "Importação / Exportação de Dados R" enviado com a RNB. O manual também está disponível na seção "Manuais" do site da R.

1
Primeiro, uma pergunta importante: o que você quer dizer com amplo e o que você quer fazer?
Fomite

Respostas:


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.