Eu uso SAS
há 15 anos e comecei a usar R
seriamente nos últimos 6 meses, com alguns ajustes nele por alguns anos antes disso. Do ponto de vista da programação, R
as manipulações de dados são feitas diretamente, não há procedimentos DATA
ou equivalentes PROC SQL
porque elas não são necessárias (a última sendo mais eficiente SAS
quando há muita manipulação de dados a partir de fontes de dados externas, por exemplo, dados administrativos). Isso significa que, agora estou entendendo, a manipulação de dados é mais rápida R
e requer muito menos código.
O principal problema que encontrei é a memória. Nem todos os pacotes R permitem WEIGHT
especificações de tipo; portanto, se você tiver SAS
conjuntos de dados com variáveis usadas em FREQ
ou REPLICATE
instruções, poderá haver problemas. Eu observei os pacotes ff
e bigmemory
no R, mas eles não parecem ser compatíveis com todos os pacotes R; portanto, se você tiver conjuntos de dados muito grandes que exijam análises relativamente incomuns e que tenham sido agregados, poderá haver problemas com a memória.
Para automação, se você tiver SAS macros
, poderá programar o equivalente R
e executar como lote.
Para codificação R
, eu estava usando Notepad++
e definindo o idioma para R
, e agora estou descobrindo as alegrias de R Studio
. Ambos os produtos são gratuitos e marcam o idioma como a SAS
GUI de sintaxe aprimorada (só usei a tela de sintaxe SAS
).
Existe um site e um livro relacionado para as pessoas que trocam de SAS
para R
. Eu os achei úteis para tentar descobrir como traduzir alguns SAS
comandos R
.
Update: uma coisa que me deixou maluco quando chegar a R
é que R
não assume tudo é um conjunto de dados ( data frame
no R
jargão), porque não é um pacote estatístico do modo que SAS
, SPSS
, Stata
, etc, são. Então, por exemplo, levei um tempo para que as if
instruções funcionassem porque eu continuava recebendo ajuda para if
declarações com vetores (ou talvez matrizes), enquanto eu precisava de uma if
declaração que funcionasse data frames
. Portanto, as páginas de ajuda provavelmente precisam ser lidas mais atentamente do que você normalmente, porque você precisará verificar se o comando que deseja executar funcionará com o tipo de objeto de dados que você possui.
O pouco que ainda me deixa maluco ao aprender um novo R
comando (por exemplo, método de análise em um pacote contribuído) é que a ajuda para comandos geralmente não é totalmente independente. Irei à página de ajuda para tentar aprender o comando e as notas de uso geralmente ...
contidas neles. Às vezes, tentar descobrir o que pode ou deve ir aonde ...
está me leva a um ciclo recursivo. A brevidade relativa das notas de ajuda, provenientes da SAS
qual fornece exemplos detalhados de sintaxe e exemplos trabalhados com uma explicação do estudo no exemplo, foi um choque bastante grande.