Quando eu estava ensinando estatística de nível de pós-graduação, dizia aos meus alunos: "Eu não me importo com o pacote que você usa, e você pode usar qualquer coisa para a lição de casa, pois espero que você forneça explicações substanciais e, se eu Vejo tr23y5m
nomes de variáveis em seus envios. Eu posso apoiar seu aprendizado muito bem no Stata e razoavelmente bem no R. Com o SAS, você está por conta própria, pois afirma ter feito um curso nele. Com o SPSS ou o Minitab, Deus o abençoe ". Imagino que os empregadores razoáveis pensariam o mesmo. O que importa é a sua produtividade em termos dos resultados do projeto. Se você pode atingir a meta em R com 40 horas de trabalho, tudo bem; se você pode consegui-lo em C ++ em 40 horas de trabalho, tudo bem; se você sabe fazer isso em R em 40 horas, mas seu supervisor deseja que você faça isso no SAS, e você precisa gastar 60 horas apenas para aprender alguns conceitos básicos e para onde vão os pontos-e-vírgulas, isso só pode ser sábio no contexto do quadro geral do restante do código no SAS ... e então o gerente não era muito sábio ao contratar um programador R.
Nesta perspectiva do custo total, R "livre" é um mito exagerado. Qualquer projeto sério requer código personalizado, apenas para a entrada de dados e formatação da saída, e esse é um custo diferente de zero para o tempo profissional. Se essa entrada e formatação de dados exigir 10 horas de código SAS e 20 horas de código R, R é um software mais caro na margem , como diria um economista, ou seja, em termos de custo adicional para produzir uma determinada funcionalidade . Se um grande projeto requer 200 horas do tempo do programador R e 100 horas do tempo do programador Stata para fornecer funcionalidade idêntica, o Stata é mais barato no geral, incluindo até a licença de US $ 1 mil que você precisa comprar. Seria interessante ver tais comparações diretas; Eu estava envolvido na reescrita de uma enorme bagunça de 2Mb de código SPSS que, segundo se dizia, foi acumulada por cerca de 10 pessoas-ano em ~ 150K de código Stata que rodava tão rápido, pode ser um pouco mais rápido; esse foi um projeto de cerca de 1 pessoa / ano. Não sei se esse índice de eficiência de 10: 1 é típico para comparações SPSS: Stata, mas não ficarei surpreso se fosse. Para mim, trabalhar com R é sempre uma grande despesa por causa dos custos de pesquisa: tenho que determinar qual dos cinco pacotes com nomes semelhantes faz o que preciso fazer e avaliar se o faz com confiabilidade o suficiente para que eu possa usá-lo no meu trabalho. Geralmente, significa que é mais barato escrever meu próprio código Stata em menos tempo do que eu gastaria para descobrir como fazer o R funcionar em uma determinada tarefa. Deve-se entender que essa é minha idiossincrasia pessoal; a maioria das pessoas neste site tem um uso melhor do que eu.
Engraçado que seu professor prefere Stata ou GAUSS a R porque "R não foi escrito por economistas". Nem Stata ou GAUSS; eles são escritos por cientistas da computação usando as ferramentas dos cientistas da computação. Se o seu professor obtém idéias sobre programação no CodeAcademy.com, isso é melhor do que nada, mas o desenvolvimento de software de nível profissional é tão diferente de digitar na caixa de texto do CodeAcademy.com, pois dirigir um caminhão de carga é diferente de andar de bicicleta. (Stata foi iniciado por um economista do trabalho convertido em cientista da computação, mas ele não faz essa coisa de econometria do trabalho há cerca de 25 anos.)
Atualização : Como AndyW comentou abaixo, você pode escrever um código terrível em qualquer idioma. A questão do custo torna-se então, qual idioma é mais fácil de depurar. Para mim, isso parece uma combinação de quão precisa e informativa é a saída, e quão fácil e transparente é a própria sintaxe, e é claro que não tenho uma boa resposta para isso. Por exemplo, o Python aplica o recuo do código, o que é uma boa ideia. Os códigos Stata e R podem ser dobrados entre colchetes e isso não funciona com o SAS. O uso de sub-rotinas é uma faca de dois gumes: o uso de *apply()
ad-hoc function
s em R é obviamente muito eficiente, mas mais difícil de depurar. Por um símbolo semelhante, os Stata local
s podem mascarar quase tudo, e o padrão de uma string vazia, embora útil, também pode levar a erros difíceis de capturar.