Estou no processo de preparação para ministrar um curso introdutório sobre ciência de dados usando a linguagem de programação R. Meu público é formado por estudantes de graduação em negócios. Um estudante de graduação em negócios típico não tem experiência em programação de computadores, mas cursou algumas classes que usam o Excel.
Pessoalmente, estou muito confortável com R (ou outras linguagens de programação) porque me formei em ciência da computação. No entanto, tenho a sensação de que muitos de meus alunos se sentirão desconfiados de aprender uma linguagem de programação porque isso pode parecer difícil para eles.
Eu tenho alguma familiaridade com o Excel e acredito que, embora o Excel possa ser útil para ciência de dados simples, é necessário que os alunos aprendam uma linguagem de programação séria para ciência de dados (por exemplo, R ou Python). Como convencer a mim e aos alunos que o Excel é insuficiente para um estudante sério de negócios que estuda ciência de dados e que é necessário que eles aprendam alguma programação?
Editado em resposta ao comentário
Aqui estão alguns dos tópicos que abordarei:
- Processamento e limpeza de dados
- Como manipular uma tabela de dados, por exemplo, selecionar um subconjunto de linhas (filtro), adicionar novas variáveis (alterar), classificar linhas por colunas
- Associações SQL usando o pacote dplyr
- Como desenhar gráficos (gráficos de dispersão, gráficos de barras, histogramas etc.) usando o pacote ggplot2
- Como estimar e interpretar modelos estatísticos, como regressão linear, regressão logística, árvores de classificação e vizinhos k-mais próximos
Como não conheço muito bem o Excel, não sei se todas essas tarefas podem ser realizadas facilmente no Excel.