Os proponentes das linguagens de programação funcional afirmam que a programação funcional facilita o raciocínio sobre o código. Aqueles que são a favor de linguagens de tipo estaticamente dizem que seus compiladores detectam erros suficientes para compensar a complexidade adicional dos sistemas de tipos. Mas tudo o que li sobre esses tópicos é baseado em argumentos racionais, não em dados empíricos.
Existem estudos empíricos sobre quais efeitos as diferentes categorias de linguagens de programação têm sobre taxas de defeitos ou outras métricas de qualidade?
(As respostas a essa pergunta parecem indicar que não existem estudos, pelo menos não para o debate dinâmico versus estático)