Considerando outro critério, acho que, em alguns casos, o uso do Python pode ser muito superior ao R para Big Data. Conheço o amplo uso do R em materiais educacionais de ciência de dados e as boas bibliotecas de análise de dados disponíveis para ele, mas às vezes isso depende apenas da equipe.
Na minha experiência, para pessoas já familiarizadas com programação, o uso de Python oferece muito mais flexibilidade e aumento de produtividade em comparação com uma linguagem como R, que não é tão bem projetada e poderosa em comparação com Python em termos de linguagem de programação. Como prova, em um curso de mineração de dados na minha universidade, o melhor projeto final foi escrito em Python, embora os outros tenham acesso à rica biblioteca de análise de dados de R. Ou seja, às vezes a produtividade geral (considerando materiais de aprendizagem, documentação etc.) para Python pode ser melhor que R, mesmo na falta de bibliotecas de análise de dados para finalidades especiais para Python. Além disso, existem alguns bons artigos explicando o ritmo acelerado do Python na ciência de dados: Python Displacing R e Rich Scientific Data Structures in Python que em breve poderão preencher a lacuna de bibliotecas disponíveis para R.
Outro motivo importante para não usar o R é quando se trabalha com problemas de Big Data no mundo real, ao contrário dos problemas acadêmicos, há muita necessidade de outras ferramentas e técnicas, como análise de dados, limpeza, visualização, sucateamento na Web e muitas outras que são muito mais fáceis usando uma linguagem de programação de uso geral. Pode ser por isso que o idioma padrão usado em muitos cursos do Hadoop (incluindo o curso on-line do Udacity ) é Python.
Editar:
Recentemente, a DARPA também investiu US $ 3 milhões para ajudar a financiar os recursos de processamento e visualização de dados do Python para trabalhos de big data, o que é claramente um sinal do futuro do Big Data em Big Data. ( detalhes )