Como você observa com razão, hoje em dia "big data" é algo que todos querem dizer que têm, o que implica uma certa folga na maneira como as pessoas definem o termo. Geralmente, porém, eu diria que você certamente está lidando com big data se a escala é tal que não é mais possível gerenciar com tecnologias mais tradicionais, como RDBMS, pelo menos sem complementá-las com tecnologias de big data, como o Hadoop.
Qual é o tamanho dos seus dados para realmente ser esse o caso é discutível. Aqui está um post (um tanto provocador) que afirma que não é realmente o caso de menos de 5 TB de dados. (Para deixar claro, ele não afirma "Menos de 5 TB não é grande volume de dados", mas apenas "Menos de 5 TB não é grande o suficiente para que você precise do Hadoop".)
Mas, mesmo em conjuntos de dados menores, as tecnologias de big data como o Hadoop podem ter outras vantagens, incluindo adequar-se a operações em lote, jogar bem com dados não estruturados (além de dados cuja estrutura não é conhecida antecipadamente ou pode mudar), escalabilidade horizontal ( escalando adicionando mais nós em vez de aumentar seus servidores existentes) e (como um dos comentadores das notas postadas acima) a capacidade de integrar seu processamento de dados a conjuntos de dados externos (pense em um mapa-reduzir onde o mapeador faz uma chamada para outro servidor). Outras tecnologias associadas ao big data, como os bancos de dados NoSql, enfatizam o desempenho rápido e a disponibilidade consistente ao lidar com grandes conjuntos de dados, além de serem capazes de lidar com dados semiestruturados e fazer a escala horizontal.
Obviamente, os RDBMS tradicionais têm suas próprias vantagens, incluindo garantias ACID (Atomicidade, Consistência, Isolamento, Durabilidade) e melhor desempenho para determinadas operações, além de serem mais padronizados, mais maduros e (para muitos usuários) mais familiares. Portanto, mesmo para dados indiscutivelmente "grandes", pode fazer sentido carregar pelo menos uma parte de seus dados em um banco de dados SQL tradicional e usá-lo em conjunto com as tecnologias de big data.
Portanto, uma definição mais generosa seria a de que você possui big data, desde que seja grande o suficiente para que as tecnologias de big data ofereçam algum valor agregado. Mas, como você pode ver, isso pode depender não apenas do tamanho dos seus dados, mas também de como você deseja trabalhar com eles e que tipo de requisitos você possui em termos de flexibilidade, consistência e desempenho. Como você está usando seus dados é mais relevante para a questão do que o que você está usando-o para (por exemplo, mineração de dados). Dito isto, usos como mineração de dados e aprendizado de máquina são mais propensos a produzir resultados úteis se você tiver um conjunto de dados grande o suficiente para trabalhar.