No Cassandra, cada linha (endereçada por uma chave) contém uma ou mais "colunas". As próprias colunas são pares de valores-chave. Os nomes das colunas não precisam ser predefinidos, ou seja, a estrutura não é fixa. As colunas em uma linha são armazenadas em ordem de classificação de acordo com suas chaves (nomes).
Em alguns casos, você pode ter um grande número de colunas em uma linha (por exemplo, para atuar como um índice para habilitar determinados tipos de consulta). O Cassandra pode lidar com essas estruturas grandes com eficiência e você pode recuperar intervalos específicos de colunas.
Existe um outro nível de estrutura (não tão comumente usado) chamado supercolunas, onde uma coluna contém (sub) colunas aninhadas.
Você pode pensar na estrutura geral como um hashtable / dicionário aninhado, com 2 ou 3 níveis de chave.
Família de coluna normal:
row
col col col ...
val val val ...
Família de super coluna:
row
supercol supercol ...
(sub)col (sub)col ... (sub)col (sub)col ...
val val ... val val ...
Existem também estruturas de nível superior - famílias de colunas e espaços-chave - que podem ser usados para dividir ou agrupar seus dados.
Veja também esta pergunta: Cassandra: O que é uma subcoluna
Ou os links de modelagem de dados de http://wiki.apache.org/cassandra/ArticlesAndPresentations
Re: comparação com bancos de dados orientados a documentos - os últimos geralmente inserem documentos inteiros (normalmente JSON), enquanto no Cassandra você pode endereçar colunas individuais ou supercolunas e atualizá-las individualmente, ou seja, elas funcionam em um nível diferente de granularidade. Cada coluna tem seu próprio carimbo de data / hora / versão separado (usado para reconciliar atualizações no cluster distribuído).
Os valores da coluna Cassandra são apenas bytes, mas podem ser digitados como texto ASCII, UTF8, números, datas etc.
Claro, você poderia usar o Cassandra como um armazenamento de documento primitivo inserindo colunas contendo JSON - mas você não obteria todos os recursos de um armazenamento orientado a documentos real.