Aprecio as outras respostas, mas parece-me que algum background topológico daria uma estrutura muito necessária para as respostas.
Definições
Vamos começar estabelecendo as definições dos domínios:
variável categórica é aquela cujo domínio contém elementos, mas não há relacionamento conhecido entre eles (portanto, temos apenas categorias). Os exemplos dependem do contexto, mas eu diria que, no caso geral, é difícil comparar os dias da semana: é segunda-feira antes de domingo; se sim, e a próxima segunda-feira? Talvez um exemplo mais fácil, mas menos usado, sejam as peças de roupa: sem fornecer algum contexto que daria sentido a uma ordem, é difícil dizer se as calças vêm antes dos saltadores ou vice-versa.
A variável ordinal é aquela que tem uma ordem total definida sobre o domínio, ou seja, para cada dois elementos do domínio, podemos dizer que eles são idênticos ou um é maior que o outro. Uma escala Likert é um bom exemplo de definição de uma variável ordinal. "concordo um pouco" é definitivamente mais próximo de "concordo totalmente" do que "discordo".
A variável de intervalo é aquela cujo domínio define distâncias entre elementos (uma métrica ), permitindo assim definir intervalos.
Exemplos de domínio
Como o conjunto mais comum que usamos, os números naturais e reais têm ordem e métricas totais padrão. É por isso que precisamos ter cuidado ao atribuir números às nossas categorias. Se não formos cuidadosos em desconsiderar a ordem e a distância, praticamente convertemos nossos dados categóricos em dados de intervalo. Quando alguém usa um algoritmo de aprendizado de máquina sem saber como ele funciona, corre o risco de fazer tais suposições de má vontade, potencialmente invalidando seus próprios resultados. Por exemplo, os algoritmos mais populares de aprendizado profundo trabalham com números reais, aproveitando o intervalo e as propriedades contínuas. Outro exemplo, pense nas escalas Likert de 5 pontos, e como a análise que aplicamos nelas pressupõe que a distância entre concordo plenamente e concordoé o mesmo que discordar e nem concordar nem discordar . Difícil argumentar sobre esse relacionamento.
Outro conjunto com o qual frequentemente trabalhamos é as cordas . Existem várias métricas de similaridade de string que são úteis ao trabalhar com strings. No entanto, estes nem sempre são úteis. Por exemplo, para endereços, John Smith Street e John Smith Road são bastante próximos em termos de similaridade de cadeias, mas obviamente representam duas entidades diferentes que podem estar separadas por quilômetros.
Estatísticas resumidas
Ok, agora vamos ver como algumas estatísticas resumidas se encaixam nisso. Como a estatística trabalha com números, suas funções são bem definidas em intervalos. Mas vamos ver exemplos sobre se / como podemos generalizá-los para dados categóricos ou ordinais:
- mode - tanto ao trabalhar com dados categóricos quanto ordinais, podemos dizer qual elemento é usado com mais frequência. Então nós temos isso. Também podemos derivar todas as outras medidas que o @Maddenker lista em suas respostas. O intervalo de confiança do @gung também pode ser útil.
- mediana - como @ peter-flom diz, desde que você tenha um pedido, você pode derivar sua mediana.
- média , mas também desvio padrão, percentis etc. - você os obtém apenas com dados de intervalo, devido à necessidade de uma métrica de distância.
Exemplo de contextualidade dos dados
No final, quero enfatizar novamente que a ordem e as métricas definidas em seus dados são muito contextuais. Isso deve estar óbvio agora, mas deixe-me dar um último exemplo: ao trabalhar com localizações geográficas, temos várias maneiras diferentes de abordá-las:
- se estivermos interessados na distância entre eles, podemos trabalhar com sua geolocalização, o que basicamente nos dá um espaço numérico bidimensional, portanto intervalo.
- se estivermos interessados na parte do relacionamento, podemos definir uma ordem total (por exemplo, uma rua faz parte de uma cidade, duas cidades são iguais, um continente contém um país)
- se estivermos interessados em saber se duas cadeias representam o mesmo endereço, poderíamos trabalhar com alguma distância de cadeia que tolerasse erros de ortografia e trocando posições de palavras, mas certifique-se de distinguir diferentes termos e nomes. Isso não é uma coisa fácil, mas apenas para defender o caso.
- Existem muitos outros casos de uso que todos nós encontramos diariamente, onde nada disso faz sentido. Em alguns deles, nada mais há a fazer do que tratar os endereços como apenas categorias diferentes; em outros, tudo se resume a modelagem e pré-processamento de dados muito inteligentes.