Um nome: primeiro, possivelmente meio, e sobrenome.
Estou curioso para saber quantas informações você pode extrair de um nome, usando conjuntos de dados disponíveis ao público. Eu sei que você pode obter o seguinte com qualquer probabilidade entre baixa e alta (dependendo da entrada) usando os dados do censo dos EUA: 1) Sexo. 2) Corrida.
O Facebook, por exemplo, usou exatamente isso para descobrir, com um nível decente de precisão, a distribuição racial dos usuários do site (https://www.facebook.com/note.php?note_id=205925658858).
O que mais pode ser extraído? Não estou procurando nada específico, essa é uma pergunta muito aberta para amenizar minha curiosidade.
Meus exemplos são específicos dos EUA, portanto, assumiremos que o nome é o nome de alguém localizado nos EUA; mas, se alguém souber de conjuntos de dados disponíveis publicamente para outros países, também estou mais do que aberto a eles.
Não tenho certeza se este é o lugar certo para isso, se não for, eu apreciaria se alguém pudesse me indicar um lugar mais apropriado.
Espero que essa seja uma pergunta interessante e que este seja o local apropriado!