É bom ter um grande número de compartimentos, por exemplo, compartimentos para todos os valores possíveis, sempre que houver suspeita de que os detalhes de um histograma não sejam ruído, mas estrutura fina interessante ou importante.
Isso não está diretamente conectado à motivação precisa para esta pergunta, desejando uma regra automatizada para um número ideal de posições, mas é relevante para a questão como um todo.
Vamos pular imediatamente para exemplos. Na demografia, o arredondamento das idades relatadas é comum, principalmente, mas não apenas em países com alfabetização limitada. O que pode acontecer é que muitas pessoas não sabem sua data exata de nascimento ou existem razões sociais ou pessoais para subestimar ou exagerar sua idade. A história militar está cheia de exemplos de pessoas contando mentiras sobre sua idade, para evitar ou procurar serviço nas forças armadas. De fato, muitos leitores conhecerão alguém que é muito tímido ou de outra forma pouco sincero sobre sua idade, mesmo que não mentam sobre isso em um censo. O resultado líquido varia, mas como já está implícito, geralmente é arredondado, por exemplo, idades que terminam em 0 e 5 são muito mais comuns do que idades de um ano a menos ou mais.
∘⋯
Aliás, observar os últimos dígitos dos dados relatados é um método simples e bom de verificar dados fabricados, muito mais fácil de entender e menos problemático do que o exame atual dos primeiros dígitos com um apelo à Lei de Benford.
O resultado para os histogramas agora deve estar claro. Uma apresentação tipo espigão pode servir para mostrar, ou mais geralmente para verificar, esse tipo de estrutura fina. Naturalmente, se nada de interessante for discernível, o gráfico pode ser de pouca utilidade.
Um exemplo mostra o acúmulo de idades no censo de Gana em 1960. Consulte http://www.stata.com/manuals13/rspikeplot.pdf
Houve uma boa revisão das distribuições dos dígitos finais em
Preece, DA 1981. Distribuições dos dígitos finais nos dados. The Statistician 30: 31-60.
Uma observação sobre terminologia: algumas pessoas escrevem sobre os valores exclusivos de uma variável quando falam melhor sobre os valores distintos de uma variável. Os dicionários e guias de uso ainda aconselham que "único" significa que ocorre apenas uma vez. Assim, as distintas idades relatadas de uma população podem ser, em anos, 0, 1, 2 etc. etc., mas a grande maioria dessas idades não será exclusiva de uma pessoa.