Existem alguns recursos na Wikipedia, mas você teria que ter muita sorte de ter um domínio que seja uma simples palavra inglesa baunilha, comum o suficiente para aparecer aqui.
Você pode usar a ferramenta geradora de erros de digitação , ou algo parecido, e depois inserir cada uma delas no Google - que ironicamente tentará corrigir a ortografia - e usar a opção "pesquisar em vez de {versão incorreta}" e ver quantas pesquisas resultados obtidos para esse erro de ortografia específico:
Mostrando resultados para tratado
Procurar em vez disso tretise
Isso fornece cerca de 117.000 resultados para "tretise" vs. 17.800.000 resultados para "tratado". Então agora você tem uma idéia de quão comum esse erro de ortografia é em toda a Internet! Assim, você pode favorecer os erros de ortografia que ocorrem com mais frequência no mundo real.
Talvez o mais importante, também encontrei estas páginas:
http://how-to-spell.net/treatise
Como soletrar tratado?
Correto: tratado .
Erros de ortografia comuns: tretise - 100%
Que aparentemente faz usar dados reais!
Reunimos porcentagens de erros ortográficos em quase 15.423.252 sessões de verificação ortográfica no site spellchecker.net (janeiro de 2010 a junho de 2012).
Idealmente, eu adoraria se o Google compartilhasse dados com erros ortográficos, já que suspeito que eles tenham muito mais dados. Mas não tenho certeza se eles estão dispostos a compartilhar, talvez eles visualizem a correção ortográfica automática de termos de pesquisa digitados incorretamente. vantagem competitiva.
Seria incrível se eles fizeram!