Eu tenho várias descrições de trabalho inseridas pelos usuários. Há todo tipo de erro de ortografia e dados incorretos. ou seja:
...
tulane univ hospital
tulip
tullett prebon
...
weik investment
weill cornell university medical center
weis
weiss waldee hohimer dds
welded constrction l.p.
welder
welder
welder
...
Quais etapas você adotaria para "aumentar" esses valores com informações relacionadas ao trabalho?
O melhor que consigo pensar é entregá-lo ao wolfram alpha. Mas eu me pergunto se existem outras técnicas acessíveis que eu possa utilizar usando python.
Atualização: eu descobri que existe uma Classificação Ocupacional Padrão , eu realmente gostaria de associar o nome ao SOC e o SOC a uma faixa de salários médios.