Ah, essa pergunta. Primeiro, deixe-me dizer que trabalho para uma empresa de validação de endereço, SmartyStreets, mas tentarei ser objetivo.
Os dados do geocódigo dos EUA geralmente vêm de duas fontes básicas, GRATUITA e CARA. Vamos lá um pouco.
Os dados geocódigos gratuitos são provenientes do US Census Bureau. Alguns dirão que se trata do USGS ou mesmo do USPS, mas a fonte principal é o US Census Bureau. Eles têm um conjunto de dados um tanto abrangente de coordenadas de segmentos de rua, chamados dados TIGER. Os dados do TIGER estão disponíveis gratuitamente para download (embora sejam necessárias muitas manipulações para torná-los utilizáveis). O USPS tentou vincular os dados do TIGER e mapeá-lo para códigos postais (que NÃO são limites geopolíticos, mas baseados em áreas de entrega do USPS). Existem muitos serviços diferentes que utilizam esses dados do TIGER como fonte de coordenadas geográficas. Eles usam algoritmos diferentes para determinar a posição de um endereço ao longo de um segmento de rua e, em seguida, interpolam o geocódigo com base nesse algoritmo. Devido ao menor custo dos dados e aos custos de licenciamento dos dados de origem (gratuitos), muitos serviços permitirão que os clientes armazenem os dados do geocódigo que fazem parte dos dados de saída. O SmartyStreets é um daqueles que acredita que você pode fazer o que quiser com os dados.
Dados de geocódigo não gratuitos vêm de várias fontes caras. Essas fontes geralmente compilam seus próprios dados, embora também aumentem esses dados com dados licenciados de outras fontes. Você tem fontes como googlemaps, nokia, navteq, bing maps, yahoo, mapquest ... (Sim, eu sei, algumas delas pertencem a outras.) Seus dados são muito mais caros de adquirir e sua licença geralmente proíbe clientes de armazenar os dados de resposta.
Portanto, você tem dados de origem gratuitos e dados de origem caros. Normalmente, esse custo é repassado na forma de licenciamento mais restritivo. Espero que ajude.
Aqui está uma pequena lista de provedores que permitem armazenar os dados de saída (certamente existem mais):
geocod.io smartystreets.com yaddress.net
A propósito, sou eu quem criou a tabela mencionada no post original. Trabalho com dados de endereço o dia inteiro na SmartyStreets.
--update-- @zsero Na verdade, acredito que dados semelhantes aos disponíveis no US Census Bureau estejam disponíveis em vários países. Austrália, por exemplo, então eu ouvi. No entanto, não é necessariamente o país de origem dos dados, mas o nível de precisão. Os dados do US Census Bureau, por exemplo, fornecem coordenadas geográficas bastante precisas para segmentos de ruas, mas não para endereços. A interpolação de endereço desse segmento de rua (ponto inicial ou final da rua) ao longo do arquivo de forma que designa a forma da rua é o que permite "adivinhar" onde o endereço pode estar ao longo da rua. Isso é muito bom para análise estatística. No entanto, para algo como pára-quedismo de precisão ou um ataque de míssil cirúrgico, isso não seria bom o suficiente. Você deseja dados de geocódigo no nível do telhado. TipicamenteEssa é a diferença entre os dados gratuitos e os caros.