Eu sou o fundador do IPinfo , então definitivamente posso oferecer alguns detalhes sobre isso! Não existe um único método que usamos, ou uma única fonte de dados, para produzir nosso próprio banco de dados de geolocalização (ou qualquer outro conjunto de dados, como IP para empresa ou IP para operadora). É uma mistura de diversos conjuntos de dados, técnicas de processamento de dados e lições aprendidas há vários anos!
Algumas fontes de dados e técnicas pouco mencionadas incluem:
Feeds diretos dos ISPs. Nosso serviço processa cerca de 500 milhões de solicitações de API por dia e é usado em muitos sites populares. Portanto, os ISPs são incentivados a fornecer dados de geolocalização atualizados e precisos para que seus clientes tenham uma ótima experiência na web. Estamos trabalhando diretamente com mais e mais ISPs o tempo todo.
Dados de localização GPS. É possível coletar informações precisas de localização com GPS em dispositivos móveis. Você pode emparelhá-lo com o endereço IP e alguma inferência de topologia de rede para determinar o local dos intervalos de IP, com apenas algumas medidas.
Correções enviadas pelo usuário. Quando erramos o local (ou ele não foi atualizado após uma alteração), geralmente recebemos feedback dos usuários com rapidez e podemos corrigir manualmente o local ou ajustar nosso algoritmo para garantir que ele esteja localizado corretamente na próxima execução de nosso pipeline de processamento de dados.
Para o nosso conjunto de dados de IP para empresa, na verdade, coletamos todos os nomes de domínio todos os meses e fazemos referência cruzada dos dados que extraímos com informações de propriedade de IP, registros de registros e muito mais. Em seguida, também usamos os dados de raspagem de domínio para mostrar quais domínios estão hospedados em quais endereços IP e também em nosso classificador de tipo IP, junto com muitas outras fontes de dados, para determinar a probabilidade de um endereço IP ser usado principalmente como um provedor de serviços de Internet residencial, empresa ou provedor de hospedagem. Nós também analisar a estrutura de links dessas páginas, e mostrar alguns destes dados sobre host.io .