Estamos criando um site que coletará informações de localização (pontos) dos usuários. Estamos explorando técnicas para preservar a privacidade da localização dos usuários (por exemplo, muitas vezes os usuários compartilham seu endereço residencial, o que é sensível). Uma opção que veio à mente é ofuscar ou "misturar" os pontos antes de armazená-los no banco de dados, eliminando a necessidade de armazenar esses dados confidenciais.
Nossos requisitos básicos são, acredito:
Dado um único ponto ofuscado, não é possível derivar o ponto original dentro de (digamos) um quilômetro ou mais, mesmo considerando todos os metadados associados ao ponto (por exemplo, suponha que todo o banco de dados esteja comprometido).
Dado um conjunto arbitrariamente grande de pontos ofuscados correspondentes ao mesmo ponto original, ainda não é possível derivar o ponto original. (Por exemplo, uma técnica fácil seria adicionar um vetor aleatório ao ponto original, mas se você fizer isso o suficiente, os pontos ofuscados se agruparão em torno do ponto original.)
Seria bom se várias propriedades estatísticas fossem preservadas, embora eu não saiba quais propriedades são importantes nesse estágio. Por exemplo, prefiro que os pontos ofuscados se espalhem de uma maneira "natural" em vez de se acumularem em uma grade. No entanto, a privacidade é mais importante que isso.