Estou trabalhando em um projeto que pede aos colegas que compartilhem seus dados de texto originais para análise adicional usando técnicas de mineração de dados e, acho que seria apropriado anonimizar os nomes dos alunos com suas submissões.
Deixando de lado as melhores soluções de um URL em que os alunos enviam seus trabalhos e um script de back-end insere o ID anonimizado. Que tipo de soluções eu poderia instruir os alunos a implementar por conta própria para anonimizar seus próprios nomes?
Eu ainda sou um noob nesta área. Não sei quais são as normas. Eu estava pensando que a solução poderia ser um algoritmo de hash. Parece uma solução melhor do que inventar um nome falso, pois duas pessoas podem escolher o mesmo nome falso. As pessoas possíveis podem escolher o mesmo nome falso. Quais são algumas das preocupações das quais devo estar ciente?