Tudo volta ao reconhecimento de padrões. A razão pela qual temos um software de reconhecimento facial é que os rostos, na maioria das vezes, têm características semelhantes e a maioria das fotos que tiramos das pessoas as coloca de frente para a câmera. Mas isso ainda era muito difícil de desenvolver. Vamos considerar por um momento uma imagem de uma bomba atingindo um alvo povoado. Como você criaria um padrão para isso? A imagem teria uma explosão, bastante simples para um ser humano descobrir, mas bastante difícil de programar. Uma explosão pode ser de vários tamanhos, formas e cores. Digamos que você crie algum tipo de sistema baseado em regras. E se a imagem for uma explosão para o controle de avalanches nas montanhas? Isso não é violento ou ofensivo, mas conteria muitas das mesmas características.
Como muitas outras pessoas apontaram, é muito difícil definir obsceno. A Suprema Corte dos EUA tentou no caso Miller vs. Califórnia e, como resultado, temos o chamado Teste Miller, que consiste em três partes:
- Se "a pessoa comum, aplicando os padrões da comunidade contemporânea", descobriria que o trabalho, considerado como um todo, agrada ao interesse público,
- Se o trabalho descreve / descreve, de uma maneira claramente ofensiva, a conduta sexual definida especificamente pela lei estadual aplicável,
- Se a obra, tomada como um todo, não possui um valor literário, artístico, político ou científico sério
Agradável e ambíguo, torna as coisas um pouco difíceis de programar. A maioria dos sites que permitem o upload de imagens possui algum tipo de moderação humana. Por exemplo, todas as fotos postadas em sites de namoro online precisam seguir um conjunto de regras e precisam ser aprovadas manualmente.