Respostas:
Certamente parece ter havido projetos de pesquisa envolvendo alguma forma de mineração de texto / recuperação de informações / etc. e sites StackExchange.
Alguns exemplos que consegui encontrar no google / google scholar (é improvável que esteja perto de uma lista exaustiva):
De maneira mais geral, os sistemas de resposta automática a perguntas ainda parecem ser uma área bastante ativa de pesquisa, não um problema trivial / "resolvido". O StackExchange pode ser uma fonte de dados para esses sistemas, mas também existem muitas outras fontes de dados (Wikipedia, Quora, etc.).
DuckDuckGo aprende respostas a perguntas técnicas do StackExchange. Digite uma pergunta técnica como "projetos em andamento usam stackexchange" no DuckDuckGo e ele fornecerá um resumo destacado da resposta no lado direito. E o duck possui uma API aberta para muitas (100s) mais fontes de dados para resposta a perguntas. Ou você pode ir diretamente para a API stackexchange .
Os projetos podem usar os dados da API aberta do SE, desde que estejam em conformidade com seus TOU . Basicamente, verifique se os usuários podem dizer que os dados vieram do Stack Exchange. A licença de direitos autorais também pode limitar sua capacidade de alterar o conteúdo do texto, digamos um resumo resumido aprendido. Talvez seja por isso que o Duck.com apenas destaque palavras-chave.
A lei de direitos de dados está em andamento, especialmente quando se trata dos dados que você enviou a um site e dos modelos de aprendizado de máquina derivados desses dados. As novas regras europeias de privacidade e dados permitem que você baixe ou exclua todos os dados enviados a um site, como troca de pilhas.