Existe alguma literatura que enumere as características dos algoritmos que lhes permitam ser explicáveis?
A única literatura que conheço é o artigo recente de Ribero, Singh e Guestrin. Eles primeiro definem a explicabilidade de uma única previsão:
Ao “explicar uma previsão”, queremos dizer apresentar artefatos textuais ou visuais que fornecem entendimento qualitativo do relacionamento entre os componentes da instância (por exemplo, palavras no texto, manchas na imagem) e a previsão do modelo.
Os autores elaboram ainda mais o que isso significa para exemplos mais concretos e, em seguida, usam essa noção para definir a explicabilidade de um modelo. Seu objetivo é tentar, por assim dizer, acrescentar explicabilidade artificialmente a modelos intransparentes, em vez de comparar a explicabilidade dos métodos existentes. De qualquer forma, o artigo pode ser útil, pois tenta introduzir uma terminologia mais precisa em torno da noção de "explicabilidade".
Existem modelos de aprendizado de máquina comumente aceitos como representando uma boa troca entre os dois?
Concordo com a @Winter que a rede elástica para regressão (não apenas logística) pode ser vista como um exemplo de um bom compromisso entre a precisão da previsão e a explicabilidade.
Para um tipo diferente de domínio de aplicativo (série temporal), outra classe de métodos também oferece um bom compromisso: Modelagem Bayesiana de Séries Temporais Estruturais. Ele herda a explicabilidade da modelagem de séries temporais estruturais clássicas e alguma flexibilidade da abordagem bayesiana. Semelhante à regressão logística, a explicabilidade é ajudada pelas equações de regressão usadas para a modelagem. Veja este documento para uma boa aplicação em marketing e outras referências.
Relacionado ao contexto bayesiano que acabamos de mencionar, você também pode querer olhar para modelos gráficos probabilísticos. Sua explicabilidade não se baseia em equações de regressão, mas em formas gráficas de modelagem; veja "Modelos Gráficos Probabilísticos: Princípios e Técnicas", de Koller e Friedman, para uma ótima visão geral.
Não tenho certeza se podemos nos referir aos métodos bayesianos acima como uma "boa troca geralmente aceita". Eles podem não ser suficientemente conhecidos para isso, especialmente em comparação com o exemplo de rede elástica.