Todas essas coisas devem ser documentadas em detalhes, embora, quando a operação for padrão para o sistema operacional, servidor de aplicativos, servidor da Web, etc., você possa assumir que as operações de TI as pessoas sabem como fazer isso.
Instalação: documente tudo sobre como está instalado e configurado, incluindo como saber se está funcionando corretamente.
Conte-nos sobre a arquitetura, especialmente sobre a comunicação entre vários componentes da solução (por exemplo, intervalo de portas - os mecanismos RPC costumam usar um intervalo de portas - precisamos saber qual é o intervalo e quando o aplicativo pode ficar sem portas).
Correção: documente qualquer coisa específica do aplicativo - o que precisa ser desligado antes da correção e quaisquer ações de acompanhamento após a correção (caches, índices, proxies que talvez precisem ser limpos ou reconstruídos).
Manutenção: documente como é a operação normal e anormal - quais filas e outras coisas devem ser monitoradas e qual é o intervalo normal delas.
Diga-nos como gerenciar os dados - especialmente tabelas e arquivos que crescem sem limites (por exemplo, arquivos de log e históricos de transações). Como elas devem ser eliminadas e qual o impacto da remoção de entradas antigas? (nos relatórios etc).
Diga-nos como executar ações padrão de gerenciamento "comercial como de costume" / na vida útil - isso pode incluir ou modificar contas de usuário, por exemplo.
Conte-nos sobre outras ações de gerenciamento regulares que possam ser necessárias (por exemplo, quais certificados são usados e o que fazer quando expiram).
Para todas as alterações, diga-nos como revertê-las (nem todas as alterações são bem-sucedidas). E diga-nos que você testou os planos de reversão!
Diagnóstico: Documente os formatos e locais dos arquivos de log e TODAS as mensagens de erro do aplicativo que possam aparecer, dizendo o que significa a mensagem de erro está errada e o que pode ser necessário alterar para corrigi-la. Nunca use a mesma mensagem de erro para dois eventos diferentes.
Abatido e inicializado: Como, em que ordem, quaisquer procedimentos especiais (por exemplo, permitir que os servidores drenem as conexões antes de desligá-las).
Discordo totalmente de que a melhor maneira de fazer isso é lançar o aplicativo por cima do muro e permitir que o pessoal de TI trabalhe no que é necessário. A documentação operacional (e, em geral, os recursos de gerenciabilidade do aplicativo) precisa ser pensada com antecedência.