Como a Entrega Contínua pode funcionar na prática?

22

A entrega contínua parece boa, mas meus anos de experiência em desenvolvimento de software sugerem que, na prática, ela não funciona.

(Editar: para deixar claro, eu sempre tenho muitos testes sendo executados automaticamente. Minha pergunta é sobre como obter a confiança necessária para entregar cada check-in, que eu entendo ser a forma completa do CD. A alternativa não são os ciclos de um ano São iterações toda semana (que alguns ainda consideram CD se feitas corretamente), duas semanas ou mês; incluindo um controle de qualidade antiquado no final de cada um, complementando os testes automatizados.)

A cobertura total do teste é impossível. Você precisa dedicar muito tempo - e tempo é dinheiro - para cada pequena coisa. Isso é valioso, mas o tempo pode ser gasto contribuindo para a qualidade de outras maneiras.
Algumas coisas são difíceis de testar automaticamente. Por exemplo, GUI. Mesmo o Selenium não informa se a sua GUI é instável. É difícil testar o acesso ao banco de dados sem equipamentos volumosos, e mesmo isso não cobre casos estranhos de esquina no armazenamento de dados. Da mesma forma segurança e muitas outras coisas. Somente o código da camada de negócios é efetivamente testável por unidade.
Mesmo na camada de negócios, a maioria dos códigos não possui funções simples cujos argumentos e valores de retorno podem ser facilmente isolados para fins de teste. Você pode gastar muito tempo criando objetos simulados, que podem não corresponder às implementações reais.
Os testes de integração / funcionais complementam os testes de unidade, mas demoram muito tempo para serem executados porque geralmente envolvem a reinicialização de todo o sistema em cada teste. (Se você não reinicializar, o ambiente de teste será inconsistente.)
A refatoração ou qualquer outra alteração quebra muitos testes. Você gasta muito tempo consertando-os. Se é uma questão de validar alterações significativas nas especificações, tudo bem, mas geralmente os testes são interrompidos devido a detalhes de implementação de baixo nível sem sentido, e não a coisas que realmente fornecem informações importantes. Freqüentemente, o aprimoramento é voltado para o retrabalho interno do teste, não para realmente verificar a funcionalidade que está sendo testada.
Os relatórios de campo sobre bugs não podem ser facilmente combinados com a micro-versão precisa do código.

continuous-integration continuous-delivery

— Joshua Fox
fonte

Funciona muito bem para o Etsy slideshare.net/OReillyOSCON/… !

— YoTsumi

4

A entrega contínua não requer testes (mas ajuda). Refere-se ao fato de que as coisas que você cria regularmente podem ser enviadas ao cliente, se necessário.

É interessante que suas objeções à entrega contínua se concentrem predominantemente nos testes como um elemento do CD. No entanto, essa é apenas uma parte do quebra-cabeça: você precisa de ferramentas internas competentes, desenvolvedores comprometidos com inspeções rigorosas de qualidade, uma abordagem de priorização abrangente em seus testes automatizados, sem mencionar um forte suporte organizacional. Isso pode ser feito, mas é preciso muita gente para se comprometer com a causa.

— Stephen Gross

1

@ Stephen Sim, estou focado em testes, porque estou de acordo em todos os outros aspectos. Também sou a favor dos testes. Só não vejo como você pode ter confiança suficiente para implantar cada check-in.

— 11609 Joshua Fox

@ Thorbjørn Ravn Andersen. Certamente, o CD parece exigir testes. Como você pode ter a confiança necessária para enviar automaticamente cada check-in sem ele.

— 11609 Joshua Fox

29

meus anos de experiência em desenvolvimento de software sugerem que, na prática, não pode funcionar.

Tentaste? Dave e eu escrevemos o livro com base em muitos anos de experiência coletiva, tanto de nós mesmos como de outras pessoas seniores da ThoughtWorks, realmente fazendo as coisas que discutimos. Nada no livro é especulativo. Tudo o que discutimos foi testado e testado, mesmo em grandes projetos distribuídos. Mas não sugerimos que você aceite isso com fé. Claro que você deve tentar e escreva o que acha que funciona e o que não funciona, incluindo o contexto relevante, para que outros possam aprender com suas experiências.

Entrega contínua tem um grande foco em testes automatizados. Gastamos cerca de 1/3 do livro falando sobre isso. Fazemos isso porque a alternativa - teste manual - é cara e propensa a erros e, na verdade, não é uma ótima maneira de criar software de alta qualidade (como Deming disse: "Cesse a dependência da inspeção em massa para obter qualidade. Melhore o processo e melhore a qualidade"). o produto em primeiro lugar ")

A cobertura total do teste é impossível. Você precisa dedicar muito tempo - e tempo é dinheiro - para cada pequena coisa. Isso é valioso, mas o tempo pode ser gasto contribuindo para a qualidade de outras maneiras.

É claro que a cobertura total do teste é impossível, mas qual é a alternativa: zero cobertura do teste? Há uma troca. Em algum lugar no meio está a resposta correta para o seu projeto. Concluímos que, em geral, você deve gastar cerca de 50% do seu tempo criando ou mantendo testes automatizados. Isso pode parecer caro até você considerar o custo de testes manuais abrangentes e corrigir os erros que surgem para os usuários.

Algumas coisas são difíceis de testar automaticamente. Por exemplo, GUI. Mesmo o Selenium não informa se a sua GUI é instável.

Claro. Confira o quadrante de teste de Brian Marick. Você ainda precisa executar testes exploratórios e testes de usabilidade manualmente. Mas é para isso que você deve usar seus seres humanos caros e valiosos - não para testes de regressão. A chave é que você precisa implantar um pipeline de implantação para que você só se preocupe em executar valiosas validações manuais em compilações que passaram por um conjunto abrangente de testes automatizados. Assim, você reduz a quantia gasta em testes manuais e o número de bugs que chegam a testes ou produção manuais (quando são muito caros de consertar). O teste automatizado feito da maneira certa é muito mais barato durante o ciclo de vida do produto, mas é claro que é um gasto de capital que se amortiza com o tempo.

É difícil testar o acesso ao banco de dados sem equipamentos volumosos, e mesmo isso não cobre casos estranhos de esquina no armazenamento de dados. Da mesma forma segurança e muitas outras coisas. Somente o código da camada de negócios é efetivamente testável por unidade.

O acesso ao banco de dados é testado implicitamente pelos testes de aceitação funcional baseados em cenários de ponta a ponta. A segurança exigirá uma combinação de teste automatizado e manual - teste de penetração automatizado e análise estática para encontrar (por exemplo) excedentes de buffer.

Mesmo na camada de negócios, a maioria dos códigos não possui funções simples cujos argumentos e valores de retorno podem ser facilmente isolados para fins de teste. Você pode gastar muito tempo criando objetos simulados, que podem não corresponder às implementações reais.

É claro que os testes automatizados são caros se você criar seu software e seus testes mal. Eu recomendo verificar o livro "crescente software orientado a objetos, guiado por testes" para entender como fazê-lo corretamente, para que seus testes e código sejam mantidos ao longo do tempo.

Os testes de integração / funcionais complementam os testes de unidade, mas demoram muito tempo para serem executados porque geralmente envolvem a reinicialização de todo o sistema em cada teste. (Se você não reinicializar, o ambiente de teste será inconsistente.)

Um dos produtos em que eu trabalhava tem um conjunto de 3.500 testes de aceitação de ponta a ponta que levam 18 horas para serem executados. Executamos em paralelo em uma grade de 70 caixas e obtemos feedback em 45m. Ainda mais do que o ideal, é por isso que o executamos como o segundo estágio no pipeline após a execução dos testes de unidade em alguns minutos, para não desperdiçarmos nossos recursos em uma construção da qual não temos um nível básico de confiança em.

A refatoração ou qualquer outra alteração quebra muitos testes. Você gasta muito tempo consertando-os. Se é uma questão de validar alterações significativas nas especificações, tudo bem, mas geralmente os testes são interrompidos devido a detalhes de implementação de baixo nível sem sentido, e não a coisas que realmente fornecem informações importantes. Freqüentemente, o aprimoramento é voltado para o retrabalho interno do teste, não para realmente verificar a funcionalidade que está sendo testada.

Se o seu código e testes estiverem bem encapsulados e fracamente acoplados, a refatoração não interromperá muitos testes. Descrevemos em nosso livro como fazer a mesma coisa também para testes funcionais. Se seus testes de aceitação forem interrompidos, isso significa que você está perdendo um ou mais testes de unidade; portanto, parte do CD envolve melhorar constantemente sua cobertura de testes para tentar encontrar erros no início do processo de entrega, onde os testes são mais detalhados e os os erros são mais baratos de corrigir.

Os relatórios de campo sobre bugs não podem ser facilmente combinados com a micro-versão precisa do código.

Se você estiver testando e lançando com mais frequência (parte do ponto do CD), é relativamente simples identificar a alteração que causou o bug. O objetivo principal do CD é otimizar o ciclo de feedback para que você possa identificar os erros o mais rápido possível após o check-in no controle de versão - e de fato, preferencialmente antes do check-in (é por isso que executamos os testes de construção e unidade antes do check-in).

— Jez Humble
fonte

Obrigado pela sua resposta. Sim, acredito em testes. Meus projetos tiveram uma boa cobertura de código de testes automatizados executados com a compilação diária. Só estou dizendo que você precisa de algum tipo de iteração antes de lançar. "Você ainda precisa executar testes exploratórios ... manualmente." Eu não entendo Um sistema de CD completo é implantado em cada check-in. Como você pode fazer isso se incluir o teste manual?

— Joshua Fox

3

Eu gosto de distinguir entre entrega contínua e implantação contínua. Aqui está a diferença. Entrega contínua significa que você mantém o sistema sempre pronto para produção e pode liberar sob demanda com o pressionar de um botão. A liberação é uma decisão de negócios. A implantação contínua é um caso limitante em que você libera toda boa compilação (observe que nem todo check-in - alguns check-ins não resultam em uma compilação liberável). Nos dois casos, você pode incluir validações manuais: a chave é o conceito do pipeline de implantação .

— precisa

Em relação a "O acesso ao banco de dados é testado implicitamente pelos testes de aceitação funcional baseados em cenários de ponta a ponta". O principal problema é que isso está implícito . As pessoas parecem felizes com isso, mas essa é uma abordagem que desperdiça muito tempo; em vez de dizer o problema "Isso é o que eu esperava do banco de dados e o obtive", ele diz "Algo quebrou em uma das 100 camadas".

— atoth 7/03/16

11

Primeiro, o CD precisa de um grande ajuste mental - você precisa admitir que, às vezes, as coisas vão dar errado, não importa o que você faça. No final do dia, você não pode provar um negativo.

Depois de superar isso, você percebe que precisa de ferramentas e procedimentos para: a) capturar esses erros muito rapidamente eb) reverter ou implantar a atualização com muita eficiência. Além disso, se você está realmente bebendo o coquetel de CD, está realmente entregando muitas pequenas alterações pontuais que são fáceis de reverter e não devem ser capazes de introduzir bugs importantes em todo o aplicativo. Até os caras que realmente praticam CD estão lidando com grandes trocas de maneira mais tradicional.

— Wyatt Barnett
fonte

"pequenas ... alterações ... não devem ser capazes de introduzir bugs em todo o aplicativo". Mesmo em código bem fatorado, isso pode acontecer. Por exemplo, você adiciona uma div que empurra outra div para fora da vista em um navegador específico. Por exemplo, um valor nulo aparece em uma caixa de canto inesperada, lançando uma exceção e impedindo que a GUI seja renderizada. Sim, você deve testar todo o possível, como eu, mas inevitavelmente ocorrem erros e pequenos erros podem atrapalhar todo o aplicativo.

— Joshua Fox

Mas eles ainda são fáceis de encontrar e corrigir qual é o maior ponto de ênfase.

— Wyatt Barnett

2

Todo sistema tem riscos, e todo risco tem custos potenciais. Se o custo de um pequeno risco, do tipo que pode levar meses ou anos para ser encontrado em extensos testes e controle de qualidade, for alto o suficiente (o software em seu marcapasso cardíaco), você não envia sem um longo período de testes de um liberação congelada. Se o custo da falha for pequeno o suficiente, talvez você envie continuamente com zero teste (a página do Facebook do seu gato).

— hotpaw2
fonte

Sim. Para a maioria das aplicações de produção, o risco está em algum lugar. E parece-me que o risco é tal que não queremos implantar em cada check-in, mesmo com testes automatizados. Parece que uma rodada de controle de qualidade é sempre necessária. Mas lançamentos aproximadamente semanais parecem viáveis para mim.

— 21711 Joshua Fox

1

A cobertura total do teste é impossível. Você precisa dedicar muito tempo - e tempo é dinheiro - para cada pequena coisa. Isso é valioso, mas o tempo pode ser gasto contribuindo para a qualidade de outras maneiras.

Você não precisa de 100% de cobertura, precisa ter confiança suficiente em seu sistema, pois as alterações em um único local não afetarão as coisas que você provou anteriormente.

Algumas coisas são difíceis de testar automaticamente. Por exemplo, GUI. Mesmo o Selenium não
informa se a sua GUI é instável. É difícil testar o acesso ao banco de dados sem equipamentos volumosos, e mesmo isso não cobre casos estranhos de esquina no armazenamento de dados.

O acesso ao banco de dados é trivial de se escrever. Você não precisa de muitos testes na camada de dados, pois está apenas obtendo e configurando dados. O mais importante é garantir que, quando falhar, reverta e registre o problema para que você possa corrigi-lo.

Da mesma forma segurança e muitas outras coisas. Somente o código da camada de negócios é efetivamente testável por unidade. Mesmo na camada de negócios, a maioria dos códigos não possui funções simples cujos argumentos e valores de retorno podem ser facilmente isolados para fins de teste.

Então, muitas de suas funções / classes são muito grandes. Eles devem ser escritos para serem testáveis.

Você pode gastar muito tempo criando objetos simulados, que podem não corresponder às implementações reais.

A E / S do objeto simulado deve corresponder ao esperado. O que acontece dentro dele sem importância.

Os testes de integração / funcionais complementam os testes de unidade, mas demoram muito tempo para serem executados porque geralmente envolvem a reinicialização de todo o sistema em cada teste. (Se você não reinicializar, o ambiente de teste será inconsistente.)

Estes não devem ser executados o tempo todo. Apenas conforme necessário.

A refatoração ou qualquer outra alteração quebra muitos testes. Você gasta muito tempo consertando-os. Se é uma questão de validar alterações significativas nas especificações, tudo bem, mas geralmente os testes são interrompidos devido a detalhes de implementação de baixo nível sem sentido, e não a coisas que realmente fornecem informações importantes. Freqüentemente, o aprimoramento é voltado para o retrabalho interno do teste, não para realmente verificar a funcionalidade que está sendo testada.

Então, seu código está muito acoplado e seus testes são mal escritos.

Os relatórios de campo sobre bugs não podem ser facilmente combinados com a micro-versão precisa do código.

Não tem certeza do que está chegando aqui? Se houver um erro, escreva um teste para mostrar sua existência e corrija-o.

— CaffGeek
fonte

"A E / S do objeto simulado deve corresponder ao esperado". "Construir MOs que implementam completamente uma especificação de interface consome tempo. Pior, é preciso atualizá-los continuamente, para que você efetivamente escreva todo o código duas vezes (uma vez para produção e uma vez para MOs).

— Joshua Fox

1

Funciona bem para nós, mas nossos clientes são principalmente internos. Várias construções feitas durante o dia, construções quebradas não são toleradas, mecanismo de início na web usado para que os usuários obtenham a versão mais recente a cada lançamento. Uma coisa é que o CD faz muitos problemas desaparecerem. Sim, você tem preocupações de compatibilidade o tempo todo, no entanto, como você está implantando pequenas alterações a cada vez, é realmente fácil entender essas preocupações. O nível de estresse do CD é MUITO menor do que quando fizemos grandes atualizações e tivemos que esperar que tudo estivesse certo, pois haveria muito código a ser revisado em caso de quebra.

— Brian Knoblauch
fonte

-4

Para ser honesto, TODOS os softwares estão em entrega contínua! O mais importante é tirá-lo da porta! Faça com que seus usuários o usem e priorize as solicitações de recursos e a eliminação de erros depois disso.

"Artistas reais enviam"
- Steve Jobs.

— Gary Willoughby
fonte

a alternativa ao CD não são os ciclos de um ano. São iterações toda semana, duas semanas ou mês.

— Joshua Fox