Essa é uma excelente pergunta e é muito importante para as equipes melhorarem. O tópico é enganoso e é amplamente mal compreendido. O objetivo original de apontar uma história era encontrar um método rápido e aceitável de estimar o nível de esforço (LOE) necessário para concluir a funcionalidade definida nas histórias. O objetivo geral: fornecer às equipes um método de PREVISÃO ou prever quanto tempo levaria para concluir um esforço (como um projeto). Sua compreensão do Velocity está certa: são os pontos MÉDIOS por Sprint concluídos (realmente CONCLUÍDOS). Portanto, se você tem um projeto para entregar e ele tem 250 pontos e sua equipe calcula a média de 25 pontos por sprint, o projeto levará aproximadamente 10 sprints, mais ou menos algum tempo de buffer.
Algumas luminárias, como Ken Schwaber, sugerem que a velocidade e os pontos sejam usados apenas para previsões de médio a longo prazo. Eles sugerem o uso de horas de tarefas como uma segunda "verificação de sanidade" sobre o que realmente pode ser feito em um sprint. Portanto, a quantidade de pontos em cada sprint pode variar dependendo da capacidade. Outros (inclusive eu) acreditam que uma equipe madura se estabelecerá em um padrão de dimensionamento muito consistente que pode prever com precisão a capacidade e, eventualmente, as horas de tarefas se tornarão um fardo adicional inútil. (É essencial atuar para novas equipes por pelo menos 6 a 12 sprints, IMHO, até que o entendimento da equipe sobre os pontos e o tamanho da história seja preciso.)
Seu primeiro pequeno erro é que você disse que a equipe deveria conhecer a velocidade e trazer muitos pontos na história. Na verdade, os treinadores incentivam as equipes a deduzir de 10% a 20% e a se comprometer * nesse nível. Portanto, se sua equipe tende a completar 25 pontos por sprint, não preencha o sprint em 25 pontos; em vez disso, pare em 20 a 22 pontos. Lembre-se: é perfeitamente BEM trazer histórias quando o outro trabalho estiver concluído. Então você pode "comprometer" com 22 pontos e completar 28. Isso é ótimo. Apenas tome cuidado para não encorajar a equipe a "fazer um saco de areia" e constantemente se comprometer. Não há nada errado em alongar para ver se podemos fazer mais.
Agora, ao seu ponto sobre a variação entre os sprints. É um padrão muito comum (mas NÃO OPTIMAL) ver uma equipe que completa 20 pontos, um sprint, depois 50, depois 22, depois 45, depois 15 e depois 60. Se você calcular o desvio, ele pode mostrar oscilações de 50% para 100% de corrida após corrida. Por que as equipes completam apenas 15 pontos em um sprint e depois 60 no próximo?
Isso pode significar que a equipe realmente não sabe o que pode fazer. (Ei, completamos 50 pontos no último sprint, podemos fazê-lo novamente neste sprint).
OU, isso pode indicar que os proprietários do produto estão forçando a equipe a se comprometer demais ou estão adicionando trabalho após o início do sprint, etc.
Essa medida de previsibilidade é importante para os mestres de scrum observarem e chamarem a atenção da equipe.
Freqüentemente, a razão pela qual eles completaram alguns pontos em um sprint e, em seguida, muitos pontos no próximo sprint é o que eu chamo de "ONDA ROLANTE DE TRABALHO INCOMPLETO". Aqui está um padrão muito comum:
O proprietário do produto está sob pressão para cumprir uma data. Portanto, a equipe sente a necessidade de tentar fazer muito trabalho. Eles começam como uma nova equipe e não têm certeza do que podem realmente fazer.
Então, o sprint 1, eles planejam o sprint e, como estão na fase de formação, não podem concluir todo o trabalho. De fato, eles têm mais trabalho incompleto do que realizado. O trabalho incompleto é INICIADO, mas INCOMPLETO. Ele é movido para o próximo sprint e, desta vez, eles fizeram mais trabalho do que incompleto. No próximo sprint, essa grande carga de trabalho incompleto cai em CONCLUÍDO e a confiança da equipe aumenta.
O proprietário do produto está empolgado e aumenta a carga novamente. No final deste sprint, eles têm uma quantidade enorme de trabalho incompleto e uma quantidade decepcionante de trabalho CONCLUÍDO.
Aqui você começa a ver o WAVES of Done vs Incomplete sprint alternativo após o sprint. Se as equipes não perceberem o que está acontecendo, esse padrão poderá continuar por meses. Mas, em média, eles completam cerca de 24 pontos por sprint. Então, o que acontece quando eles param de se comprometer demais?
Você notará que AINDA completam 24 a 26 pontos, mas o trabalho de transição é reduzido. Agora, em vez de ficar sobrecarregado tentando concluir uma quantidade impossível de trabalho, o que também destrói o moral da equipe, a equipe pode começar a melhorar seus processos.
Com o tempo, a velocidade começará a aumentar, sem as enormes oscilações no trabalho Concluído-vs-Incompleto.
Se você não permitir à equipe algum "tempo livre", NUNCA terão tempo para realizar um trabalho que a torne mais enxuta, mais rápida e melhor. Dev-Ops, por exemplo, não pode acontecer. Automação de Teste - Quem tem tempo para isso !? Mas essas são precisamente as coisas nas quais as equipes precisam trabalhar para aumentar a velocidade.