Meus dois centavos nesta questão antiga.
Observando a animação (não necessariamente apenas para texto), podemos notar que ela está tocando com os três elementos básicos para gráficos em movimento, tradução, escala e rotação.
Embora algumas partes possam ser alcançadas por escala e translação, um movimento de câmera fora do avião tornaria a vida mais fácil.
Eu categorizaria os programas que podem alcançar esses efeitos em:
Software de animação
Já mencionado, uma ótima opção e gratuita é o Blender. É um programa 3D para animações, mas uma animação 2D pode ser feita facilmente, basta preparar elementos planos com o material correto.
Você também pode usar os mais caros, como o C4D, ou os da Autodesk.
Existem vários programas que são usados para animações de caracteres 2D dedicados e qualquer um deles pode ser usado para isso.
Existem programas criados para animações da web, mas normalmente para clipes pequenos.
Composição
Normalmente, os efeitos mostrados no vídeo são feitos em um programa de animação ou em um de compostagem.
Outro programa gratuito, mas bastante interessante, é o HitFilm Express, que possui um módulo de edição de vídeo e compostagem.
Edição de vídeo
O software de vídeo está evoluindo e alguns têm algumas opções integradas para traduzir, dimensionar e girar elementos. Ultimamente, estou brincando um pouco com essas opções no Davinci Resolve. Mas eu deixaria isso para os anteriores. Um ponto interessante é que o Fusion, já mencionado também, está integrado ao Davinci Resolve.