A TV Tropes chama isso de Grunhido por voz :
Atualmente, a dublagem é onipresente nos videogames, mas antigamente, quando os orçamentos eram menores, o hardware de som era mais básico e o espaço em disco / cartucho era limitado, os desenvolvedores tinham que recorrer ao texto. Nos jogos em que a história era enfatizada, eles pensavam que parte do drama se perdia quando uma cena potencialmente emocional era pantomimada como um filme mudo. Então, alguns jogos incorporaram "meio que" dublagem, de duas formas.
Uma forma é uma espécie de bipes em vários arremessos, geralmente aumentando ou diminuindo a velocidade, dependendo da rapidez com que o falante está falando. ...
Ou, quando os sons são sílabas sem sentido, em vez de bipes e digitação, Speaking Simlish :
A linguagem dos NPCs e outras construções de IA em jogos de simulação e em alguns RPGs, compostos de sons sem sentido combinados como palavras reais. Não é uma fala normal, cifrada, falada ao contrário ou algo do tipo, é simplesmente sem sentido ou "Simlish", como diz o Manual dos Sims
Isso se tornou especialmente popular em lançamentos baseados em cartuchos e disquetes, quando os lançamentos em CD-ROM com voz total começaram a aparecer, como um meio termo entre a expressão fornecida pela dublagem e a enorme quantidade de armazenamento necessária para isso.
Algo como as vozes do Banjo Kazooie poderia ser considerado um dos itens acima, eu diria.