Edit: A pergunta agora diz "milhões de novos personagens". Isso facilita a resposta:
Não . Utf-8 é uma codificação Unicode. O Unicode possui um espaço de código que permite 1.114.112 pontos de código distintos e menos de um milhão atualmente não está atribuído. Portanto, não é possível oferecer suporte a milhões de novos caracteres em Unicode. Por definição, nenhuma codificação Unicode pode suportar mais caracteres do que o definido por Unicode. (É claro que você pode trapacear codificando um nível ainda mais - qualquer tipo de dado pode ser representado por apenas dois caracteres.)
Para responder à pergunta original:
O Unicode não suporta idiomas, como tal, suporta caracteres - símbolos usados para representar o idioma na forma escrita.
Nem todas as línguas humanas têm uma representação escrita; portanto, nem todas as línguas humanas podem ser suportadas pelo Unicode. Além disso, muitos animais se comunicam, mas não possuem linguagem escrita. As baleias, por exemplo, têm uma forma de comunicação complexa o suficiente para chamar um idioma, mas não possui nenhuma forma escrita (e também não pode ser capturada pela notação fonética existente). Portanto, nem todos os idiomas do mundo podem ser suportados pelo Unicode.
Pior ainda é algo como a linguagem das abelhas. Não apenas não possui uma forma escrita, como também não pode ser representado de forma significativa. A linguagem é um tipo de dança que basicamente aponta em uma direção, mas depende da posição atual do sol. Portanto, a dança só tem valor informativo no local e horário específicos em que é realizada. Uma representação simbólica ou textual teria que incluir informações (localização, posição do sol) que a linguagem das abelhas atualmente não pode expressar.
Mesmo uma forma de comunicação escrita ou simbólica pode não ser possível representar em Unicode. Por exemplo, ilustrações ou quadrinhos sem palavras não podem ser suportados pelo Unicode, pois o conjunto de glifos não é finito. Você notará muita comunicação pictórica em ambientes internacionais como um aeroporto, portanto, não é inconcebível que uma raça de alienígenas que viajam no espaço tenha evoluído para usar uma linguagem pictórica.
Mesmo se uma raça alienígena tivesse um idioma com um sistema de escrita com um conjunto finito de símbolos, talvez esse sistema não seja possível de ser suportado no Unicode. O Unicode espera que a escrita seja uma sequência linear de símbolos. A notação musical é um exemplo de um sistema de escrita que não pode ser totalmente representado em Unicode, porque o significado é codificado na escolha dos símbolos e na colocação vertical e horizontal. (O Unicode suporta símbolos musicais individuais, mas não pode codificar uma partitura.) Uma raça alienígena que se comunica usando música polifônica (não incomum) ou um canal de comunicação de complexidade semelhante, pode muito bem ter um sistema de escrita parecido com uma partitura orquestral, e Unicode não pode suportar isso.
Mas, por uma questão de argumento, suponha que todas as línguas, mesmo línguas estrangeiras, possam ser expressas como uma sequência linear de símbolos selecionados de um conjunto finito. O Unicode é grande o suficiente para uma invasão alienígena? Atualmente, o Unicode possui menos de um milhão de pontos de código não atribuídos. O idioma chinês contém centenas de milhares de caracteres de acordo com o dicionário chinês mais abrangente (nem todos eles são atualmente suportados pelo Unicode como caracteres distintos). Portanto, apenas dez idiomas com a complexidade do chinês usariam todo o Unicode. Na terra, temos centenas de sistemas de escrita distintos, mas felizmente a maioria é alfabética, e não ideográfica, e, portanto, contém um pequeno número de caracteres. Se todas as línguas escritas usassem ideogramas como o chinês, o Unicode nem seria grande o suficiente para a Terra. O uso de alfabetos é derivado da fala, que utiliza apenas um número limitado de fonemas, mas isso é particular para a fisiologia humana. Assim, mesmo um único planeta alienígena com apenas uma dúzia de sistemas ideográficos de escrita pode exceder o que o Unicode pode suportar. Agora considere se esse alienígena já invadiu outros planetas antes da Terra e incluiu seus sistemas de escrita no conjunto de caracteres que precisam ser suportados.
A expansão ou modificação das codificações atuais ou a introdução de novas codificações não resolverão isso, pois a limitação está no número de pontos de código suportados pelo Unicode.
Portanto, a resposta provavelmente não é.