TL; DR: Lua possui sobrecarga, mas se usada corretamente, é insignificante e facilmente mitigável. Não o utilize para operações matemáticas pesadas ou para transformar geometria. Você provavelmente não verá nenhum problema de desempenho ao usá-lo para criar scripts para uma GUI.
Fiz alguns benchmarks básicos sobre o desempenho de Lua como uma linguagem de script de jogos, e é muito rápido. Usando o tolua ++ para ligar o LuaJIT ao meu mecanismo de jogo, criei 2.000 atores, cada ator controlado por um script Lua chamado cada loop do jogo (com um argumento de tempo delta). Metade dos atores tinha um roteiro reunido e a outra metade estava fazendo uma espécie de caminhada aleatória (e foi evitada pelo rebanho).
Desligar o componente de renderização me deu um pouco mais de 400 ticks por segundo no meu Opteron 170 (2x2,0 GHz, embora meu mecanismo fosse de rosca única na época). Eu imagino que eu poderia ter espremido um pouco mais do que isso se eu pesquisasse e otimizasse, talvez movendo parte do trabalho pesado de volta para C ++. Atualizar 2000 atores 400 vezes por segundo ainda era bastante impressionante e excedeu em muito as minhas expectativas na época.
Agora uso Lua em todos os meus projetos e, na verdade, constitui uma grande parte do código do jogo (AI, layout / lógica da GUI, eventos / mensagens). Criar jogos é MUITO mais divertido quando você pode alterar rapidamente algo e testá-lo sem precisar sair, recompilar e reinicializar. De vez em quando, encontro alguns problemas de desempenho, mas eles são facilmente resolvidos reimplementando o código incorreto no C ++ (e depois chamando-o de Lua).
Embora um pouco fora de tópico, os servidores do EVE Online são escritos quase completamente em Stackless Python (acredito que eles adiam a maioria de suas operações matemáticas para uma lib C ++), que é consideravelmente mais pesada que Lua, e, com base em minha própria pesquisa pessoal e em várias disponíveis benchmarks, muito menos desempenho que LuaJIT. Eles conseguem lidar com mais de 30k players simultâneos sem muitos problemas. É verdade que eles têm uma tonelada de hardware caro executando tudo isso, mas acredito que a maior parte do custo está no cluster de banco de dados ...
Desculpas pela parede do texto.