Como saída de conversão de texto em fala usando a linha de comando?

84

Como obter a saída de fala do texto digitado usando a linha de comando?

Também facilidade para alterar a taxa de fala, tom, volume etc usando o comando simples .

command-line software-recommendation text-to-speech

— Pandya
fonte

Possível duplicata de Como posso instalar e usar o software de conversão de texto em fala?

— Organic Addict

125

Em ordem decrescente de popularidade :

O say converte texto em fala audível usando o mecanismo de fala GNUstep.
```
sudo apt-get install gnustep-gui-runtime
say "hello"
```

festival Sistema geral de síntese de fala multilingue.

sudo apt-get install festival
echo "hello" | festival --tts

O spd-say envia uma solicitação de saída de texto para fala ao despachante de fala
```
sudo apt-get install speech-dispatcher
spd-say "hello"
```
O espeak é um sintetizador de fala de software multilíngue.
```
sudo apt-get install espeak
espeak "hello"
```

— Sylvain Pineau
fonte

13

spd-sayparece estar pré-instalado no 14.04 e em versões

— Ciro Santilli

3

Além disso sudo pip install gTTS, (Google Text to Speech / github.com/pndurette/gTTS ), gtts-cli "hello" -o hello.mp3você também pode canalizá-lo mpg123 -. gtts-cli "why, hello there" | mpg123 -.

— Elias Lynn

Infelizmente, spd-saynão parece ser capaz de jogar tts simultaneamente, apenas um de cada vez

— phil294

@ElijahLynn não funciona

— Dims

espeak/ spd-sayé o melhor para memes (os outros nem conseguem pronunciar a palavra "meme" corretamente). O melhor que posso dizer spd-sayusa espeakcomo back-end (as vozes soam iguais).

— usar o seguinte código

18

espeak é uma ótima ferramenta.

Eu apenas gosto de brincar com ele em uma linha de comando. Você pode achar que está em conflito com o Pulseaudio, por isso estou usando uma versão longa que nega ter que configurá-la corretamente.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help mostrará as opções para calibrar a velocidade de leitura, tom, voz, etc.

Ao fazer suas anotações, salve-as como um arquivo de texto e depois:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Você pode então brincar com ffmeg et al para compactar isso do PCM para algo mais gerenciável como MP3 ou OGG. Mas essa é uma história diferente.

— Oli
fonte

11

muito bom, também é possível tentar a interface gráfica do usuário para falar, espeak-gui.

— Sabacon

14

De man spd-say:

NOME
       spd-say - envia uma solicitação de saída de texto para fala ao despachante de fala

SINOPSE
       spd-say [opções] "algum texto"

DESCRIÇÃO
       O spd-say envia uma solicitação de saída de texto para fala ao processo do despachante de voz, que lida com isso e, idealmente, gera o resultado
       ao sistema de áudio.

OPÇÕES
       -r, --rate
              Defina a taxa do discurso (entre -100 e +100, padrão: 0)

       -p, --pitch
              Defina o tom do discurso (entre -100 e +100, padrão: 0)

       -i, --volume
              Defina o volume (intensidade) da fala (entre -100 e +100, padrão: 0)

Portanto, você pode obter a conversão de texto em fala seguindo o comando:

spd-say "<type text>"

Ex:

spd-say "Welcome to Ubuntu Linux"

Você também pode definir a taxa de fala, tom, volume etc. consulte a página de manual.

— Pandya
fonte

3

spd-say -t female2 "text"torna suportável

— scorpiodawg

6

Mbrola não funciona desde as 11h10.

As ferramentas SVOX (pico) são fáceis de instalar, fáceis de usar e traz vozes de boa qualidade no Ubuntu. Instale-o:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Ainda mais fácil, você pode usar o LibreOffice em combinação com as ferramentas SVOX (pico) instalando a extensão "Read Text" e obtendo uma "GUI" para este excelente software TTS:

Configure as opções da Extensão de leitura de texto com Ferramentas - Complementos - Seleção de leitura .... Use / usr / bin / python como programa externo. Selecione uma opção de linha de comando que inclua o token (PICO_READ_TEXT_PY).

— leoperbo
fonte

4

Google Speach em Python:

pip install google_speech

google_speech "Test the hello world"

Svox Do Android:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

Nanotts Svox:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

Links - Wiki:

Comparação de sintetizadores de fala

— intika
fonte

11

Para instalar e usar google_speechno Ubuntu 18.04 Eu tive que instalar python3-pipe libsox-fmt-mp3e usar pip3 install google_speech.

— Art1 de

3

E ainda um outro gui espeak: gespeaker. Ele usa tanto espeake mbrolamotores. Além disso, tem mais opções que espeak-gui.

— luri
fonte

3

O seguinte não é uma solução de software livre, mas você pode achar que vale a pena. (é uma solução de vinho ),

Pessoalmente, gosto muito de TTS, uso-o com bastante frequência ... por exemplo. ouvindo um discurso divagador que eu nunca me incomodaria em ficar com outra coisa (porque eu preciso tomar outra xícara de café ... :)

Algumas coisas que descobri ao longo do caminho ... ou devo dizer, coisas que não descobri ao longo do caminho ... Para ser franco: Todo software de voz FOSS TTS que experimentei está abaixo do par e, portanto, inadequado para qualquer audição semi-prolongada ...

Atualmente, uso o NaturalVoices da ATnT. Ele está disponível apenas para Windows (talvez o Mac), mas é executado wineno Ubuntu .. (possui um glytch menor, onde às vezes preciso clicar no painel quando me afasto do leitor ... É um menor quando comparado com a vantagem obtida pela qualidade da fala do NatualVoices.

Algumas outras coisas que eu achei virtualmente essenciais para uma experiência auditiva meio sensível são: ...

Esses programas TTS não são inteligentes (bem, talvez tão inteligentes quanto um babuíno jovem) .. então eles precisam de toda a ajuda que puderem obter. e há um (e apenas um programa Reader que encontrei que ajuda muito nisso .. O aplicativo é chamado ReadPlease (2003 Pro)... Permitia que você modificasse especialmente palavras e grupos de palavras para serem pronunciados como você deseja ... não é de forma alguma perfeita, mas, para mim, fez a diferença entre todo o processo ser utilizável e não utilizável ...
O discurso no Natural Voices é "bom", mas é um pouco chato. Existem outros bons produtos também, mas todos são para Windows, infelizmente) ..
Às vezes surpreende muito bem ... mas OMG, inicialmente é uma dor! .. então # 2 é * paciência ... e muita atualização da sua lista de "palavras especiais" ... Por paciência, quero dizer que você (I) realmente se acostumou aos padrões de fala do meu babuíno:) ... e por a propósito, atualmente tenho cerca de 3000 palavras que agora soam "Humanas" o suficiente para não me encolher mais quando as ouço.

3 .. "Siga a bola quicando" ... Novamente, porque a voz nunca é tão boa quanto um orador real, as coisas às vezes precisam ser esclarecidas. O programa Reader que eu uso possui um recurso para o qual eu atendo sua interface desajeitada .... Possui uma opção de palavra "selecione o que está sendo lido no momento". Muitos leitores têm isso, mas o ReadPlease mantém a linha atual ativa. centro da tela .. É inestimável poder ver à frente e atrás para reler rapidamente o que você perdeu (portanto, é bom centralizar automaticamente a linha atual) ...

Bem, essa é a minha experiência. Vou fazer um café agora, e enquanto estiver fazendo isso, estarei ouvindo isso, para ver como "lê" ... O TTS é surpreendentemente bom para pegar erros de digitação (eu faço muitos erros de digitação) ...

Se algo tão bom quanto o ATnT NaturalVoices aparecer no repositório Ubuntu, eu vou pular nele.

Aqui está um link para alguns exemplos de Natural Voices : Eu uso "MIke"

— Peter.O
fonte

3

SVOX pico2wave

é isso que eu uso. E parece natural, é fácil de entender, reconhece unidades (m, ° C, kg, ...)

Aqui está o meu primeiro post no pico2wave

Som natural Text to Speech?

Tudo que você tem a fazer é:

Vá para o Ubuntu Software Center e procure por "pico". Você encontrará 4 ou 5 entradas com "Small Footprint Ling ...". Instale-os.

Um possível uso do pico2wave é descrito em minha primeira postagem (siga o link acima).

Tchau

— user85321
fonte

Eu tenho usado o seu caminho pode você pls me dizer como chegar a doce voz feminina naturl usando seu caminho

— user49557

3

Pois festival(a voz parece mais natural para mim):

sudo apt-get install festival

echo "hello" | festival --tts

Configuração de inclinação e velocidade:

criar ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Consulte também http://www.solomonson.com/content/ubuntu-linux-text-speech

Atualização: tentei em outro computador ubuntu. Teve que instalar o pacote do mecanismo de fala em inglês para funcionar corretamente com o festival:

sudo apt-get install festvox-kallpc16k

Também playé um comando cli que vem com o soxpacote:

sudo apt-get install sox

— d9k
fonte

2

Mesmo que você já tenha aceitado uma resposta, eu gostaria de mencionar festival, do qual também gosto muito. Este post nos fóruns do Ubuntu tem muitas informações sobre como configurar vozes muito agradáveis.

— frabjous
fonte

2

Meet espeak-ng- Um sintetizador de fala de software multilíngue:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

Ele usa uma voz em inglês padrão, mas existem inúmeras outras vozes para outros idiomas e até dialetos disponíveis e podem ser listadas com espeak-ng --voices(para todos) ou, por exemplo, espeak-ng --voices=en(para inglês). Eles podem ser configurados -vjuntamente com a abreviação do idioma ou o nome do arquivo, por exemplo, para escocês ou suaíli:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

Existem muitas outras opções disponíveis, por exemplo, -spara a velocidade e -wpara gravar a saída em um arquivo wave, consulte a página de manual abaixo.

Leitura adicional

espeak-ng("Ng" para "próxima geração") é um fork ativo do espeaksoftware sintetizador de fala original , consulte o capítulo História na Wikipedia . Ambos estão disponíveis nas fontes oficiais através do pacote espeakou espeak-ngrespectivamente.

— sobremesa
fonte

0

O Balabolka no Wine funciona bem (para mim) com as vozes SAPI4 (as vozes SAPI5 não são detectadas no meu sistema Linux). Pode abrir arquivos e começar a ler.

Aqui está o link para a entrada do Wine no AppDB para Balabolka: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

— Hemantkumar Garach
fonte

0

A ferramenta gTTS é ótima para gerar arquivos de áudio a partir de texto. Ele usa a API de conversão de texto em fala do Google Translate e gera arquivos mp3.
Como ele é usado pippara instalação, eu recomendo fortemente que você instale o Miniconda e, em seguida, use-o condapara criar um ambiente onde você pode instalar o gTTS. Você pode baixar o Miniconda aqui:

https://docs.conda.io/en/latest/miniconda.html

O repositório GitHub para gTTS é:

https://github.com/pndurette/gTTS

E você pode encontrar a documentação do gTTS aqui:

https://gtts.readthedocs.io/en/latest/

— evaristegd
fonte