O macOS trata a entrada do ditado de voz da mesma forma que faria com um teclado?


0

Eu tenho um monte de digitação que eu preciso fazer e gostaria de usar o ditado de voz. No entanto, ele não parece "digitar" de forma consistente nos aplicativos.

Eu tive sucesso com o recurso em alguns aplicativos nativos, como MS Word, gVIM e macOS Notes. Tenho notado que muitas vezes não será um fluxo consistente de "digitação", ao contrário, às vezes, ele explode várias palavras e, em seguida, retrocede e corrige uma vez que determina uma melhor interpretação com base no contexto pós-fato. Por exemplo, se você disser "3:26 PM", ele começará a estourar "três e vinte e seis", retroceder e substituí-lo por "3:26 PM", porque eventualmente percebeu que estava ditando uma hora do dia.

Em particular, estou tentando usar isso em uma sessão do Citrix Receiver para uma máquina remota. Parece que os ajustes de “backspace e replacement” não chegam à sessão remota e eu veria algo mais como “three twenty six 3:26 PM”.

Eu suspeito que isso não registra os principais eventos de imprensa já que você não está pressionando fisicamente as teclas, mas parece que a Citrix não está olhando para "PRESSÕES-chave" de qualquer maneira, dado que alguma entrada funciona. No entanto, estou curioso como exatamente isso está se relacionando com o software esperando entrada? Talvez as correções não sejam simplesmente operações de backspace, mas mais operações de "remover palavra anterior" que algumas combinações de teclas digitadas fariam?

Alguém tem uma ideia aqui?


Existe um componente terminal para o aplicativo Citrix? Pode ser uma simples correção com stty para definir o caractere de backspace corretamente ...
Francis from ResponseBase

@ FrancisfromResponseBase: não, é semelhante ao VNC ou RDP, pois é apenas um "portal" de janela grande para um desktop remoto; sua posição / ações do mouse são enviadas junto com qualquer outra ação de teclado / HID. Essencialmente, uma plataforma de desktop remota segura e de nível empresarial.
bjb

Hmmn Bem, se houvesse um servidor X e um componente de terminal, o que provavelmente é ou talvez tenha sido, talvez tenha sido uma solução fácil, como "apagar stty (pressione a tecla BACKSPACE)" em uma janela do Terminal.
Francis from ResponseBase

Respostas:


1

A resposta curta para a sua pergunta é que é complicado ...

Dependendo de como o aplicativo foi desenvolvido, ele pode usar qualquer número de diferentes APIs da Swift, Cocoa, Carbon.

Se o seu aplicativo usa elementos padrão da interface do usuário da Apple, como campos de texto, provavelmente terá uma maneira de colocar o texto diretamente no campo; no entanto, a Apple provavelmente adicionou funcionalidades para suportar outros softwares, simulando pressionamentos de tecla.

Quão bem isso é suportado depende do desenvolvedor do aplicativo.

Como exemplo, um aplicativo como o Citrix provavelmente não usa nenhum elemento de interface do usuário padrão porque não tem caixa de texto para digitar, em vez disso, mostra uma imagem de um computador e grava onde você clica nessa imagem, enviando para outro computador, da mesma forma, tem que gravar suas teclas pressionadas, mas evidentemente não está fazendo isso muito bem.

O Microsoft Word é provavelmente uma base de código muito antiga que cresceu a partir dos dias de Carbono, o que pode explicar porque não está funcionando como esperado, e eu não sei o que gVIM, mas eu acho que você quer dizer MacVim mas como é uma porta de outro projeto pode não ter sido testado para isso corretamente / não está na lista de prioridades.

Por que vale a pena ter tido problemas semelhantes usando softwares como o TextExpander e o Dash, que auto completam frases no Terminal, e usam o software de desktop remoto da própria Apple, como o Citrix, então acho que isso é de se esperar.


1
Na verdade, eu estava afirmando o MS Word faz funciona como MacVim. FWIW, acho que o Office 2011 foi uma reescrita de cacau completa; as versões de 2008 e anteriores eram baseadas em carbono.
bjb
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.