Eu estou tentando entender como o meu iPhone pode ouvir continuamente para mim dizendo Hey Siri
, Alexa
, Hey Cortana
ou Okay Google
sem drenar rapidamente a minha bateria para baixo.
Imaginei dois tipos de algoritmo. Um que registra uma fatia de tempo, como 10 ms de largura a cada 200 ms e executa uma detecção síncrona em frequências específicas. No entanto, esses parâmetros dependem fortemente da característica da minha voz. Além disso, ele ainda consumirá muita energia da CPU para tentar continuamente igualar uma Hey Siri
no meio do nada.
Que tipo de algoritmo / implementação eficiente de baixa potência (hardware ou software) pode executar essa tarefa?
De alguma forma, isso está relacionado a esta patente: https://www.google.com/patents/US20160253997
Li alguns artigos que falam sobre modelos ocultos de Markov, mas duvido que seja uma abordagem de baixo consumo de energia.