Um formador de feixe de banda estreita pode ser usado para separação de fala


7

Na minha tese de mestrado, estou tentando implementar um beamformer.

Eu já fiz a parte da soma de atraso há 1 ano. Foi-me dito:

na filtragem FIR podemos fazer

FFT -> anula o compartimento de frequência indesejado -> IFFT.

Podemos fazer o mesmo em formadores de feixe. Se conhecermos a interferência do DOA (como 0 no ângulo 25 e 1 em qualquer outro lugar entre -90 a 90), podemos ---> IFFT e usar os pesos nos elementos de separação.

O que quer que eu tentei não funcionou. Do que comecei a ler livros, surpreendentemente não consegui encontrar o método que meu orientador me contou. Em vez disso, descobri métodos como MVDR, LCMV. Agora, estou tentando usar o método matlab lcmvweights para obter pesos corretos para cada elemento e aplicar no meu formador de feixe de soma de atraso. Mesmo que eu consiga usar esse método, estou curioso para saber se os formadores de feixe de banda estreita podem ser usados ​​em sinais complexos, como fala?

Respostas:


5

Se você estiver lidando com, digamos, 8 kHz para uma largura de banda de voz nominal de 4kHz, ou seja, 0 Hz - 4 kHz, o discurso é essencialmente um sinal de banda larga. Portanto, o beamforming de banda estreita não funcionará muito bem. Seu padrão de feixe será bom para a frequência específica de interesse - mas, quando você começar a se afastar dessa frequência, seus padrões de feixe se deteriorarão.

O que você está procurando é a formação de feixe de banda larga - que usa atrasos reais (ou mudanças de fase lineares através da frequência no domínio da frequência) em vez de apenas mudanças de fase.

Normalmente, as técnicas como LCMV e MVDR são desenvolvidas para sinais de banda estreita. Existem algumas maneiras de abordar o problema da banda larga:

  1. Use uma linha de atraso aproveitada em cada canal. Se você temn canais e m toques por canal, sua matriz de correlação é mn x mn. Portanto, os sistemas de equações ficam muito grandes.
  2. Use um monte de formadores de feixe de banda estreita. Nesse caso, você teriam formadores de feixe (m freqüências) cada um ncanais. Agora, cada formador de feixes tem umn x n matriz de correlação, mas você tem mdeles. Por isso, leva a uma redução na complexidade do caso anterior.
  3. Você pode formar um conjunto de b feixes convencionais (usando atraso de tempo em vez de apenas multiplicador de fase) e, em seguida, faça o processamento adaptativo nos feixes.

A melhor referência que consigo pensar é de Van Trees - Optimum Array Processing. Observe que algumas vezes você encontra pequenas diferenças na terminologia - alguns textos indicam o MVDR como usando a matriz de correlação de sinal, enquanto outros usam a matriz de correlação de sinal mais ruído - Apenas tome cuidado com o que você está vendo. Eu sei que Van Trees faz uma distinção entre os dois casos. A maioria dos outros textos não utiliza e apenas usa uma formulação e a denomina MVDR.


Preciso mergulhar nas coisas da matriz de correlação. Estou com falta de formação teórica, estou lendo, mas não consigo entender exatamente. O que você acha que posso usar diretamente a função lcmvweights no matlab? Do que usá-los diretamente no meu formador de feixe de soma de atraso que eu já implementei.
Kadir Erdem Demir

@KadirErdemDemir Se você estivesse usando a opção 2 (acima), sim, poderia usar os pesos lcmv. Eu não estou familiarizado com os lcmvweights do Matlab - a menos que ele lide com formação de feixe de banda larga, você não poderá usar as saídas em um verdadeiro formador de feixe de soma de atraso (opção 1) (ao contrário de uma implementação de mudança de fase)
David

5

O trabalho de Darren Ward, Rod Kennedy e Bob Williamson investigou como projetar filtros aplicados a um formador de feixe de atraso e soma que permitia a aquisição de sinal de banda larga.

Como você pode ver na figura 2, um formador de feixe de banda estreita não funciona bem, pois a frequência muda da frequência do projeto.

insira a descrição da imagem aqui

A escolha adequada de filtros nos caminhos do formador de feixe de atraso e soma permite que uma resposta da matriz menos dependente da frequência seja formada (figura 4 de seu artigo abaixo).

insira a descrição da imagem aqui

Um artigo posterior que fiz com Darren e Bob mostra que é possível ter um design invariável à frequência e posicionar um nulo exato em uma determinada direção (por exemplo, esse artigo tem 20 anos este ano).

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.