Como é bastante geral, e a mudança na semelhança de cosseno depende dos A e B específicos e de sua relação com M , nenhuma fórmula definida é possível. No entanto, existem limites praticamente calculáveis para o quanto a similaridade do cosseno pode mudar . Eles podem ser encontrados extraindo o ângulo entre M A e M B, dado que a semelhança de cosseno entre A e B é um valor especificado, por exemplo, cos ( 2 ϕ ) (onde 2 ϕ é o ângulo entre A e BMABMMAMBABcos(2ϕ)2ϕA ) A resposta nos diz o quanto qualquer ângulo 2 φ pode eventualmente ser dobrado pela transformação M .B2ϕM
Os cálculos ameaçam ser confusos. Algumas escolhas inteligentes de notação, juntamente com algumas simplificações preliminares, reduzem o esforço. Acontece que a solução em duas dimensões revela tudo o que precisamos saber. Este é um problema tratável, dependendo apenas de uma variável real , que é prontamente resolvida usando técnicas de cálculo. Um argumento geométrico simples estende essa solução a qualquer número de dimensões n .θn
Preliminares matemáticas
Por definição, o cosseno do ângulo entre quaisquer dois vetores e B é obtido normalizando-os em comprimento unitário e obtendo seu produto. Portanto,AB
A′B(A′A)(B′B)−−−−−−−−−−√=cos(2ϕ)
e, escrevendo , o cosseno do ângulo entre as imagens de A e B sob a transformação M éΣ=M′MABM
(MA)′(MB)((MA)′(MA))((MB)′(MB))−−−−−−−−−−−−−−−−−−−−−−−√=A′ΣB(A′ΣA)(B′ΣB)−−−−−−−−−−−−√.(1)
Observe que apenas importa na análise,Σ não o próprio Portanto, podemos explorar a Decomposição de Valor Singular (SVD) de M para simplificar o problema. Lembre-se de que isso expressa M como um produto (da direita para a esquerda) de uma matriz ortogonal V ′ , uma matriz diagonal D e outra matriz ortogonal U :MMMV′DU
M=UDV′.
Em outras palavras, existe uma base de vectores privilegiados (as colunas de V ) em que M actua por escalonamento de cada um de e i separadamente pelo i th entrada diagonal de D (que chamaremos d i ) e depois aplicar uma rotação (ou anti-rotação) U ao resultado. Essa rotação final não mudará nenhum comprimento ou ângulo e, portanto, não deve afetar Σ . Você pode ver isso formalmente com o cálculoe1,…,enVMeiEuºDdEuvocêΣ
Σ = M′M= ( UD V′)′( UD V′) = VD ( U′você) D V′= VD2V′.
Conseqüentemente, para estudar podemos substituir M livremente por qualquer outra matriz que produz os mesmos valores em ( 1 ) . Ordenando o e i de modo que o d i diminuir em tamanho (e assumindo que M não é idêntica zero), uma escolha agradável de M éΣM( 1 )eEudEuMM
M= 1d1 1D V′.
Os elementos diagonais de são( 1 / d1 1) D
1 = d1 1/ d1 1≥ λ2= d2/ d1 1≥ λ3= d3/ d1 1≥ ⋯ ≥ λn= dn/ d1 1≥ 0.
Especificamente, o efeito de (seja na sua forma original ou alterada) em todos os ângulos é completamente determinado pelo fato de queM
MeEu= λEueEu.
Análise de um caso especial
Seja . Como alterar os comprimentos dos vetores não altera o ângulo entre eles, podemos assumir que A e B são vetores unitários. No plano, todos esses vetores podem ser designados pelo ângulo que fazem com e 1 , permitindo escrevern = 2UMABe1 1
A = cos( θ - ϕ ) e1 1+ sin( θ - ϕ ) e2.
Portanto
B = cos(θ+ϕ)e1+sin(θ+ϕ)e2.
(Veja a figura abaixo.)
A aplicação de é simples: ela fixa as primeiras coordenadas de A e B e multiplica suas segundas coordenadas por λ 2 . Portanto, o ângulo de M A a M B éMABλ2MAMB
f(θ)=arctan(λ2tan(θ+ϕ))−arctan(λ2tan(θ−ϕ)).
Como é uma função contínua, essa diferença de ângulos é uma função contínua de θ . De fato, é diferenciável. Isso nos permite encontrar ângulos extremos inspecionando os zeros da derivada f ′ ( θ ) . Essa derivada é simples de calcular: é uma razão de funções trigonométricas. Os zeros podem ocorrer apenas entre os zeros de seu numerador, portanto, não vamos nos preocupar em calcular o denominador. Nós obtemosMθf′(θ)
f′(θ)=λ2(1−λ2)(λ2+1)sin(2θ)sin(2ϕ)∗.
Os casos especiais de , λ 2 = 1 e ϕ = 0 são facilmente entendidos: eles correspondem às situações em que M é de classificação reduzida (e, assim, esmaga todos os vetores em uma linha); onde M é um múltiplo da matriz de identidade; e onde A e B são paralelos (de onde o ângulo entre eles não pode mudar, independentemente de θ ). O caso λ 2 = - 1 é excluído pela condição λ 2 ≥ 0 .λ2=0λ2=1ϕ=0MMABθλ2=−1λ2≥0
Além desses casos especiais, os zeros ocorrem apenas onde : ou seja, θ = 0 ou θ = π / 2 . Isto significa que a linha de determinados por e 1 bissecta o ângulo A B . Sabemos agora que os valores extremos do ângulo entre M A e M B deve situar-se entre os valores de f ( θ ) , então vamos calcular-los:sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)
f(0)f(π/2)=arctan(λ2tan(ϕ))−arctan(λ2tan(−ϕ))=2arctan(λ2tan(ϕ));=arctan(λ2tan(π/2+ϕ))−arctan(λ2tan(π/2−ϕ))=2arctan(λ2cot(−ϕ)).
Os cossenos correspondentes são
cos(f(0))=1−λ22tan(ϕ)21+λ22tan(ϕ)2(2)
e
cos(f(π/2))=1−λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2−λ22tan(ϕ)2+λ22.(3)
Muitas vezes, é suficiente entender como distorce os ângulos retos. Nesse caso, 2 ϕ = π / 2 , levando a tan ( ϕ ) = berço ( ϕ ) = 1 , que você pode conectar nas fórmulas anteriores.M2ϕ=π/2tan(ϕ)=cot( ϕ ) = 1
Observe que quanto menor se torna, mais extremos esses ângulos se tornam e maior é a distorção.λ2
Esta figura mostra quatro configurações dos vetores eUMA separados por um ângulo de 2 ϕ = π / 3 . O círculo unitário e sua imagem elíptica sob M são sombreados para referência (com a ação de M redimensionada uniformemente para fazer λ 1 = 1 ). As posições figura indicam o valor de θ , o ponto médio de um e B . O mais próximo que um desses A e B pode chegar quando transformado por M é uma configuração como a da esquerda com θ =B2ϕ=π/ 3MMλ1= 1θUMABUMABM . O mais distante que eles podem estar é uma configuração como a da direita com θ = π / 2 . Duas possibilidades intermediárias são mostradas.θ = 0θ=π/ 2
Solução para todas as dimensões
Vimos como age expandindo cada dimensão i por um fator λ i . Isso distorcerá a esfera unitária { AMEuλEu em um elipsóide. O e i determinar seus eixos principais. O λ i são as distâncias a partir da origem, ao longo desses eixos, ao elipsóide. Consequentemente, a menor, λ n , é amenor distância(em qualquer direção) da origem ao elipsóide e a maior, λ 1 , é amaior distância(em qualquer direção) da origem ao elipsóide.{A|A′A = 1 }eEuλEuλnλ1 1
Nas dimensões superiores , A e B fazem parte de um subespaço bidimensional. H mapeia o círculo unitário neste subespaço na intersecção do elipsóide com um plano contendo H A e M B . Essa interseção, sendo uma distorção linear de um círculo, é uma elipse. Obviamente, a maior distância desta elipse não é maior que λ 1 = 1 e a menor distância não é menor que λ n .n > 2UMABMMUMAMBλ1 1= 1λn
Como foi observado no final da secção precedente, o mais possibilidade extrema é quando e B estão situados num plano que contém dois dos e i para os quais a razão entre a correspondente λ i é tão pequena quanto possível. Isso acontecerá no plano e 1 , e n . Já temos a solução para esse caso.UMABeEuλEue1 1, en
Conclusões
Os extremos de semelhança de cosseno alcançáveis aplicando a dois vetores com semelhança de cosseno cos ( 2 ϕ ) são dados porMporque( 2 ϕ ) e ( 3 ) . Eles são alcançados situando A e B em ângulos iguais a uma direção na qual Σ = M ′ M alonga ao máximo qualquer vetor (como adireção e 1 ) e os separa em uma direção na qual length alonga minimamente qualquer vetor (como o e n direcção).(2)(3)ABΣ=M′Me1Σen
Esses extremos pode ser calculado em termos da SVD de .M