Redução de dimensionalidade com folga?


11

O lema Johnson-Lindenstrauss diz aproximadamente que para qualquer coleção de pontos em , existe um mapa onde tal que para todos : É sabido que declarações semelhantes não são possíveis para a métrica , mas é sabido se existe alguma maneira de contornar tais valores inferiores limites, oferecendo garantias mais fracas? Por exemplo, pode haver uma versão do lema acima para on R d F : R dR k k = O ( log n / ε 2 ) x , y S ( 1 - ε ) | | f ( x ) - f ( y ) | | 2| | x - y | | 2( 1 + ϵ ) |SnRdf:RdRkk=O(logn/ϵ2)x,yS1 1

(1ϵ)||f(x)f(y)||2||xy||2(1+ϵ)||f(x)f(y)||2
11métrica que promete apenas preservar as distâncias da maioria dos pontos, mas pode deixar algumas distorcidas arbitrariamente? Um que não oferece garantia multiplicativa para pontos "muito próximos"?

Respostas:


9

A referência padrão para um resultado tão positivo é o artigo de Piotr Indyk sobre distribuições estáveis:

http://people.csail.mit.edu/indyk/st-fin.ps

Ele mostra uma técnica de redução de dimensão para que a distância entre qualquer par de pontos não aumenta (mais do que o fator ) com probabilidade constante e as distâncias não diminuem (em mais do que o fator ) com alta probabilidade. A dimensão da incorporação será exponencial em .11+ϵ1ϵ1/ϵ

Provavelmente existem trabalhos de acompanhamento dos quais não estou ciente.



7

Foi recentemente demonstrado por Newman e Rabinovich que, para n pontos em há redução de dimensão para a dimensão . Usando um teorema de Abraham et al. (Incorporação métrica com garantias relaxadas, mencionadas acima), é possível obter uma redução de dimensão na dimensão que funciona para uma fração de dos pares. S ( n / ε )1O(n/ϵ)O(1/(δϵ))1δ


4

Outro relaxamento da redução de dimensão é exigir que esteja em um subespaço dimensional de e faça depender de . Talagrand provou que, dado um subespaço dimensional de (ele até prova para ), existe um mapa para tal que para todos , S c R d k c c V1ScRdkccV1dL1f:1d1kk=O(ϵ2clogc)x,yV f S(1ϵ)f(x)f(y)1xy1(1+ϵ)f(x)f(y)1. Sua incorporação é um procedimento aleatório simples, mas prossegue em etapas e cada etapa é bem-sucedida com probabilidade constante; após cada etapa, é necessário verificar se a etapa foi bem-sucedida e repita se não tiver. Incorporação de tão Talagrand falta uma característica crucial da JLT: o fato de que pode ser escolhido a partir de uma distribuição que é independente do .fS

Muito recentemente, Woodruff e Sohler provaram um resultado análogo ao de Talagrand, mas com o recurso adicional de que , assim como no JLT, é um mapeamento linear escolhido de uma distribuição independente de : você precisa escolher uma matriz em que cada entrada é uma variável aleatória iid Cauchy. Isso está no espírito das projeções estáveis ​​de Indyk: Cauchy é 1-estável. S k × dfSk×d

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.