Problema de vetores não ortogonais

Considere os seguintes problemas:

Problema de vetores ortogonais

Entrada: um conjunto $S$ de vetores booleanos, cada um de comprimento . $n$ $d$

Pergunta: Existem vetores distintos e tais que ? $v_1$ $v_2 \in S$ $v_1 \cdot v_2 = 0$

Problema de vetores não ortogonais

Entrada: Um conjunto de vetores booleanos, cada um de comprimento e um número inteiro positivo . $S$ $n$ $d$ $k$

Pergunta: Existem vetores distintos e tais que ? $v_1$ $v_2 \in S$ $v_1 \cdot v_2 \geq k$

Qual é a relação entre esses dois problemas?

Em particular, aqui estão algumas perguntas mais específicas sobre as quais eu tenho me perguntado:

(1) Um desses problemas parece ser mais difícil que o outro?

(2) Não sei ao certo qual é o algoritmo atual do OVP, mas para um desses problemas, é possível obter um limite superior melhor que o tempo ? $O(n^2 \cdot d)$

(3) A fixação de faz alguma diferença para a complexidade do segundo problema? $k$

Por , quero dizer o produto interno de e sobre . $v_1 \cdot v_2$ $v_1$ $v_2$ $\mathbb{R^d}$

Editar: a maioria das respostas oferece idéias realmente excelentes quando é pequeno. $d$

O que se pode dizer quando é maior? Diga ou ou pelo menos para alguns . $d$ $d = n$ $d = \sqrt{n}$ $d = n^\alpha$ $\alpha > 0$

— Michael Wehar
fonte

Em relação a (2): até onde eu sei, o algoritmo mais conhecido para resolver OVP foi estabelecido neste artigo . Possui complexidade

Melhorar esse resultado para

para uma constante

é um famoso problema aberto, e acredita-se improvável, poisfalsificaria a forte conjectura da hipótese de tempo exponencial.

O (n^{2 - \frac{1}{O (\log (\frac{d}{\log n}))}}) .

$O\left(n^{2-\frac{1}{O\left(\log \left(\frac{d}{\log n}\right)\right)}}\right).$

O (n^{2 - ε})

$O(n^{2-\varepsilon})$

ε

$\varepsilon$

— Geoffroy Couteau

O segundo problema também é solucionável em

tempo. Apenas escolha

posições e verifique se dois vetores têm todos os 1s nessas posições.

O (n * k * (\binom{d}{k}))

$O(n * k * {d \choose k})$

k

$k$

— Michael Wehar

Uma observação sobre o tempo limite acima para OVP: o tempo limite também exige que d <= 2 ^ (sqrt (log n)), caso contrário, a construção intermediária de um polinômio probabilístico leva muito tempo.

— Ryan Williams

Sobre d grande: os algoritmos para multiplicação de matriz retangular superam n ^ 2 d na computação de todos os produtos de ponto. Quando d <n ^ 0,3, o tempo limite se torna n ^ (2 + o (1)).

— Rasmus Pagh 19/09/18

@ MichaelWehar: Exatamente. Eu acho que o melhor resultado se deve a François Le Gall, arxiv.org/abs/1204.1111

— Rasmus Pagh

Respostas:

$k$ $S \subseteq \{0,1\}^d$ $\max_{(a,b) \in S, a\ne b} a \cdot b$

Recentemente, eu e Ryan Williams temos um trabalho (ainda não publicado) mostrando que, quando , OVP e uma versão bicromática do Max-IP (dado , encontre ) é realmente equivalente: ou seja, se um deles possui o algoritmo de tempo , o mesmo ocorre com o outro. (A redução de OVP para Max-IP é bem conhecida, a nova redução aqui é a de Max-IP para OVP). $d = O(\log n)$ $A,B$ $\max_{(a,b) \in A \times B} a \cdot b$ $n^{2-\varepsilon}$

Como a versão monocromática do Max-IP pode ser reduzida para a versão bicromática, o resultado acima também implica que, quando , o Max-IP monocromático pode ser reduzido para OVP. $d = O(\log n)$

Eu acredito que é uma questão em aberto que se o OVP pode ser reduzido a Max-IP monocromático. Isso também está intimamente relacionado ao estabelecimento da dureza OV para o problema do par mais próximo (consulte Por exemplo, Sobre a complexidade do par mais próximo via par polar de conjuntos de pontos )

Para Max-IP monocromático, existe um algoritmo com tempo de execução algoritmo de tempo de Alman, Chan e Williams ( também apontado por Rasmus), para o qual acredito ser o estado da arte. Enquanto o melhor algoritmo para OVP é executado em quando , que é significativamente mais rápido. $n^{2 - 1/\widetilde{O}((d/\log n)^{1/3})}$ $n^{2 - 1/O(\log c)}$ $d = c \log n$

Além disso, a versão aproximada do Max-IP também é estudada por este artigo Sobre a dureza do produto interno máximo aproximado e exato (bicromático) , que fornece uma caracterização para o caso bicromático (ou seja, para quais dimensões e relação aproximada , o problema pode ser resolvido em tempo?). O algoritmo desse artigo também funciona para o caso monocromático. $d$ $t$ $n^{2-\varepsilon}$

— Lijie Chen
fonte

O algoritmo de tempo requer alguns limites em ?

n^{2 - 1 / \tilde{O} ((d / \log n)^{1 / 3})}

$n^{2 - 1/\widetilde{O}((d/\log n)^{1/3})}$

d

$d$

— Michael Wehar 30/06/19

Se , acredito que as técnicas de Alman, Chan e Williams fornecem a solução mais conhecida para o problema de vetores não ortogonais. (Eles o definem de maneira diferente, como um problema de par mais próximo de Hamming, mas isso é equivalente a fatores poli ( ).) $k=O(\log n)$ $d$

Sem limite em , uma versão bicromática do Problema de Vetores Não Ortogonais é pelo menos tão difícil quanto o Problema de Vetores Ortogonais (OVP) até um fator . Primeiro, observe que, com um fator cima, podemos reduzir para a versão bicromática do OVP, onde (união em conjuntos de "cores" diferentes) e estamos interessados apenas em pares ortogonais bicromáticos . Segundo, com um fator acima, podemos reduzir ao caso especial de OVP bicromático, em que todos os vetores em têm o mesmo peso de Hamming . Por fim, invertendo todos os vetores em para obter $k$ $d \log n$ $\log n$ $S = S_1 \cup S_2$ $(v_1,v_2)\in S_1\times S_2$ $d$ $S_1$ $w$ $S_2$ $S'_2$ , vemos que e têm um par ortogonal se e somente se e tiverem um par de vetores com produto escalar pelo menos . Não tenho certeza se há uma redução eficiente do problema bicromático de vetores não ortogonais para a versão monocromática que você descreve. $S_1$ $S_2$ $S_1$ $S'_2$ $w$

Se você permitir a aproximação, há vários resultados recentes para o problema bicromático de vetores não ortogonais (geralmente chamado de problema de pesquisa interna máxima do produto). Veja, por exemplo, este artigo e suas referências.

— Rasmus Pagh
fonte

Equivalências:

O problema de vetores não ortogonais (como definido acima) para um conjunto $S$ de $n$ vetores booleanos, cada um de comprimento $d$ e um número inteiro positivo $k$ é equivalente ao seguinte:

Encontre uma submatriz $2$ por $k$ de 1's em um dado $n$ por $d$ Matriz booleana.

Encontrar um $\mathrm{K}_{2,k}$ subgráfico completa em um determinado gráfico bipartido, onde o primeiro conjunto de vértices tem o tamanho $n$ e o segundo conjunto de vértices tem o tamanho $d$ .

Algoritmo ingênuo:

A abordagem ingênua para o problema de vetores não-ortogonais é executada em $O(d \cdot n^2)$ tempo, porque leva $O(d \cdot n^2)$ tempo para calcular ingenuamente o produto escalar de cada par de vetores.

Responda às perguntas (2) e (3):

Sim, existem vários algoritmos que são mais eficientes em diferentes casos.

Primeira abordagem:

Podemos resolver o problema de vetores não ortogonais no tempo $O(d \cdot n + k \cdot n^2)$ .

Nota: Como o produto escalar de dois vetores booleanos de comprimento $d$ deve ser delimitado por $d$ , o problema só faz sentido quando $k \leq d$ .

Prova. Seja dado um conjunto $S$ de $n$ vetores booleanos, cada um de comprimento $d$ e um número inteiro positivo $k$ . Considere-se uma enumeração $\{s_i\}_{i\in[n]}$ dos elementos de $S$ .

Criar uma hashmap $m$ de pares $(a,b) \in [n] \times [n]$ para $\mathbb{N}$ . Inicialmente, $m$ mapeia cada entrada para o valor 0.

Para cada $i \in [d]$ , fazemos o seguinte. Enumere através de pares de vetores $s_a$ , $s_b$ modo que $a < b$ , o $i$ bit de $s_a$ seja 1 e o $i$ bit de $s_b$ seja 1. Para cada um desses $s_a$ e $s_b$ se $m(a,b) = k - 1$ , então $s_a$ e $s_b$ são não ortogonais, isto é, $s_a \cdot s_b \geq k$ . Caso contrário, incremente $m(a,b)$ e continue.

Se terminarmos a enumeração, nenhum par de vetores será não ortogonal.

Leva $O(n \cdot d)$ tempo para percorrer todos os bits de cada vector. Em seguida, leva mais tempo para enumerar pares de vetores. Porque existem no máximo ${n \choose 2}$ pares de vetores e cada par pode aparecer no máximo $k-1$ vezes antes de se mostrar não ortogonal, enumerar os pares leva no máximo $O(k \cdot n^2)$ . Portanto, o tempo de execução total é $O(d \cdot n + k \cdot n^2)$ .

Nota: Quando $k = 2$ , podemos melhorar essa abordagem para o tempo $O(n \cdot d)$ . Isso ocorre porque quando $k = 2$ , podemos reduzir a localização de um par de vetores não ortogonais entre $n$ vetores booleanos de comprimento $d$ para encontrar um par de vetores não ortogonais entre $d$ vetores booleanos de comprimento $n$ .

Segunda abordagem:

Podemos resolver o problema de vetores não ortogonais em $O(k \cdot {d \choose k} \cdot n)$ de tempo.

Prova. Seja dado um conjunto $S$ de $n$ vetores booleanos, cada um de comprimento $d$ e um número inteiro positivo $k$ .

Enumere através dos conjuntos $P \subseteq [d]$ modo que $P$ tenha o tamanho $k$ . Para cada vector $v \in S$ , verificar se $v$ tem todos os 1 de nas posições em $P$ . Existem dois vetores que têm todos os 1s nas posições em $P$ , então encontramos dois vetores não ortogonais.

No total, existem ${d \choose k}$ possíveis escolhas para $P$ . E, para cada escolha, nós fazemos a varredura através $k \cdot n$ pedaços dos vetores. Portanto, no total, o tempo de execução é $O(k \cdot {d \choose k} \cdot n)$ .

Terceira abordagem:

Quando $d \leq n$ , podemos resolver o problema de vetores não-ortogonais em $O(d^{\omega - 2} \cdot n^2)$ tempo em que $\omega$ é o expoente da multiplicação da matriz inteira. Quando $d > n$ , podemos resolver o problema de vetores não-ortogonais no tempo $O(d \cdot n^{\omega - 1})$ .

Nota: Conforme apontado por @Rasmus Pagh, podemos melhorar esse algoritmo para $O(n^{2 + o(1)})$ tempo em que $d \leq n^{0.3}$ . Veja aqui para mais informações: https://arxiv.org/abs/1204.1111

Prova. Seja dado um conjunto $S$ de $n$ vetores booleanos, cada um de comprimento $d$ e um número inteiro positivo $k$ .

Considere matrizes $A$ e $B$ . A primeira matriz $A$ tem dimensões $n$ por $d$ em que cada linha de $A$ é um vector a partir de $S$ . A segunda matriz $B$ tem dimensões $d$ por $n$ , onde cada coluna de $B$ é um vector a partir de $S$ .

Podemos calcular o produto escalar de cada par de vetores em $S$ calculando $A \cdot B$ usando algoritmos para multiplicação rápida da matriz inteira.

Quando $d \leq n$ , uma abordagem é converter a multiplicação de matriz retangular em $(\frac{n}{d})^2$ multiplicações do quadrado $d$ por $d$ matrizes. Usando a multiplicação rápida da matriz quadrada, podemos calcular todas as multiplicações em $O((\frac{n}{d})^2 \cdot d^{\omega}) = O(d^{\omega - 2} \cdot n^2)$ tempo.

Quando $d > n$ , uma abordagem é converter a multiplicação de matriz retangular em $\frac{d}{n}$ multiplicações de $n$ quadradospor $n$ matrizes. Usando a multiplicação rápida da matriz quadrada, podemos calcular todas as multiplicações em $O((\frac{d}{n}) \cdot n^{\omega}) = O(d \cdot n^{\omega - 1})$ hora.

— Michael Wehar
fonte

Vamos comparar essas três abordagens em vários casos diferentes. Caso 1: Quando

é fixo

, a segunda abordagem é mais eficiente.

k

$k$

d = O (\log^{2} (n))

$d = O(\log^2(n))$

— Michael Wehar 30/06/19

Caso 2: Quando

para qualquer

, a primeira abordagem é, por vezes, mais eficiente.

k = O (\log^{2} (n))

$k = O(\log^2(n))$

d = O (n^{α})

$d=O(n^{\alpha})$

α \in (0.3, 1)

$\alpha \in (0.3,1)$

— Michael Wehar 30/06/19

Caso 3: Quando

, o terceiro caso às vezes é mais eficiente.

d \leq n^{0.3}

$d \leq n^{0.3}$

— Michael Wehar 30/06/19

Caso 4: Quando

são maiores que

, a terceira abordagem às vezes é mais eficiente.

d

$d$

k

$k$

n

$n$

— Michael Wehar 30/06/19

Nota: A primeira abordagem é bastante semelhante ao algoritmo para encontrar um ciclo de quatro em um gráfico em tempo quadrático. Veja aqui: sciencedirect.com/science/article/pii/S0304020808730196

— Michael Wehar