Precisão numérica no método da soma dos quadrados?

Eu tenho lido um pouco sobre o método da soma dos quadrados (SOS) da pesquisa de Barak & Steurer e das notas de aula de Barak . Nos dois casos, eles varrem questões de precisão numérica para baixo do tapete.

Do meu entendimento (reconhecidamente limitado) do método, o seguinte deve ser verdadeiro:

Dado qualquer sistema de igualdades polinomiais sobre variáveis de valor real , em que todos os parâmetros são ( , e grau de cada restrição), o grau- " " ( ) O método SOS encontra uma atribuição satisfatória das variáveis ou prova que não existe no tempo . $E$ $x \in \mathbb{R}^n$ $O(1)$ $n$ $|E|$ $2n$ $=O(1)$ $O(1)$

Minha primeira pergunta é se a afirmação acima é verdadeira (existe um argumento ingênuo que não usa o SOS para resolver isso?). A segunda pergunta é onde a precisão numérica se encaixa. Se eu quiser obter uma atribuição que satisfaça todas as restrições com precisão aditiva , como o tempo de execução depende de ? Em particular, é polinomial? $\varepsilon$ $1/\varepsilon$

A motivação para isso é, por exemplo, aplicar uma abordagem de dividir e conquistar em um sistema grande até que o caso base seja um sistema de tamanho . $O(1)$

EDIT: De Barak-Steurer, parece que o " algoritmo da soma dos quadrados em graus " na p.9 (e os parágrafos anteriores) definem problemas para soluções em vez de e, de fato, a definição de um pseudo -Distribuição na seção 2.2 é mais de . Agora estou vendo no Lema 2.2, no entanto, que não é garantida uma solução / refutação no grau sem variáveis binárias. $l$ $\mathbb{R}$ $\mathbb{R}$ $2n$

Para refinar minha pergunta um pouco. Se suas variáveis não são binárias, a preocupação é que a sequência de saídas não seja finita (talvez nem mesmo monotônica aumente?). Portanto, a questão é: ainda está aumentando? E se sim, até que ponto você precisa ir para obter a precisão aditiva ? $\varphi^{(l)}$ $\varphi^{(l)}$ $\varepsilon$

Embora isso provavelmente não muda nada, acontece que eu sei que meu sistema é satisfiable (não há refutação de qualquer grau), então eu realmente estou apenas preocupado com o quão grande precisa ser. Finalmente, estou interessado em uma solução teórica, não em um solucionador numérico. $l$

optimization sum-of-squares

— Jeremy Kun
fonte

Decomposição computacional da soma dos quadrados com coeficientes racionais (2008)

— Rodrigo de Azevedo

Respostas:

Aqui está o comentário de Boaz Barak sobre o assunto:

Nós varremos a precisão numérica para baixo do tapete - a literatura SOS mais "tradicional" de Parrilo, Lasserre etc. lida com essas questões (por exemplo, consulte as pesquisas de Monique Laurent e as referências nela). Sabe-se que a hierarquia é monótona (não é difícil ver que um grau de distribuição psuedo é em particular um grau ), e que convergirá em grau finito para qualquer conjunto fixo de equações (isto é Positivstellensatz). O grau exato pode variar. Geralmente, se todos os coeficientes dos polinômios estiverem delimitados e você estiver tentando distinguir entre o caso em que existe uma solução e o caso em qualquer atribuição em que uma das equações está desativada por , pode-se discretizar isso para um $l$ $l-1$ $\epsilon$ -net para relacionado ao número de variáveis, grau de equações e , e então (supondo que a rede seja suficientemente "agradável" e "parecida com cubo"), o grau necessário deve ser aproximadamente o tamanho da rede. $\delta$ $\delta$ $\epsilon$

— Kaveh
fonte

Postado como uma resposta para evitar que o bot da comunidade troque a pergunta novamente no futuro.

— Kaveh

Acho que minha resposta provavelmente é insuficiente, mas permanece por uma questão de integridade (embora veja os comentários de Boaz abaixo para provavelmente uma resposta melhor)

Quando nos limitamos a variáveis booleanas, a afirmação pode ser vista quando para todos com a observação de que as pseudo-distribuições de grau são distribuições reais, ou seja, suponha que você tenha uma pseudo-distribuição sobre as soluções das suas igualdades polinomiais satisfazendo: $(x_i^2-1) \in E$ $i \in[n]$ $2n$ $\mu(x)$ $x$ $E$

e para todos os polinômios com grau no máximo $\sum_{ x \in \{-1,1\}^n} \mu(x)$ $\sum_{x\in\{-1,1\}^n} \mu(x) p^2(x)\ge0$ $p$ $n$

Mas os polinômios de grau incluem o polinômio indicador (por exemplo, possui que é zero em qualquer outro lugar e 1 nessa atribuição). Então para todos $n$ $x_1 = 1, x_2=-1, x_3=1$ $2^{-3}(1+x_1)(1-x_2)(1+x_3)$ $\mu(x) \ge 0$ , portanto, concluir é uma distribuição efectiva sobre as soluções de . Grau pseudo-distribuições podem ser encontrados através da utilização de programação semidefinido para encontrar um grau associado operador pseudo-expectativa em tempo, de modo que podemos encontrar a distribuição real no tempo através da utilização desse pseudo expectativa (agora uma expectativa real) de encontrar todos os momentos de . $x\in\{-1,1\}^n$ $\mu$ $E$ $\ell$ $\ell$ $n^{O(\ell)}$ $\mu$ $n^{O(n)}$ $\mu$

Então se , você pode encontrar uma distribuição de soluções para no tempo de . Obviamente, a busca por força bruta garante o mesmo. $|E| = O(1)$ $E$ $O(1)$

No entanto, se as soluções não forem necessariamente booleanas, as pseudo-expectativas de grau não serão suficientes para encontrar uma distribuição entre as soluções. Como pode ser visto acima, a prova de que as pseudo-distribuições do grau são distribuições reais depende do fato de que os polinômios do grau são suficientes para 'selecionar' as atribuições individuais, o que não é verdade de maneira mais geral. Outra maneira de ver é que polinômios de variável booleana são considerados $2n$ $2n$ $n$ , então o grau de todo monômio é no máximo . $\mod(x_i^2)$ $n$

Por exemplo, pode-se considerar a substituição de cada variável binária com uma variável 4-ário, digamos, incluindo . Então você teria que ter uma pseudo-expectativa de grau para garantir a recuperação de uma distribuição sobre soluções. $(x_i^2-1)(x_i^2-4) \in E$ $4n$

Agora, para garantias teóricas, parece que aproximar a raiz de um sistema de polinomal também é conhecido como o 17º problema de Smale e, aparentemente, existe um algoritmo de tempo polinomial aleatório (Las Vegas) que resolve isso - veja http://arxiv.org /pdf/1211.1528v1.pdf . Observe que isso parece estar no modelo Blum-Shub-Smale, portanto, as operações reais são as primitivas. Não tenho certeza se isso dá a garantia de que você precisa.

— Joe Bebel
fonte

Acho que posso não ter esclarecido isso: minhas variáveis

estão em

, pois, caso contrário, eu poderia fazer uma pesquisa trivial de

sobre o hipercubo booleano. Atualizei a pergunta para refletir isso. O SDP / SOS também se aplica a problemas de otimização de entrada real, certo?

x_{i}

$x_i$

R

$\mathbb{R}$

O (2^{n}) = O (1)

$O(2^n) = O(1)$

— Jeremy Kun

Opa, meu erro! Sim, isso se aplica a configurações mais gerais, embora muitas vezes apenas assumamos que estamos no hipercubo. Atualizei minha resposta, embora minha resposta seja menos clara do que eu esperava.

— Joe Bebel

Nós varremos a precisão numérica para debaixo do tapete - a literatura SOS mais "tradicional" de Parrilo, Lasserre etc. lida com essas questões (por exemplo, consulte as pesquisas de Monique Laurent e as referências nela). Sabe-se que a hierarquia é monótona (não é difícil ver que um grau

distribuição psuedo é particularmente um grau

um) e que convergirá em grau finito para qualquer conjunto fixo de equações (isto é Positivstellensatz).

ℓ

$\ell$

ℓ - 1

$\ell-1$

— Boaz Barak

..O grau exato pode variar. Geralmente, se todos os coeficientes dos polinômios estiverem delimitados e você estiver tentando distinguir entre o caso em que existe uma solução e o caso em qualquer atribuição, uma das equações estiver desativada por

, seria possível discretizá-lo para

- net para

relacionado ao número de variáveis, grau de equações e

, e então (supondo que a rede seja suficientemente "agradável" e "parecida com cubo"), o grau necessário deve ser aproximadamente o tamanho da rede.

ϵ

$\epsilon$

δ

$\delta$

δ

$\delta$

ϵ

$\epsilon$

— Boaz Barak

@BoazBarak talvez isso possa ser uma resposta?

— Suresh Venkat