Essa é uma pergunta interessante e eu já pensei nisso antes. Aqui está o que descobrimos:
Você executar o seu algoritmo de vezes para obter saídas x 1 , ⋯ , x n ∈ R d e você sabe o que com grande probabilidade de uma grande fração de x i queda s em um bom conjunto G . Você não sabe o que é G , apenas que é convexo. A boa notícia é que existe uma maneira de obter um ponto em G sem mais informações. Chame esse ponto de f ( x 1 , ⋯ , x n ) .nx1 1, ⋯ , xn∈ RdxEuGGGf( x1 1, ⋯ , xn)
Teorema. Para todos os números naturais e d , existe uma função f : ( R d ) n → R d, de modo que o seguinte seja válido. Seja x 1 . . . x n ∈ R d e deixar L ⊂ R d seja um conjunto convexo satisfazendo 1ndf: ( Rd)n→ Rdx1 1. . . xn∈ RdG ⊂ RdEm seguida,f(x1,...,Xn)∈L. Além disso,fé computável no tempo polinomial emnd.
1 1n| { i ∈ [ n ] : xEu∈ G } | > dd+ 1.
f( x1 1, . . . , xn) ∈ Gfnd
Observe que, para , podemos definir f como a mediana. Portanto, isso mostra como generalizar a mediana para d > 1 .d= 1fd> 1
Antes de provar esse resultado, observe que ele é estanque: Seja e x 1 , ⋯ , x d sejam os elementos base padrão ex x d + 1 = 0 . Qualquer subconjunto de d dos pontos está contido em um espaço afim G da dimensão d - 1 (que é definida exclusivamente por esses pontos). Mas nenhum ponto está contido em todos esses espaços afins. Portanto, existe algum G convexo que contém n ⋅ d / ( d +n = d+ 1x1 1, ⋯ , xdxd+ 1= 0dGd- 1G pontos, mas não contém f ( x 1 , ⋯ , x n ) , qualquer que seja o valor que leva.n ⋅ d/ (d+ 1 ) = df( x1 1, ⋯ , xn)
Prova. Usamos o seguinte resultado.
Teorema de Helly. Seja sejam subconjuntos convexos de R d . Suponha que a interseção de qualquer d + 1 K i s não seja vazia. Em seguida, a intersecção de todos K i s é não vazio.K1 1. . . KmRdd+ 1 KEuKEu
Clique aqui para obter uma prova do Teorema de Helly.
Agora, para provar nosso teorema:
Deixe que ser um limite superior para o número de pontos não em G . Considere todos os meios-espaços fechados K 1 . . . K m ⊂ R d contendo pelo menos n - k pontos com seus limites contendo um conjunto de pontos de classificação máxima (este é um número finito de meiosespaços, pois cada K i é definido por d + 1 pontos em seu limite).k < n / ( d+ 1 )GK1 1. . . Km⊂ Rdn - kKEud+ 1
O complemento de cada contém no máximo k pontos. Por um limite de união, a interseção que qualquer d + 1 K i s contém pelo menos n - k ( d + 1 ) > 0 pontos. Pelo teorema de Helly (desde halfspaces são convexas), há um ponto na intersecção de toda a K i s . Seja f uma função que calcule um ponto arbitrário na interseção dos K i s.KEukd+ 1 KEun - k ( d+ 1 )KEusfKEu
Tudo o que resta é o de mostrar que a intersecção entre o s está contido na L .KEuG
Sem perda de generalidade, é o casco convexo de um subconjunto dos pontos com classificação completa. Ou seja, podemos substituir G pelo casco convexo dos pontos que ele contém. Se isso não tiver uma classificação completa, podemos simplesmente aplicar nosso teorema na dimensão inferior.GG
Cada face de define um meio espaço, onde G é a interseção desses meios espaços. Cada um desses semi-espaços contém G e, portanto, contém pelo menos n - k pontos. O limite de um desses semi-espaços contém uma face de G e, portanto, contém um conjunto de pontos de classificação máxima. Assim, cada um desses semi-espaços é um K i . Assim, o cruzamento de todos K i s está contido em L , como exigido.GGGn - kGKEuKEuG
Para calcular , configure um programa linear em que as restrições lineares correspondam a K i se uma solução viável corresponda a um ponto na interseção de todos os k i .
QEDfKiKi
Infelizmente, esse resultado não é muito prático no cenário de alta dimensão. Uma boa pergunta é se podemos calcular mais eficiência:f
Problema em aberto. Prove o teorema acima com a conclusão adicional de que pode ser calculado no polinômio do tempo em n e d .
fnd
Além disso: também podemos mudar o problema para obter uma solução eficiente: se têm a propriedade que estritamente mais da metade deles está na bola B ( y , ε ) , então podemos encontrar um ponto z que se encontra em B ( y , 3 ε ) no polinômio do tempo em n e d . Em particular, podemos definir z = x i para um i arbitrário de modo que estritamente mais da metade dos pontos esteja em Bx1,⋯,xnB(y,ε)zB(y,3ε)ndz=xii .B(z,2ε)