Robustez de dividir uma junta


16

Dizemos que uma função booleana f : { 0 , 1 } n{ 0 , 1 }f:{0,1}n{0,1} é uma kk -junta se ff tiver no máximo kk variáveis ​​de influência.

Deixe- f : { 0 , 1 } n{ 0 , 1 }f:{0,1}n{0,1} ser um 2 k2k -junta. Denote as variáveis ​​de ff por x 1 , x 2 , , x nx1,x2,,xn . Correção S 1 = { x 1 , x 2 , , x n2 } ,S 2 = { x n2 +1,xn2 +2,,xn}.

S1={x1,x2,,xn2},S2={xn2+1,xn2+2,,xn}.
Claramente, existeS{S1,S2}S{S1,S2}tal queSScontém pelo menoskkdas variáveis ​​influentes deff .

Agora vamos ε > 0ϵ>0 , e assumir que f : { 0 , 1 } n{ 0 , 1 }f:{0,1}n{0,1} é εϵ -muito de cada 2 k2k -junta (ou seja, tem de se mudar uma fração de pelo menos εϵ dos valores de ff para torná-lo 2 k2k -junta). Podemos fazer uma versão "robusta" da declaração acima? Ou seja, existe uma constante universal cc e um conjunto S { S 1 , S 2 }S{S1,S2} tal queff é ϵcϵc -para qualquer função que contenha no máximokkvariáveis ​​influentes emSS?

Nota: Na formulação original da pergunta, cc foi fixado em 22 . O exemplo de Neal mostra que esse valor de cc não é suficiente. No entanto, como nos testes de propriedades geralmente não estamos muito preocupados com constantes, relaxei um pouco a condição.


Você pode esclarecer seus termos? Uma variável está "influenciando", a menos que o valor de f seja sempre independente da variável? "Alterar um valor de f " significa alterar um dos valores f ( x ) para um determinado x ? ff(x)x
Neal Young

Obviamente, a variável x i está influenciando se existir uma string n- bits y tal que f ( y )xinyf ( y ' ) , onde Y ' é a cadeia y com o seu i 'th coordenada invertida. Alterar o valor de f significa fazer uma alteração em sua tabela de verdade. f(y)f(y)yyif

Respostas:


17

A resposta é sim". A prova é por contradição.

Para conveniência notacional, vamos denotar as primeiras n / 2 variáveis ​​por x e a segunda n / 2 variáveis ​​por y . Suponhamos que f ( x , y ) é δ -próximo para uma função f 1 ( x , y ) que depende apenas de k coordenadas x . Denuncie suas coordenadas influentes por T 1 . Da mesma forma, suponha que f ( x , y ) sejan / 2xn / 2yf( x , y)δf1 1( x , y)kxT1 1f( x , y)δ- fecha para uma função f 2 ( x , y ) que depende apenas dascoordenadas k de y . Denotam suas coordenadas influentes por T 2 . Precisamos provar que f é 4 δ - próximo a 2 k -junta ˜ f ( x , y ) .δf2( x , y)kyT2f4 δ2 kf~( x , y)

Digamos que ( x 1 , y 1 ) ( x 2 , y 2 ) se x 1 e x 2 concordam com todas as coordenadas em T 1 e y 1 e y 2 concordam com todas as coordenadas em T 2 . Escolhemos uniformemente aleatoriamente um representante de cada classe de equivalência. Seja ( ˉ x , ˉ y ) o representante da classe de ( x y( x1 1, y1 1) ( x2, y2)x1 1x2T1 1y1 1y2T2( x¯, y¯) , ) . Defina ˜ f da seguinte maneira: ˜ f ( x , y ) = f ( ˉ x , ˉ y ) .( x , y)f~

f~( x , y) = f( x¯, y¯) .

É óbvio que ~ f é um 2 k -junta (que depende somente de variáveis em T 1T 2 ) . Vamos provar que está à distância 4 δ de f na expectativa.f~2 kT1 1T2)4 δf

Queremos provar que Pr ˜ f ( Pr x , y ( ˜ f ( x , y ) f ( x , y ) ) ) = Pr ( f ( ˉ x , ˉ y ) f ( x , y ) ) 4 δ , onde x e y são escolhidos uniformemente aleatoriamente. Considere um vetor aleatório

Prf~(Prx,y(f~(x,y)f(x,y)))=Pr(f(x¯,y¯)f(x,y))4δ,
xy~ X obtida a partir dex, mantendo todos os bits emT1e lançando aleatoriamente todos os bits não not1, e um vector ~ y definido de forma semelhante. Note-se que Pr( ~ f (x,y)f(x,y))=Pr(f( ˉ x , ˉ y )f(x,y))=(x~xT1T1y~ Prf ( ˜ x , ˜ y ) f ( x , y ) ) .
Pr(f~(x,y)f(x,y))=Pr(f(x¯,y¯)f(x,y))=Pr(f(x~,y~)f(x,y)).

Temos, Pr ( f ( x , y ) f ( ˜ x , y ) ) Pr ( f ( x , y ) f 1 ( x , y ) ) + Pr ( f 1 ( x , y ) f 1 ( ˜ x , y ) ) + Pr ( f1 ( ˜ x , y ) f ( ˜ x , y ) ) δ + 0 + δ = 2 δ .

Pr(f(x,y)f(x~,y))Pr(f(x,y)f1(x,y))+Pr(f1(x,y)f1(x~,y))+Pr(f1(x~,y)f(x~,y))δ+0+δ=2δ.

Da mesma forma, Pr ( f ( ˜ x , y ) f ( ˜ x , ˜ y ) ) 2 δ . Temos Pr ( f ( ˉ x , ˉ y ) f ( x , y ) ) 4 δ .Pr(f(x~,y)f(x~,y~))2δ

Pr(f(x¯,y¯)f(x,y))4δ.
QED

É fácil "derandomizar" essa prova. Para cada ( x , y ) , vamos ~ f ( x , y ) = 1 se f ( x , y ) = 1 para a maioria ( x ' , y ' ) na classe de equivalência de ( x , y ) , e ~ f ( x , y ) = 0 , caso contrário.(x,y)f~(x,y)=1f(x,y)=1(x,y)(x,y)f~(x,y)=0


12

O menor c que o limite contém é c = 1c2 -12,41.c=1212.41

Os lemas 1 e 2 mostram que o limite é válido para este c . O lema 3 mostra que esse limite é rígido.c

(Em comparação, o elegante argumento probabilístico de Juri fornece c = 4. )c=4

Seja c = 12 -1. O lema 1 fornece o limite superior parak=0.c=121k=0

Lema 1: Se f é ε g -perto uma função g que não tem variáveis que influenciam em S 2 , e f é ε h -perto uma função h que não tem influencia variáveis em S 1 , então f é ε -perto uma função constante , onde ϵ ( ϵ g + ϵ h ) / 2fϵggS2fϵhhS1fϵc .ϵ(ϵg+ϵh)/2c

Prova. Deixe ε ser a distância de f a uma função constante. Suponha por contradição que ϵ não satisfaça a desigualdade reivindicada. Seja y = ( x 1 , x 2 , , x n / 2 ) e z = ( x n / 2 + 1 , , x n ) e escreva f , g , eh como f ( yϵfϵy=(x1,x2,,xn/2)z=(xn/2+1,,xn)fgh , z ) , g ( y , z )f(y,z)g(y,z) e h ( y , z ) , de forma g ( y , z ) é independente de z e h ( y , z ) é independente de y .h(y,z)g(y,z)zh(y,z)y

(I find it helpful to visualize ff as the edge-labeling of the complete bipartite graph with vertex sets {y}{y} and {z}{z}, where gg gives a vertex-labeling of {y}{y}, and hh gives a vertex-labeling of {z}{z}.)

Let g0g0 be the fraction of pairs (y,z)(y,z) such that g(y,z)=0g(y,z)=0. Let g1=1g0g1=1g0 be the fraction of pairs such that g(y,z)=1g(y,z)=1. Likewise let h0h0 be the fraction of pairs such that h(y,z)=0h(y,z)=0, and let h1h1 be the fraction of pairs such that h(y,z)=1h(y,z)=1.

Without loss of generality, assume that, for any pair such that g(y,z)=h(y,z)g(y,z)=h(y,z), it also holds that f(y,z)=g(y,z)=h(y,z)f(y,z)=g(y,z)=h(y,z). (Otherwise, toggling the value of f(y,z)f(y,z) allows us to decrease both ϵgϵg and ϵhϵh by 1/2n1/2n, while decreasing the ϵϵ by at most 1/2n1/2n, so the resulting function is still a counter-example.) Say any such pair is ``in agreement''.

The distance from ff to gg plus the distance from ff to hh is the fraction of (x,y)(x,y) pairs that are not in agreement. That is, ϵg+ϵh=g0h1+g1h0ϵg+ϵh=g0h1+g1h0.

The distance from ff to the all-zero function is at most 1g0h01g0h0.

The distance from ff to the all-ones function is at most 1g1h11g1h1.

Further, the distance from ff to the nearest constant function is at most 1/21/2.

Thus, the ratio ϵ/(ϵg+ϵh)ϵ/(ϵg+ϵh) is at most min(1/2,1g0h0,1g1h1)g0h1+g1h0,

min(1/2,1g0h0,1g1h1)g0h1+g1h0,
where g0,h0[0,1]g0,h0[0,1] and g1=1g0g1=1g0 and h1=1h0h1=1h0.

By calculation, this ratio is at most 12(21)=c/212(21)=c/2. QED

Lemma 2 extends Lemma 1 to general kk by arguing pointwise, over every possible setting of the 2k2k influencing variables. Recall that c=121c=121.

Lemma 2: Fix any kk. If ff is ϵgϵg-near a function gg that has kk influencing variables in S2S2, and ff is ϵhϵh-near a function hh that has kk influencing variables in S1S1, then ff is ϵϵ-near a function ˆff^ that has at most 2k2k influencing variables, where ϵ(ϵg+ϵh)/2cϵ(ϵg+ϵh)/2c.

Proof. Express ff as f(a,y,b,z)f(a,y,b,z) where (a,y)(a,y) contains the variables in S1S1 with aa containing those that influence hh, while (b,z)(b,z) contains the variables in S2S2 with bb containing those influencing gg. So g(a,y,b,z)g(a,y,b,z) is independent of zz, and h(a,y,b,z)h(a,y,b,z) is independent of yy.

For each fixed value of aa and bb, define Fab(y,z)=f(a,y,b,z)Fab(y,z)=f(a,y,b,z), and define GabGab and HabHab similarly from gg and hh respectively. Let ϵgabϵgab be the distance from FabFab to GabGab (restricted to (y,z)(y,z) pairs). Likewise let ϵhabϵhab be the distance from FabFab to HabHab.

By Lemma 1, there exists a constant cabcab such that the distance (call it ϵabϵab) from FabFab to the constant function cabcab is at most (ϵhab+ϵgab)/(2c)(ϵhab+ϵgab)/(2c). Define ˆf(a,y,b,z)=cabf^(a,y,b,z)=cab.

Clearly ˆff^ depends only on aa and bb (and thus at most kk variables).

Let ϵˆfϵf^ be the average, over the (a,b)(a,b) pairs, of the ϵabϵab's, so that the distance from ff to ˆff^ is ϵˆfϵf^.

Likewise, the distances from ff to gg and from ff to hh (that is, ϵgϵg and ϵh)ϵh) are the averages, over the (a,b)(a,b) pairs, of, respectively, ϵgabϵgab and ϵhabϵhab.

Since ϵab(ϵhab+ϵgab)/(2c)ϵab(ϵhab+ϵgab)/(2c) for all a,ba,b, it follows that ϵˆf(ϵg+ϵh)/(2c)ϵf^(ϵg+ϵh)/(2c). QED

Lemma 3 shows that the constant cc above is the best you can hope for (even for k=0k=0 and ϵ=0.5ϵ=0.5).

Lemma 3: There exists ff such that ff is (0.5/c)(0.5/c)-near two functions gg and hh, where gg has no influencing variables in S2S2 and hh has no influencing variables in S1S1, and ff is 0.50.5-far from every constant function.

Proof. Let yy and zz be xx restricted to, respectively, S1S1 and S2S2. That is, y=(x1,,xn/2)y=(x1,,xn/2) and z=(xn/2+1,,xn)z=(xn/2+1,,xn).

Identify each possible yy with a unique element of [N][N], where N=2n/2N=2n/2. Likewise, identify each possible zz with a unique element of [N]. Thus, we think of f as a function from [N]×[N] to {0,1}.

Define f(y,z) to be 1 iff max(y,z)12N.

By calculation, the fraction of f's values that are zero is (12)2=12, so both constant functions have distance 12 to f.

Define g(y,z) to be 1 iff y12N. Then g has no influencing variables in S2. The distance from f to g is the fraction of pairs (y,z) such that y<12N and z12N. By calculation, this is at most 12(112)=0.5/c

Similarly, the distance from f to h, where h(y,z)=1 iff z12N, is at most 0.5/c.

QED


First of all, thanks Neal! This indeed sums it up for k=0, and sheds some light on the general problem. However in the case of k=0 the problem is a bit degenerate (as 2k=k), so I'm more curious regarding the case of k1. I didn't manage to extend this claim for k>0, so if you have an idea on how to do it - I'd appreciate it. If it simplifies the problem, then the exact constants are not crucial; that is, ϵ/2-far can be replaced by ϵ/c-far, for some universal constant c.

2
I've edited it to add the extension to general k. And Yuri's argument below gives a slightly looser factor with an elegant probabilistic argument.
Neal Young

Sincere thanks Neal! This line of reasoning is quite enlightening.
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.