Vou dar dois limites superiores. Seja e os conjuntos dados a Alice e Bob, respectivamente, e coloque,,.B a = | Um | b = | B | c = | A ∩ B |ABa=|A|b=|B|c=|A∩B|
Primeiro, existe um protocolo aleatório que, dado e , calcula com probabilidade uma aproximação de até o erro aditivo , usando bits de comunicação e bits de aleatoriedade.d>0ϵ>0≥1−ϵcdO((min{a,b}d)2lognlogϵ−1)O((min{a,b}d)2logmin{a,b}logϵ−1)
O protocolo é o seguinte:
Se , a parte que o vê encerra o protocolo e gera como a estimativa. Caso contrário, Alice e Bob comunicar e para o outro, e determinar qual é menor. Assumirei abaixo do wlog que .d≥min{a,b}0aba≤b
Alice desenha amostras aleatórias uniformemente independentes , , e as envia para Bob.t=log(2ϵ−1)a2/(2d2)ai∈Ai<t
Bob estima como.cat|{i<t:ai∈B}|
O protocolo está correto pelos limites de Chernoff-Hoeffding: se denota a variável aleatória indicadora do evento , então , , são variáveis iid com média . Assim,
e da mesma forma para .Xiai∈BXii<tp=c/a
Pr[aX¯¯¯¯≤c−d]=Pr[X¯¯¯¯≤p−da]≤exp(−2(da)2t)≤ϵ2,
Pr[aX¯¯¯¯≥c+d]
Agora, esses limites são um pouco inúteis se: : também existem limites de Chernoff que indicam
que nos permitiria conviver com o número de amostras menores por um fator de aproximadamente . O problema é que é a mesma quantidade que queremos aproximar, portanto, não a conhecemos adiante. Isso pode ser remediado fazendo-se primeiro uma estimativa do de .c≪a
Pr[X¯¯¯¯≤p−δ]Pr[X¯¯¯¯≥p+δ]≤exp(−δ22pt),≤exp(−δ23pt),δ≤p,
tpp=c/ac
Portanto, o protocolo aprimorado calcula com probabilidade uma aproximação aditiva de usando bits de comunicação e bits de aleatoriedade e é o seguinte (as constantes não são otimizadas):≥1−ϵdcO(min{a,b}d(1+cd)lognlogϵ−1)O(min{a,b}d(1+cd)logmin{a,b}logϵ−1)
O mesmo que acima.
Alice desenha amostras aleatórias de e as envia para Bob.r=10(logϵ−1)a/dA
Bob conta quantas dessas amostras pertencem a e envia esse número, , para Alice.Bs
Se , o protocolo termina com a saída .as/r≤d/20
Alice desenha amostras aleatórias , envia para Bob.t=10sa/dai∈Ai<t
Bob estima como.cat|{i<t:ai∈B}|
Sem entrar em detalhes, os limites de Chernoff citados acima implicam que, com alta probabilidade, o valor de é , caso em que o protocolo não excede o custo declarado e calcula com alta probabilidade uma boa estimativa de por outra aplicação dos limites de Chernoff.s/rΘ(c/a)c