Não sei se você considerará o seguinte um limite não trivial, mas aqui vou eu.
Primeiro, para ficar claro, para que não confundamos -DNF com k- termo DNF (o que costumo fazer), uma fórmula c -DNF sobre as variáveis x 1 , … , x n tem a forma ∨ k i = 1 ( ℓ i , 1 ∧ ℓ i , 2 . . . ℓ i , c ) onde ∀ 1 ≤ i ≤ k e 1 ≤ j ≤ cckcx1,…,xn∨ki=1(ℓi,1∧ℓi,2...ℓi,c)∀1≤i≤k1≤j≤c, .ℓi , j∈ { x1 1, … , Xn, x¯1 1, ... ,X¯n}
Podemos primeiro perguntar quantos termos distintos podem existir em um -DNF. Cada termo terá c das n variáveis, cada uma negada ou não - resultando em 2 c ( nccn termos possíveis diferentes. Em uma instância 2-DNF, cada termo aparecerá ou não, resultando em| H| =22c ( n2c( nc) possíveis "alvos", ondeHé o espaço de hipóteses.| H | = 22c( nc)H
Imagine um algoritmo que tire amostras e tente todas as | H | hipóteses até encontrar uma que prediz perfeitamente as amostras. O teorema da navalha de Occam diz que você só precisa tomar m = O ( 1m| H |amostras para este algoritmo para encontrar um alvo com erro≤ϵcom probabilidade≥1-δ.m = O ( 1ϵ| ( H | + 1δ)≤ ϵ≥ 1 - δ
No nosso caso, para , lg | H | = O ( n 2 ) , o que significa que você precisará de n 2 amostras para fazer o aprendizado (adequado).c = 2lg| H | =O( n2)n2
Mas o jogo inteiro no aprendizado não é realmente uma amostra de complexidade (embora isso faça parte do jogo, especialmente no aprendizado eficiente de atributos), mas na tentativa de projetar algoritmos de tempo polinomial. Se você não se importa com eficiência, então é a resposta mais simples para a complexidade da amostra de PAC.n2
UPDATE (dada a pergunta alterada) :
Como você declarou explicitamente que se importava apenas com a complexidade da amostra, apresentei o algoritmo de Occam de força bruta, que é provavelmente o argumento mais simples. No entanto, minha resposta foi um pouco tímida. -DNF são realmente aprendíveis em tempo polinomial! Este é um resultado do artigo original de Valiant, " Uma teoria do aprendiz ". De fato, c -DNF pode ser aprendido para qualquer c = O ( 1 ) .2cc = O ( 1 )
O argumento é o seguinte. Você pode ver um -DNF como uma disjunção de ≈ n c
"meta-variáveis" e tentar aprender a disjunção, eliminando os meta-variáveis inconsistente com os exemplos. Essa solução pode ser facilmente traduzida de volta para uma solução "adequada" e leva tempo O ( n c ) . Como observação lateral, ainda está em aberto se existe um algoritmo de tempo polinomial para c = ω ( 1 ) .c≈ ncO ( nc)c=ω(1)
Quanto à complexidade da amostra também ser um limite inferior, a resposta é praticamente sim. Este artigo de Ehrenfeucht et al. mostra que o limite do Occam está quase apertado.n2