O conceito central aqui é a complexidade de Kolmogorov e, mais especificamente, a compressibilidade . Para obter uma sensação intuitiva de compressibilidade, considere duas seqüências de caracteres e B ∈ B ∗ , onde B = { 0 , 1 } . DeixeiA∈B∗B∈B∗B={0,1}
1010 1010 1010 eA=1010 1010 1010 1010
0110 0111 1001 .B=1011 0110 0111 1001
Note que . Como poderíamos quantificar quanta informação A ou B possui? Se pensarmos na teoria clássica da informação, em geral, transmitir uma sequência de comprimento n leva n bits em média. No entanto, não podemos dizer quantos bits precisamos para transmitir uma sequência específica de comprimento n .|A|=|B|=16ABnnn
Por que o conteúdo de informações de uma sequência aleatória não é zero?
Em uma análise mais detalhada, podemos ver que, de fato, . No entanto, é muito mais difícil de dizer se B tem quaisquer padrões óbvios em sua estrutura, pelo menos ele parece e se sente mais aleatória do que A . Como podemos encontrar um padrão em A , podemos compactar facilmente A e representá-lo com menos de 16 bits. Da mesma forma, como não é fácil detectar nenhum padrão em B , não podemos compactá-lo tanto. Portanto, podemos dizer que B tem mais informações do que um . Além disso, uma sequência aleatória de comprimento nA=108BAAA16BBAnpossui informações máximas, pois não há como compactá-las e, portanto, representá-las com menos de bits.n
O que é informação útil, então?
Para informação útil , sim, há uma definição usando uma máquina de Turing . A informação útil em x ∈ B ∗ éTx∈B∗
minT { l(T)+C(x|T):T∈{T0,T1,...}},
onde indica o comprimento de uma codificação de auto-limitante para uma máquina de Turing T . A notação é geralmente tal que C ( x ) indica a complexidade de Kolmogorov de X e C ( x | y ) a complexidade de Kolmogorov condicional de x dadas y .l(T)TC(x)xC(x|y)xy
Aqui incorpora a quantidade de informações úteis contidas em x . O que poderíamos perguntar é qual desses T selecionar entre aqueles que atendem ao requisito. O problema é separar um programa mais curto x ∗ em partes x ∗ = p q st p representa um T apropriado . Esta é realmente a própria idéia que gerou o comprimento mínimo da descrição (MDL) .TxTx∗x∗=pqpT