É sabido que as fórmulas CNF podem ser divididas em 2 classes amplas: aleatória versus estruturada. As fórmulas estruturadas de CNF, em oposição às fórmulas aleatórias de CNF, exibem algum tipo de ordem, mostrando padrões que dificilmente acontecerão por acaso. No entanto, pode-se encontrar fórmulas estruturadas mostrando algum grau de aleatoriedade (ou seja, certos grupos específicos de cláusulas parecem muito menos estruturadas que outras), bem como fórmulas aleatórias com alguma forma fraca de estrutura (ou seja, certos grupos específicos de cláusulas parecem menos aleatórias que outras ) Portanto, parece que a aleatoriedade de uma fórmula não é apenas um fato sim / não.
Seja uma função que, dada uma fórmula CNF F ∈ F , retorne um valor real entre 0 e 1 inclusive: 0 significa uma fórmula estruturada pura, enquanto 1 significa uma fórmula aleatória pura.
Gostaria de saber se alguém já tentou inventar um . É claro que o valor retornado por r seria (pelo menos essa é a minha intenção) apenas uma medida prática de acordo com alguns critérios razoáveis, e não uma verdade teórica sólida.
Também estou interessado em saber se alguém já definiu e estudou algum indicador estatístico que possa ser usado na definição de ou na determinação de outras propriedades gerais úteis de uma fórmula. Por indicador estatístico, quero dizer algo assim:
- HCV (Contagem de Variância)
Vamos ser uma função que, dada uma variável v j ∈ N , devolve o número de vezes de v j aparece em F . Vamos V ser o conjunto de variáveis usadas em F . Deixe ˉ h F = 1ser o AHC (Contagem Média Hit). O HCV é definido da seguinte forma: HVC=1
Nos casos em aleatórios, o VHC é muito baixo (todas as variáveis são mencionados quase o mesmo número de vezes), enquanto que em casos estruturados não é (algumas variáveis são usados com muita frequência e outros não, ou seja, existem "grupos de uso").
. Essas variáveis que ocorrem metade das vezes positivas e metade das vezes negativas têm o Grau de Impureza máximo, enquanto as variáveis sempre positivas ou sempre negativas (ou seja, literais puros) têm o Grau de Impureza mínimo. O AID é simplesmente definido da seguinte forma: AID=1
Em instâncias aleatórias (pelo menos naquelas geradas pela negação de variáveis com probabilidade0,5), o AID é quase igual a1, enquanto em casos estruturados geralmente está longe de1.
- IDV (Impurity Degree Variance)
O IDV é um indicador mais robusto que o AID, pois é responsável por instâncias aleatórias geradas pela negação de variáveis com probabilidade diferente de . É definido como: I D V = 1
Motivações
- Para entender melhor como as fórmulas da CNF funcionam, como sua aleatoriedade / estrutura pode ser medida, se outras propriedades gerais úteis puderem ser inferidas observando seus indicadores estatísticos, se e como esses indicadores podem ser usados para acelerar a pesquisa.
- Pergunto-me se a satisfação (ou mesmo o número de soluções) de uma fórmula da CNF poderia ser inferida apenas manipulando com inteligência seus indicadores estatísticos.
Questões
- Alguém já propôs uma maneira de medir a aleatoriedade de uma fórmula da CNF?
- Alguém já propôs algum indicador estatístico que possa ser usado para estudar ou mesmo inferir mecanicamente propriedades gerais úteis de uma fórmula CNF?