Existe um procedimento simples que captura toda a intuição, incluindo os elementos psicológicos e geométricos. Ele se baseia no uso da proximidade espacial , que é a base da nossa percepção e fornece uma maneira intrínseca de capturar o que é imperfeitamente medido por simetrias.
Para fazer isso, precisamos medir a "complexidade" dessas matrizes em escalas locais variadas. Embora tenhamos muita flexibilidade para escolher essas escalas e escolher o sentido em que medimos a "proximidade", é simples e eficaz o suficiente para usar pequenos bairros quadrados e observar as médias (ou, equivalentemente, somas) dentro deles. Para esse fim, uma sequência de matrizes pode ser derivada de qualquer matriz por , formando somas de vizinhança em movimento usando por vizinhanças, depois por , etc., até por (embora normalmente haja poucos valores para fornecer algo confiável).mnk=2233min(n,m)min(n,m)
Para ver como isso funciona, vamos fazer os cálculos para as matrizes na pergunta, que chamarei de a , de cima para baixo. Aqui estão gráficos das somas móveis para ( é a matriz original, é claro) aplicada a .a1a5k=1,2,3,4k=1a1
No sentido horário, no canto superior esquerdo, é igual a , , e . As matrizes são por , depois por , por e por , respectivamente. Todos eles parecem meio "aleatórios". Vamos medir essa aleatoriedade com sua entropia de base 2. Para , a sequência dessas entropias é . Vamos chamar isso de "perfil" de .k124355442233a1(0.97,0.99,0.92,1.5)a1
Aqui, ao contrário, estão as somas móveis de :a4
Para há pouca variação, de onde baixa entropia. O perfil é . Seus valores são consistentemente inferiores aos de , confirmando a sensação intuitiva de que existe um forte "padrão" presente em .k=2,3,4(1.00,0,0.99,0)a1a4
Precisamos de um quadro de referência para interpretar esses perfis. Uma matriz perfeitamente aleatória de valores binários terá quase metade dos seus valores iguais a e a outra metade igual a , para uma entropia de . As somas móveis dentro de por vizinhanças tendem a ter distribuições binomiais, fornecendo entropias previsíveis (pelo menos para matrizes grandes) que podem ser aproximadas por :011kk1+log2(k)
Esses resultados são confirmados por simulação com matrizes de até . No entanto, eles quebram em pequenas matrizes (tais como os por matrizes aqui), devido à correlação entre janelas vizinhas (uma vez que o tamanho da janela é de cerca de metade das dimensões da matriz) e devido à pequena quantidade de dados. Aqui está um perfil de referência de matrizes aleatórias de por geradas por simulação, juntamente com gráficos de alguns perfis reais:m=n=1005555
Nesta plotagem, o perfil de referência é azul sólido. Os perfis da matriz correspondem a : vermelho, : ouro, : verde, : azul claro. (Incluir obscureceria a imagem porque ela se aproxima do perfil de .) No geral, os perfis correspondem à ordem na pergunta: eles ficam mais baixos no máximo em valores de medida que a ordem aparente aumenta. A exceção é : até o final, para , suas somas móveis tendem a ter entre as entropias mais baixas . Isso revela uma regularidade surpreendente: a cada por bairroa1a2a3a4a5a4ka1k=422a1 tem exatamente ou quadrados pretos, nunca mais ou menos. É muito menos "aleatório" do que se poderia pensar. (Isso ocorre em parte devido à perda de informações que acompanham a soma dos valores em cada vizinhança, um procedimento que condensa configurações possíveis de vizinhança em apenas somas possíveis. Se quisermos explicar especificamente para o agrupamento e orientação dentro de cada bairro, em seguida, em vez de usar somas móveis usaríamos concatenations em movimento. Ou seja, cada por bairro tem122k2k2+1kk2k2possíveis configurações diferentes; Ao distinguir todos eles, podemos obter uma medida mais fina da entropia. Eu suspeito que essa medida elevaria o perfil de comparação com as outras imagens.)a1
Essa técnica de criar um perfil de entropias em uma escala controlada de escalas, somando (ou concatenando ou combinando de outra forma) valores dentro de bairros em movimento, tem sido usada na análise de imagens. É uma generalização bidimensional da conhecida idéia de analisar o texto primeiro como uma série de letras, depois como uma série de dígitos (sequências de duas letras), depois como trigramas, etc. Também possui algumas relações evidentes com o fractal análise (que explora propriedades da imagem em escalas cada vez mais finas). Se tomarmos o cuidado de usar uma soma móvel de blocos ou concatenação de blocos (para que não haja sobreposições entre janelas), é possível derivar relacionamentos matemáticos simples entre as entropias sucessivas; Contudo,
São possíveis várias extensões. Por exemplo, para um perfil invariavelmente rotacional, use vizinhanças circulares em vez de quadradas. Tudo generaliza além de matrizes binárias, é claro. Com matrizes suficientemente grandes, é possível computar perfis de entropia com variação local para detectar não estacionariedade.
Se um número único for desejado, em vez de um perfil inteiro, escolha a escala na qual a aleatoriedade espacial (ou a falta dela) é interessante. Nestes exemplos, que escala corresponderia melhor para um por ou por bairro em movimento, porque para a sua padronização todos eles dependem de agrupamentos que período de três a cinco células (e um por vizinhança apenas médias distância toda variação na matriz e por isso é inútil). Na última escala, as entropias de a são , , , e3 4 4 5 5 a 1 a 5 1,50 0,81 0 0 0 1,34 a 1 a 3 a 4 a 5 0 3 3 1,39 0,99 0,92 1,77334455a1a51.500.81000 ; a entropia esperada nessa escala (para uma matriz uniformemente aleatória) é . Isso justifica a sensação de que "deve ter entropia bastante alta". Para distinguir , e , que estão amarrados com entropia nessa escala, observe a próxima resolução mais fina ( por vizinhanças): suas entropias são , , , respectivamente (enquanto uma grade aleatória é esperada). tem um valor de ). Por essas medidas, a pergunta original coloca as matrizes exatamente na ordem correta.1.34a1a3a4a50331.390.990.921.77