A coisa mais estranha que descobri ao ler a teoria do caos, a fim de responder a essa pergunta, foi uma espantosa escassez de pesquisas publicadas nas quais a mineração de dados e seus parentes aproveitam a teoria do caos. Isso ocorreu apesar de um esforço conjunto para encontrá-los, consultando fontes como a Applied Chaos Theory: um paradigma para a complexidade e Alligood, de AB Ҫambel, et al., Chaos: uma introdução aos sistemas dinâmicos e outros (este último é incrivelmente útil como um livro-fonte para tópico) e invadir suas bibliografias. Depois de tudo isso, eu tinha apenas que apresentar um único estudo que pudesse se qualificar e tive que esticar os limites da “mineração de dados” apenas para incluir este caso extremo: uma equipe da Universidade do Texas, realizando pesquisas sobre as reações de Belousov-Zhabotinsky (BZ) (que já eram propensas à aperiodicidade) acidentalmente descobriram discrepâncias no ácido malônico usado em seus experimentos devido a padrões caóticos, levando-os a procurar um novo fornecedor. [1] Provavelmente existem outros - eu não sou especialista em teoria do caos e dificilmente posso dar uma avaliação exaustiva da literatura - mas a desproporção gritante com usos científicos comuns, como o Problema dos Três Corpos da física, não mudaria muito se enumerássemos todos eles. De fato, nesse ínterim, quando esta questão foi encerrada, Eu considerei reescrevê-lo sob o título “Por que existem tão poucas implementações da teoria do caos na mineração de dados e em campos relacionados?” Isso é incongruente com o sentimento mal definido, mas generalizado, de que deveria haver uma infinidade de aplicações na mineração de dados e afins campos, como redes neurais, reconhecimento de padrões, gerenciamento de incertezas, conjuntos difusos, etc .; afinal, a teoria do caos também é um tópico de ponta com muitas aplicações úteis. Eu tive que pensar muito sobre exatamente onde ficavam os limites entre esses campos para entender por que minha pesquisa foi infrutífera e minha impressão errada.
A resposta; tldr
A breve explicação para esse forte desequilíbrio no número de estudos e desvio das expectativas pode ser atribuída ao fato de que a teoria do caos, a mineração de dados etc. respondem a duas classes de perguntas bem separadas; a nítida dicotomia entre eles é óbvia uma vez apontada, mas tão fundamental que passa despercebida, como olhar para o próprio nariz. Pode haver alguma justificativa para a crença de que a relativa novidade da teoria do caos e de campos como a mineração de dados explica parte da escassez de implementações, mas podemos esperar que o desequilíbrio relativo persista mesmo quando esses campos amadurecem, porque eles simplesmente tratam de lados distintos e distintos. a mesma moeda. Quase todas as implementações até o momento foram realizadas em estudos de funções conhecidas com resultados bem definidos que exibiram algumas aberrações caóticas intrigantes, enquanto a mineração de dados e técnicas individuais, como redes neurais e árvores de decisão, envolvem a determinação de uma função desconhecida ou mal definida. Os campos relacionados, como reconhecimento de padrões e conjuntos nebulosos, também podem ser vistos como a organização dos resultados de funções que também são muitas vezes desconhecidas ou mal definidas, quando os meios dessa organização também não são facilmente aparentes. Isso cria um abismo praticamente intransponível que só pode ser ultrapassado em determinadas circunstâncias raras - mas mesmo esses podem ser agrupados sob a rubrica de um único caso de uso: evitando interferências aperiódicas nos algoritmos de mineração de dados. Os campos relacionados, como reconhecimento de padrões e conjuntos nebulosos, também podem ser vistos como a organização dos resultados de funções que também são muitas vezes desconhecidas ou mal definidas, quando os meios dessa organização também não são facilmente aparentes. Isso cria um abismo praticamente intransponível que só pode ser ultrapassado em determinadas circunstâncias raras - mas mesmo esses podem ser agrupados sob a rubrica de um único caso de uso: evitando interferências aperiódicas nos algoritmos de mineração de dados. Os campos relacionados, como reconhecimento de padrões e conjuntos nebulosos, também podem ser vistos como a organização dos resultados de funções que também são muitas vezes desconhecidas ou mal definidas, quando os meios dessa organização também não são facilmente aparentes. Isso cria um abismo praticamente intransponível que só pode ser ultrapassado em determinadas circunstâncias raras - mas mesmo esses podem ser agrupados sob a rubrica de um único caso de uso: evitando interferências aperiódicas nos algoritmos de mineração de dados.
Incompatibilidade com o fluxo de trabalho da Chaos Science
O fluxo de trabalho típico da “ciência do caos” é realizar uma análise computacional das saídas de uma função conhecida, geralmente acompanhadas de auxílios visuais do espaço de fase, como diagramas de bifurcação, mapas de Hénon, seções de Poincaré, diagramas de fase e trajetórias de fase. O fato de os pesquisadores confiarem na experimentação computacional ilustra o quão difíceis são os efeitos caóticos; não é algo que você possa determinar com caneta e papel. Eles também ocorrem exclusivamente em funções não lineares. Esse fluxo de trabalho não é viável, a menos que tenhamos uma função conhecida para trabalhar. A mineração de dados pode produzir equações de regressão, funções difusas e similares, mas todas compartilham a mesma limitação: são apenas aproximações gerais, com uma janela muito mais ampla para erros. Por outro lado, as funções conhecidas sujeitas ao caos são relativamente raras, assim como os intervalos de entradas que produzem padrões caóticos, também é necessário um alto grau de especificidade para testar os efeitos caóticos. Quaisquer atratores estranhos presentes no espaço de fase de funções desconhecidas certamente mudariam ou desapareceriam à medida que suas definições e entradas mudassem, complicando bastante os procedimentos de detecção descritos por autores como Alligood, et al.
Caos como contaminante nos resultados da mineração de dados
De fato, a relação da mineração de dados e seus parentes com a teoria do caos é praticamente contraditória. Isso é literalmente verdade se considerarmos a análise criptográfica amplamente como uma forma específica de mineração de dados, uma vez que encontrei pelo menos um trabalho de pesquisa sobre como alavancar o caos em esquemas de criptografia (não consigo encontrar a citação no momento, mas posso caçar a pedido). Para um minerador de dados, a presença do caos é normalmente uma coisa ruim, uma vez que os valores aparentemente absurdos que a saída gera podem complicar bastante o já árduo processo de aproximação de uma função desconhecida. O uso mais comum para o caos na mineração de dados e em campos relacionados é descartá-lo, o que não é tarefa fácil. Se efeitos caóticos estão presentes, mas não são detectados, seus efeitos em um empreendimento de mineração de dados podem ser difíceis de superar. Pense na facilidade com que uma rede neural comum ou em uma árvore de decisão pode superestimar os resultados aparentemente sem sentido de um atrator caótico, ou como picos repentinos nos valores de entrada certamente podem confundir a análise de regressão e podem ser atribuídos a amostras ruins ou outras fontes de erro. A raridade de efeitos caóticos entre todas as funções e intervalos de entrada significa que a investigação sobre eles seria severamente desioritizada pelos pesquisadores.
Métodos de detecção do caos nos resultados da mineração de dados
Certas medidas associadas à teoria do caos são úteis na identificação de efeitos aperiódicos, como a Entropia de Kolmogorov e a exigência de que o espaço de fase exiba um expoente de Lyapunov positivo. Ambos estão na lista de verificação para detecção do caos [2] fornecida na Teoria do Caos Aplicado de ABҪambel, mas a maioria não é útil para funções aproximadas, como o expoente Lyapunov, que requer funções definidas com limites conhecidos. O procedimento geral que ele descreve pode, no entanto, ser útil em situações de mineração de dados; O objetivo de Ҫambel é, em última análise, um programa de “controle do caos”, isto é, eliminação dos efeitos aperiódicos interferentes. [3] Outros métodos, como calcular a contagem de caixas e as dimensões de correlação para detectar as dimensões fracionais que levam ao caos, podem ser mais práticos em aplicativos de mineração de dados do que o Lyapunov e outros em sua lista. Outro sinal revelador de efeitos caóticos é a presença de períodos de duplicação (ou triplicação e além) dos resultados das funções, que geralmente precedem o comportamento aperiódico (isto é, “caótico”) nos diagramas de fases.
Diferenciando Aplicações Tangenciais
Esse caso de uso primário deve ser diferenciado de uma classe separada de aplicativos que são tangencialmente relacionados à teoria do caos. Em uma inspeção mais detalhada, a lista de “aplicações potenciais” que forneci na minha pergunta na verdade consistia quase inteiramente de idéias para alavancar conceitos dos quais a teoria do caos depende, mas que podem ser aplicadas independentemente na ausência de comportamento aperiódico (exceto o período de duplicação). Recentemente, pensei em um novo uso de nicho potenital, gerando um comportamento aperiódico para remover redes neurais a partir de mínimos locais, mas isso também pertenceria à lista de aplicações tangenciais. Muitos deles foram descobertos ou desenvolvidos como resultado de pesquisas sobre a ciência do caos, mas podem ser aplicados a outros campos. Essas "aplicações tangenciais" têm apenas conexões difusas entre si, mas formam uma classe distinta, separado por um limite rígido do principal caso de uso da teoria do caos na mineração de dados; o primeiro aproveita certos aspectos da teoria do caos sem os padrões aperiódicos, enquanto o último é dedicado exclusivamente a descartar o caos como um fator complicador nos resultados da mineração de dados, talvez com o uso de pré-requisitos como a positividade do expoente de Lyapunov e a detecção de duplicação de período . Se diferenciarmos a teoria do caos de outros conceitos que ela utiliza corretamente, é fácil ver que as aplicações da primeira estão inerentemente restritas a funções conhecidas no estudo científico comum. Realmente há boas razões para se entusiasmar com as possíveis aplicações desses conceitos secundários na ausência de caos, mas também motivo para se preocupar com os efeitos contaminantes do comportamento aperiódico inesperado nos esforços de mineração de dados quando ele está presente. Tais ocasiões serão raras, mas é provável que essa raridade signifique que elas não serão detectadas. O método de elambel pode ser útil para evitar esses problemas.
[1] pp. 143-147, Alligood, Kathleen T .; Sauer, Tim D. e Yorke, James A., 2010, Caos: Uma Introdução aos Sistemas Dinâmicos, Springer: Nova York. [2] pp. 208-213, elambel, AB, 1993, Teoria do Caos Aplicada: Um Paradigma para Complexidade, Academic Press, Inc .: Boston. [3] p. 215, elambel.