Estou tentando aplicar a idéia de informações mútuas à seleção de recursos, conforme descrito nestas notas de aula (na página 5).
Minha plataforma é Matlab. Um problema que encontro ao calcular informações mútuas a partir de dados empíricos é que o número é sempre tendencioso para cima. Encontrei cerca de 3 a 4 arquivos diferentes para calcular o MI no Matlab Central e todos eles fornecem grandes números (como> 0,4) quando eu alimento variáveis aleatórias independentes.
Não sou especialista, mas o problema parece ser que, se você simplesmente usar densidades conjuntas e marginais para calcular o MI, o viés será introduzido no processo, porque o MI é por definição positivo. Alguém tem conselhos práticos sobre como estimar informações mútuas com precisão?
Uma questão relacionada é, na prática, como as pessoas realmente usam o MI para selecionar recursos? Não é óbvio para mim como chegar a um valor limite, uma vez que, em teoria, o MI é ilimitado. Ou as pessoas apenas classificam os recursos pelo MI e aceitam os principais recursos?