t
t-SNE está tentando minimizar a soma das divergências de Kullback-Leibler entre a distribuição das distâncias entre os dados no domínio original e a distribuição das distâncias entre os dados no domínio de dimensão reduzida (na verdade, as distribuições de destino são as distribuições dos probabilidades de um ponto escolher outro ponto como seu vizinho, mas são diretamente proporcionais à distância entre os dois pontos). Pode-se argumentar que valores menores de divergência KL mostram melhores resultados. Essa idéia não funciona muito bem na prática, mas teoricamente ajudaria a excluir alguns intervalos dos valores de perplexidade, bem como algumas execuções do algoritmo que são claramente abaixo do ideal. Explico por que essa heurística está longe de ser uma panacéia e como poderia ser levemente útil: O parâmetro perplexity aumenta monotonicamente com a variação do Gaussian usado para calcular as distâncias / probabilidades. Portanto, à medida que você aumenta o parâmetro de perplexidade como um todo, você obtém distâncias menores em termos absolutos e valores subsequentes de divergência KL. No entanto, se você tiver 20 corridas com a mesma perplexidade e não puder (não quiser) olhar para elas, sempre poderá escolher a que tiver a menor variável, na esperança de manter as distâncias originais com mais precisão. O mesmo vale para o No entanto, se você tiver 20 corridas com a mesma perplexidade e não puder (não quiser) olhar para elas, sempre poderá escolher a que tiver a menor variável, na esperança de manter as distâncias originais com mais precisão. O mesmo vale para o No entanto, se você tiver 20 corridas com a mesma perplexidade e não puder (não quiser) olhar para elas, sempre poderá escolher a que tiver a menor variável, na esperança de manter as distâncias originais com mais precisão. O mesmo vale para oθθ
kktt-SNE foi usado em primeiro lugar, afinal, se a representação resultante não é informativa para as propriedades que estamos investigando, simplesmente não é boa, apesar de seu baixo erro de reconstrução, apelo visual etc. etc.
Deixe-me salientar que o que eu descrevo são heurísticas . Conforme mencionado no início do meu post, a inspeção manual dos resultados é uma maneira indispensável de avaliar a qualidade da redução / agrupamento de dimensionalidade resultante.