A redução da dimensionalidade através de algo como o PCA seria útil para ter uma idéia do número de dimensões críticas para representar seus dados.
Para verificar instâncias classificadas incorretamente, você pode fazer um agrupamento rudimentar de K-means de seus dados para ter uma idéia de quão bem seus dados brutos se ajustariam às categorias propostas. Embora não seja automático, a visualização nesse estágio seria útil, pois seu cérebro visual é um classificador poderoso por si só.
Em termos de dados totalmente ausentes, as estatísticas já têm inúmeras técnicas para lidar com essa situação, incluindo imputação, coleta de dados do conjunto existente ou outro conjunto para preencher as lacunas.