A segunda pergunta é que eu encontrei em uma discussão em algum lugar na Web falando sobre "cluster supervisionado", tanto quanto eu sei, cluster não é supervisionado, então qual é exatamente o significado por trás de "cluster supervisionado"? Qual a diferença em relação à "classificação"?
Existem muitos links falando sobre isso:
http://www.cs.uh.edu/docs/cosc/technical-reports/2005/05_10.pdf
http://books.nips.cc/papers/files/nips23/NIPS2010_0427.pdf
http://engr.case.edu/ray_soumya/mlrg/supervised_clustering_finley_joachims_icml05.pdf
http://www.public.asu.edu/~kvanlehn/Stringent/PDF/05CICL_UP_DB_PWJ_KVL.pdf
http://www.machinelearning.org/proceedings/icml2007/papers/366.pdf
http://www.cs.cornell.edu/~tomf/publications/supervised_kmeans-08.pdf
http://jmlr.csail.mit.edu/papers/volume6/daume05a/daume05a.pdf
etc ...