≥3
Na ESL , Figura 4.2 na página 105, o fenômeno é chamado de mascaramento . Veja também a Figura 4.3 da ESL. A solução dos mínimos quadrados resulta em um preditor para a classe middel que é predominantemente dominado pelos preditores para as outras duas classes. LDA ou regressão logística não sofrem com esse problema. Pode-se dizer que é a estrutura rígida do modelo linear de probabilidades de classe (que é essencialmente o que você obtém dos mínimos quadrados adequados) que causa o mascaramento.
−
Edit: Mascarar é talvez mais facilmente visualizado para um problema bidimensional, mas também é um problema no caso unidimensional, e aqui a matemática é particularmente simples de entender. Suponha que as variáveis de entrada unidimensionais sejam ordenadas como
x1<…<xk<y1<…ym<z1<…<zn
xyz
TTxT100x1…………100xk010y1…………010ym001z1…………001zn
Txxzy-classe, a regressão linear terá que equilibrar os zeros para as duas classes externas com os da classe média, resultando em uma linha de regressão bastante plana e em um ajuste particularmente ruim das probabilidades de classe condicional para essa classe. Como se vê, o máximo das linhas de regressão para as duas classes externas domina a linha de regressão da classe média para a maioria dos valores da variável de entrada, e a classe média é mascarada pelas classes externas.
k = m = n( x¯, 1 / 3 )
x¯= 13 k( x1+ … + Xk+ y1+ … + Ym+ z1+ … + Zn) .