Eu acho que o classificador LDA multi-classe sempre (bem, na maioria das tarefas práticas) supera o LDA de 2 classes. E tentarei descrever o porquê.
Veja o exemplo do conjunto de dados:
Você tem três aulas aqui. Digamos que você queira criar um classificador um contra outro com LDA para a classe azul.
A média estimada para a classe "azul" é zero, mas a média estimada para a classe "outro" também é zero. E a covariância é a mesma da definição de LDA. Isso significa que o LDA responderá com o rótulo que possui mais elementos. E nunca retornará a classe "azul"!
Para o LDA de várias classes, ele conseguirá encontrar as classes certas perfeitamente.
O pano de fundo disso é que a mistura de gaussianos não é mais gaussiana na maioria dos casos. Portanto, essa suposição de LDA falha. E devo dizer que é realmente difícil criar um exemplo de um conjunto de dados em que todas as classes sejam gaussianas, e elas ainda gaussianas depois de nos juntarmos a elas.
É por isso que eu recomendo usar o LDA de várias classes. Espero que ajude!