Primeiro, deixe por conveniência. Expandindo a perda, temos
Tomando a expectativa em , temos
O valor esperado de uma matriz é a matriz dos valores esperados em células, então
então
Para o último termo,
portanto
SeR∗X=M∥y−Mw∥2=yTy−2wTMTy+wTMTMw.
RER(∥y−Mw∥2)=yTy−2wT(EM)Ty+wTE(MTM)w.
(ERM)ij=ER((R∗X)ij)=XijER(Rij)=pXij
2wT(EM)Ty=2pwTXTy.
(MTM)ij=∑k=1NMkiMkj=∑k=1NRkiRkjXkiXkj
(ERMTM)ij=∑k=1NER(RkiRkj)XkiXkj.
i≠jentão eles são independentes, de modo que os elementos fora da diagonal resultam em . Para os elementos diagonais, temos
p2(XTX)ij∑k=1NER(R2ki)X2ki=p(XTX)ii.
Terminando isso, podemos observar que
e encontramos
Em , mostrei que todo elemento fora da diagonal é zero, então o resultado é
O documento define então que significa que estão feitos.∥y−pXw∥2=yTy−2pwTXTy+p2wTXTXw
ER∥y−Mw∥2=yTy−2pwTXTy+wTER(MTM)w=∥y−pXw∥2−p2wTXTXw+wTER(MTM)w=∥y−pXw∥2+wT(ER(MTM)−p2XTX)w.
ER(MTM)−p2XTXER(MTM)−p2XTX=p(1−p)diag(XTX).
Γ=diag(XTX)1/2∥Γw∥2=wTdiag(XTX)w