Eu tenho lido o artigo original sobre desistência, ( https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf ) e na seção de regressão linear, afirma-se que:
reduz para:
Estou tendo problemas para entender como eles chegaram a esse resultado. Alguém pode ajudar?
O que é
—
O Laconic
aqui?
I escreveu um ensaio longform sobre este tema: madrury.github.io/jekyll/update/statistics/2017/08/12/...
—
Matthew Drury