2
Qual é a diferença entre o inicializador de escala de variância e o inicializador xavier?
Na implementação do ResNet do Tensorflow , acho que eles usam o inicializador de escala de variância, também acho que o inicializador de xavier é popular. Não tenho muita experiência nisso, o que é melhor na prática?