Para duas distribuições discretas e q , a entropia cruzada é definida como
Eu me pergunto por que isso seria uma medida intuitiva de distância entre duas distribuições de probabilidade?
Vejo que é a entropia de p , que mede a "surpresa" de p . H ( p , q ) é a medida que substitui parcialmente p por q . Ainda não entendo o significado intuitivo por trás da definição.