Uma suposição básica no aprendizado de máquina é que os dados de treinamento e teste são obtidos da mesma população e, portanto, seguem a mesma distribuição. Mas, na prática, isso é altamente improvável. O turno covariável aborda esse problema. Alguém pode tirar as seguintes dúvidas sobre isso?
Como se verifica se duas distribuições são estatisticamente diferentes? A estimativa de densidade de kernel (KDE) pode ser usada para estimar a distribuição de probabilidade e diferenciar? Digamos que tenho 100 imagens de uma categoria específica. O número de imagens de teste é 50, e eu estou alterando o número de imagens de treinamento de 5 para 50 nas etapas de 5. Posso dizer que as distribuições de probabilidade são diferentes ao usar 5 imagens de treinamento e 50 imagens de teste após as estimar pelo KDE?