TLDR:
Meu conjunto de dados é bem pequeno (120) amostras. Ao fazer a validação cruzada de 10 vezes, devo:
Colete as saídas de cada dobra de teste, concatene-as em um vetor e calcule o erro nesse vetor completo de previsões (120 amostras)?
Ou devo vez calcular o erro nas saídas que recebo em cada dobra (com 12 amostras por vezes) e, em seguida, obter a minha estimativa de erro final como a média das estimativas de erro de 10 vezes?
Existem trabalhos científicos que discutem as diferenças entre essas técnicas?
Antecedentes: Relação Potencial com Pontuações Macro / Micro na classificação de vários rótulos:
Eu acho que essa pergunta pode estar relacionada à diferença entre médias micro e macro que são frequentemente usadas em uma tarefa de classificação de vários rótulos (por exemplo, cinco rótulos).
Na configuração de vários rótulos, as pontuações micro médias são calculadas criando uma tabela de contingência agregada de verdadeiro positivo, falso positivo, verdadeiro negativo, falso negativo para todas as 5 previsões do classificador em 120 amostras. Essa tabela de contingência é então usada para calcular a micro precisão, micro recall e micro f-measure. Portanto, quando temos 120 amostras e cinco classificadores, as micro medidas são computadas em 600 previsões (120 amostras * 5 etiquetas).
Ao usar a variante Macro , calcula-se as medidas (precisão, rechamada, etc.) independentemente em cada etiqueta e, finalmente, essas medidas são calculadas como média.
A idéia por trás da diferença entre estimativas micro e macro pode ser estendida ao que pode ser feito em uma configuração de dobra K em um problema de classificação binária. Para 10 vezes, podemos calcular a média acima de 10 valores ( medida macro ) ou concatenar os 10 experimentos e calcular as micro medidas.
Plano de fundo - exemplo expandido:
O exemplo a seguir ilustra a pergunta. Digamos que temos 12 amostras de teste e 10 dobras:
- Dobra 1 : TP = 4, FP = 0, TN = 8 Precisão = 1,0
- Dobra 2 : TP = 4, FP = 0, TN = 8 Precisão = 1,0
- Dobra 3 : TP = 4, FP = 0, TN = 8 Precisão = 1,0
- Dobra 4 : TP = 0, FP = 12, Precisão = 0
- Fold 5 .. dobra 10 : Todos têm o mesmo TP = 0, PF = 12 e precisão = 0
onde usei a seguinte notação:
TP = Nº de verdadeiros positivos, FP = # Falso positivo, TN = Nº de verdadeiros negativos
Os resultados são:
- Precisão média em 10 dobras = 3/10 = 0,3
- Precisão na concatenação das previsões das 10 dobras = TP / TP + FP = 12/12 + 84 = 0,125
Observe que os valores 0,3 e 0,125 são muito diferentes !