A matemática da confiança da computação e as bandas de previsão de curvas ajustadas por regressão não linear são explicadas nesta página Validação cruzada. Isso mostra que as bandas nem sempre são / geralmente simétricas.
E aqui está uma explicação com mais palavras e menos matemática:
Primeiro, vamos definir G | x, que é o gradiente dos parâmetros em um valor específico de X e usando todos os valores de melhor ajuste dos parâmetros. O resultado é um vetor, com um elemento por parâmetro. Para cada parâmetro, é definido como dY / dP, em que Y é o valor Y da curva, dado o valor específico de X e todos os valores de parâmetros de melhor ajuste e P é um dos parâmetros.)
G '| x é esse vetor de gradiente transposto, portanto é uma coluna e não uma linha de valores. Cov é a matriz de covariância (Hessian inverso da última iteração). É uma matriz quadrada com o número de linhas e colunas igual ao número de parâmetros. Cada item da matriz é a covariância entre dois parâmetros. Usamos Cov para nos referir à matriz de covariância normalizada , onde cada valor está entre -1 e 1.
Agora calcule
c = G '| x * Cov * G | x.
O resultado é um número único para qualquer valor de X.
As faixas de confiança e previsão são centralizadas na curva de melhor ajuste e se estendem acima e abaixo da curva em uma quantidade igual.
As faixas de confiança se estendem acima e abaixo da curva:
= sqrt (c) * sqrt (SS / DF) * CriticalT (% de confiança, DF)
As bandas de previsão estendem uma distância adicional acima e abaixo da curva, igual a:
= sqrt (c + 1) * sqrt (SS / DF) * CriticalT (% de confiança, DF)
Em ambas as equações, o valor de c (definido acima) depende do valor de X, portanto, as faixas de confiança e previsão não estão a uma distância constante da curva. O valor de SS é a soma dos quadrados do ajuste e DF é o número de graus de liberdade (número de pontos de dados menos número de parâmetros). CriticalT é uma constante da distribuição t com base no nível de confiança que você deseja (tradicionalmente 95%) e no número de graus de liberdade. Para limites de 95% e um df razoavelmente grande, esse valor é próximo a 1,96. Se DF for pequeno, esse valor será maior.