O que você quer fazer não existe porque é, por falta de palavras melhores, matematicamente falho.
Mas primeiro, enfatizarei por que acho que as premissas da sua pergunta são sólidas. Tentarei então explicar por que acho que as conclusões que você tira delas se baseiam em um mal-entendido do modelo logístico e, finalmente, vou sugerir uma abordagem alternativa.
Vou denotar suasnobservações (as letras em negrito denotam vetores) que se encontram noespaço dimensionalp(a primeira entrada de x{(xxi,yi)}ni=1npxxip<nyi∈[0,1]f(xxi)=f(xx′iββ)xx′iββnp
Você está certo de que, se pretende usar o TVD como critério para avaliar o modelo ajustado, é razoável esperar que seu ajuste otimize o mesmo critério entre todos os candidatos possíveis em seus dados. Conseqüentemente
ββ∗=argminββ∈Rp||yy−f(xx′iββ)||1
ϵi=yi−f(xx′iββ)E(ϵϵ)=0ϵi yixxiϵi1−f(xx′iββ)yi=1f(xx′iββ)−f(xx′iββ)yi=11−f(xx′iββ)
Essas considerações em conjunto implicam que:
var(ϵϵ)=E(ϵϵ2)=(1−f(xx′ββ))2f(xx′ββ)+(−f(xx′ββ))2(1−f(xx′ββ))=(1−f(xx′ββ))f(xx′ββ)=E(yy|xx)E(1−yy|xx)
var(ϵϵ)xxE(y|xx)≈.5
l1ββ∗xxE(yy|xx)≈.5ββ∗=ββ:f(xx′ββ)≈.5
Uma solução, como fica claro na exposição acima, é abandonar a exigência de imparcialidade. Uma maneira popular de influenciar o estimador (com alguma interpretação bayesiana anexada) é incluir um termo de encolhimento. Se redimensionarmos a resposta:
y+i=2(yi−.5),1≤i≤n
f(xx′ββ)g(xx,[c,γγ])=xx′[c,γγ]cp−1γγ||γγ||2
[c∗,γγ∗]=argmin[[c,γγ]∈Rp∑i=1nmax(0,1−y+ixx′i[[c,γγ])+12||γγ||2
xx′[[c,γ]l1[c∗,γγ∗]ββ∗[c∗,γγ∗]