Perguntas com a marcação «shrinkage»

Inclusão de restrições adicionais (normalmente uma penalidade por complexidade) no processo de ajuste do modelo. Usado para evitar o ajuste excessivo / aprimorar a precisão preditiva.

1
Sob exatamente quais condições a regressão de crista é capaz de fornecer uma melhoria em relação à regressão de mínimos quadrados ordinários?
A regressão de Ridge estima parâmetros ββ\boldsymbol \beta em um modelo linear y=Xβy=Xβ\mathbf y = \mathbf X \boldsymbol \beta por β^λ=(X⊤X+λI)−1X⊤y,β^λ=(X⊤X+λI)−1X⊤y,\hat{\boldsymbol \beta}_\lambda = (\mathbf X^\top \mathbf X + \lambda \mathbf I)^{-1} \mathbf X^\top \mathbf y, que λλ\lambda é um parâmetro de regularização. É sabido que frequentemente apresenta um desempenho melhor …




4
Seleção de penalidade ideal para o laço
Existem resultados analíticos ou artigos experimentais sobre a escolha ideal do coeficiente do termo de penalidade . Por ótimo , quero dizer um parâmetro que maximiza a probabilidade de selecionar o melhor modelo ou que minimiza a perda esperada. Estou perguntando porque muitas vezes é impraticável escolher o parâmetro por …

2
O que é encolhimento?
A palavra encolhimento é muito difundida em certos círculos. Mas o que é encolhimento, não parece haver uma definição clara. Se eu tenho uma série temporal (ou qualquer coleção de observações de algum processo), quais são as diferentes maneiras de medir algum tipo de retração empírica na série? Quais são …


2
Se o encolhimento é aplicado de maneira inteligente, ele sempre funciona melhor para estimadores mais eficientes?
Suponha que eu tenho dois estimadores e que são estimadores consistentes do mesmo parâmetro e que com no sentido psd. Portanto, assintoticamente é mais eficiente que . Esses dois estimadores são baseados em diferentes funções de perda. β 2β0√βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0 0β0\beta_0V1≤V2 β 1 β 2n--√( βˆ1- β0 0) →dN( 0 , …



3
Como obter um intervalo de confiança na mudança do quadrado da população
Para um exemplo simples, assuma que existem dois modelos de regressão linear Modelo 1 tem três preditores, x1a, x2b, ex2c O modelo 2 possui três preditores do modelo 1 e dois preditores adicionais x2aex2b Existe uma equação de regressão populacional em que a variação populacional explicada é para o Modelo …

4
Lassoing a ordem de um atraso?
Suponha que eu tenha dados longitudinais da forma (eu tenho várias observações, essa é apenas a forma de uma única). Estou interessado em restrições sobre Σ . Um irrestrita Σ é equivalente a Y j = α j + j - 1 Σ ℓ = 1 & Phi; ℓ j …

2
Distribuição de peças 'não misturadas' com base na ordem da mistura
Suponha que eu emparelhei observações desenhadas como para . Let e denotam por o ° maior valor observado de . Qual é a distribuição (condicional) de ? (ou equivalente, o de )Xi∼N(0,σ2x),Yi∼N(0,σ2y),Xi∼N(0,σx2),Yi∼N(0,σy2),X_i \sim \mathcal{N}\left(0,\sigma_x^2\right), Y_i \sim \mathcal{N}\left(0,\sigma_y^2\right),i=1,2,…,ni=1,2,…,ni=1,2,\ldots,nZi=Xi+Yi,Zi=Xi+Yi,Z_i = X_i + Y_i,ZijZijZ_{i_j}jjjZZZXijXijX_{i_j}YijYijY_{i_j} Ou seja, qual é a distribuição de condicional em …


2
Seleção de características em um modelo linear generalizado hierárquico bayesiano
Pretendo estimar um GLM hierárquico, mas com a seleção de recursos para determinar quais covariáveis ​​são relevantes no nível da população a serem incluídas. Suponha que eu tenha grupos com observações e possíveis covariáveis ​​Ou seja, possuo uma matriz de design de covariáveis \ boldsymbol {x} _ {(N \ cdot …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.