Esta questão lida com a estimativa de máxima verossimilhança restrita (REML) em uma versão específica do modelo linear, a saber:
onde é uma matriz ( ) parametrizada por , como . é um vetor desconhecido de parâmetros incômodos; o interesse é estimar e temos . Estimar o modelo pela máxima probabilidade não é um problema, mas quero usar o REML. É bem sabido, ver, por exemplo , LaMotte , que a probabilidade , onde é qualquer matriz semi-ortogonal, de modo que possa ser escritaA ′ Y A A ′ X = 0
quando é a classificação da coluna completa .
Meu problema é que, para alguns razoavelmente razoáveis e cientificamente interessantes, a matriz não é da coluna completa. Todas as derivações que eu vi da probabilidade restrita acima fazem uso de igualdades determinantes que não são aplicáveis quando , ou seja, eles assumem uma posição de coluna cheia de . Isso significa que a probabilidade restrita acima é correta apenas para minha configuração em partes do espaço de parâmetros e, portanto, não é o que eu quero otimizar.
Pergunta: Existem probabilidades restritas mais gerais, derivadas, na literatura estatística ou em qualquer outro lugar, sem a suposição de que seja o ranking completo da coluna? Se sim, como eles são?
Algumas observações:
- A derivação da parte exponencial não é problema para qualquer e pode ser escrita em termos da inversa de Moore-Penrose, como acima
- As colunas de são uma (qualquer) base ortonormal para C ( X ) ⊥
- Para conhecido , a probabilidade de A ′ Y pode ser facilmente anotada para cada α , mas é claro que o número de vetores de base, isto é, colunas, em A depende da classificação da coluna de X
Se qualquer pessoa interessada nesta questão acredita que a parametrização exata de iria ajudar, deixe-me saber e eu vou escrevê-las. Neste ponto, porém, estou mais interessado em uma REML para um X geral das dimensões corretas.
Uma descrição mais detalhada do modelo segue aqui. Seja seja uma regressão automática vetorial de primeira ordem r- dimensional [VAR (1)] onde v t i i d ∼ N ( 0 , Ω ) . Suponha que o processo seja iniciado em algum valor fixo y 0 no tempo t = 0 .
Defina . O modelo pode ser escrito no formato de modelo linear Y = X β + ε usando as seguintes definições e notação:
onde indica um T - vetor dimensional de uns e de e 1 , t o primeiro vector base padrão de R T .
Denota . Observe que, se A não estiver na classificação completa, X ( α ) não será na coluna completa. Isso inclui, por exemplo, casos em que um dos componentes de y t não depende do passado.
A idéia de estimar VARs usando REML é bem conhecida, por exemplo, na literatura de regressões preditivas (veja, por exemplo, Phillips e Chen e as referências nela).
Pode valer a pena esclarecer que a matriz não é uma matriz de design no sentido usual, apenas cai fora do modelo e, a menos que exista um conhecimento prévio sobre A, não há, até onde posso dizer, nenhuma maneira de reparameterizar para ser classificação completa.
Publiquei uma pergunta em math.stackexchange que está relacionada a essa no sentido de que uma resposta para a pergunta de matemática pode ajudar a derivar uma probabilidade de resposta a essa pergunta.