Eu estou familiarizado com o conceito de variáveis categóricas e a respectiva codificação de variável fictícia que nos permite ajustar um nível como linha de base para evitar colinearidade. Também estou familiarizado com como interpretar estimativas de parâmetros a partir de tais modelos: a mudança prevista no resultado para um determinado nível ajustado do preditor categórico, em relação à categoria de linha de base.
O que não tenho certeza é como interpretar um conjunto de variáveis independentes que são proporções que somam uma . Novamente, temos colinearidade se ajustarmos todas as proporções ao modelo; portanto, presumivelmente, teríamos que deixar uma categoria de fora como linha de base. Suponho também que examinaria o SS do tipo III para o teste geral da significância dessa variável. No entanto, como interpretamos as estimativas de parâmetros para os níveis adequados ao modelo em relação aos considerados como linha de base?
Um exemplo : no nível do código postal, a variável independente é a proporção de rochas metamórficas, ígneas e sedimentares. Como você deve saber, esses são os três principais tipos de rochas e todas as rochas são classificadas como um deles. Como tal, as proporções nos três somam 1. O resultado é o nível médio de radônio em um código postal respectivo.
Se eu fosse para caber, dizem, as metamórficas e ígneas proporções como preditores do modelo, deixando sedimentar como linha de base, um tipo geral III SS F -teste dos dois níveis embutidos significaria se o tipo de rocha, como um todo, é um importante preditor do resultado (nível médio de radônio). Então, eu pude examinar os valores de p individuais (com base na distribuição t ) para determinar se um ou ambos os tipos de rochas eram significativamente diferentes da linha de base.
No entanto, quando se trata das estimativas de parâmetros, meu cérebro continua querendo interpretá-las apenas como a mudança prevista no resultado entre os grupos (tipos de rochas), e eu não entendo como incorporar o fato de que elas são adequadas em proporções .
Se a estimativa para metamórfico foi, digamos, 0,43, a interpretação não é simplesmente que o nível médio previsto de radônio aumenta em 0,43 unidades quando a rocha é metamórfica versus sedimentar. No entanto, a interpretação também não é apenas para algum tipo de aumento de unidade (digamos 0,1) na proporção do tipo de rocha metamórfica, porque isso não reflete o fato de que também é relativo à linha de base ( sedimentar ) e, adicionalmente, que a mudança a proporção de metamórficos muda inerentemente a proporção do outro nível de rocha ajustado no modelo, ígnea .
Alguém tem uma fonte que forneça a interpretação desse modelo ou você poderia fornecer um breve exemplo aqui, se não?