Perguntas com a marcação «data-transformation»

Reexpressão matemática, geralmente não linear, dos valores dos dados. Os dados são frequentemente transformados para atender às premissas de um modelo estatístico ou para tornar os resultados de uma análise mais interpretáveis.


5
Redução de dimensionalidade de SVD para séries temporais de diferentes comprimentos
Estou usando a Decomposição de Valor Singular como uma técnica de redução de dimensionalidade. Dados os Nvetores de dimensão D, a idéia é representar os recursos em um espaço transformado de dimensões não correlacionadas, que condensa a maioria das informações dos dados nos vetores próprios desse espaço em uma ordem …

1
Como a entropia depende da localização e escala?
A entropia de uma distribuição contínua com função de densidade fff é definida como negativa da expectativa de log(f),log⁡(f),\log(f), e , portanto, é igual a Hf=−∫∞−∞log(f(x))f(x)dx.Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Também dizemos que qualquer variável aleatória XXX cuja distribuição tem densidade fff tem entropia Hf.Hf.H_f. (Essa integral é bem definida …



1
Are
Meu colega deseja analisar alguns dados após transformar a variável de resposta, elevando-a ao poder de (isto é,Y0,125).1818\frac18y0.125y0.125y^{0.125} Estou desconfortável com isso, mas estou tentando entender o porquê. Não consigo pensar em nenhuma lógica mecanicista para essa transformação. Também nunca vi isso antes, e me preocupo com o fato de …



2
São normalmente distribuídos X e Y com maior probabilidade de resultar em resíduos normalmente distribuídos?
Aqui, a interpretação errônea da suposição de normalidade na regressão linear é discutida (que a 'normalidade' refere-se ao X e / ou Y ao invés dos resíduos), e o pôster pergunta se é possível ter X e Y distribuídos normalmente. e ainda tem resíduos normalmente distribuídos. Minha pergunta é: normalmente …


1
Critérios para selecionar o melhor modelo em um Modelo Markov Oculto
Eu tenho um conjunto de dados de séries temporais no qual estou tentando ajustar um Modelo de Markov oculto (HMM) para estimar o número de estados latentes nos dados. Meu pseudo-código para fazer isso é o seguinte: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states …


1
Por que usar variáveis ​​registradas?
Provavelmente, essa é uma pergunta muito básica, mas parece que não consigo encontrar uma resposta sólida. Espero que aqui eu possa. Atualmente, estou lendo artigos como preparação para minha tese de mestrado. Atualmente, estou lendo um artigo que pesquisa a relação entre tweets e recursos do mercado de ações. Em …

2
O que fazer quando alguns pontos do tempo têm respostas muito distorcidas e outros não em um estudo de medidas repetidas?
Normalmente, quando se encontram medidas de resultado contínuas, mas distorcidas, em um design longitudinal (digamos, com um efeito entre sujeitos), a abordagem comum é transformar o resultado em normalidade. Se a situação for extrema, como em observações truncadas, pode-se ter uma ideia e usar um modelo de curva de crescimento …

2
Os modelos de séries temporais com diferença de log são melhores que as taxas de crescimento?
Muitas vezes, vejo autores estimarem um modelo de "diferença de log", por exemplo log(yt)−log(yt−1)=log(yt/yt−1)=α+βxtlog⁡(yt)−log⁡(yt−1)=log⁡(yt/yt−1)=α+βxt\log (y_t)-\log(y_{t-1}) = \log(y_t/y_{t-1}) = \alpha + \beta x_t Concordo que é apropriado relacionar a uma alteração percentual em y t enquanto log ( y t ) é I ( 1 ) .xtxtx_tytyty_tlog(yt)log⁡(yt)\log (y_t)I(1)I(1)I(1) Mas a diferença …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.