Perguntas com a marcação «self-study»

Um exercício de rotina de um livro, curso ou teste usado para uma aula ou auto-estudo. A política desta comunidade é "fornecer dicas úteis" para essas perguntas, em vez de respostas completas.

1
Derivando o algoritmo K-means como um limite de Maximização de Expectativas para Misturas Gaussianas
Christopher Bishop define o valor esperado da função de probabilidade do log de dados completos (ou seja, assumindo que recebemos os dados observáveis ​​X e os dados latentes Z) da seguinte maneira: EZ[lnp(X,Z∣μ,Σ,π)]=∑n=1N∑k=1Kγ(znk){lnπk+lnN(xn∣ μk,Σk)}(1)(1)EZ[ln⁡p(X,Z∣μ,Σ,π)]=∑n=1N∑k=1Kγ(znk){ln⁡πk+ln⁡N(xn∣ μk,Σk)} \mathbb{E}_\textbf{Z}[\ln p(\textbf{X},\textbf{Z} \mid \boldsymbol{\mu}, \boldsymbol{\Sigma}, \boldsymbol{\pi})] = \sum_{n=1}^N \sum_{k=1}^K \gamma(z_{nk})\{\ln \pi_k + \ln \mathcal{N}(\textbf{x}_n \mid …

1
K-means como um caso limite do algoritmo EM para misturas de Gauss com covariâncias indo para
Meu objetivo é ver que o algoritmo K-means é de fato o algoritmo de Expectativa-Maximização para misturas Gaussianas, em que todos os componentes têm covariância no limite como .σ2Iσ2I\sigma^2 Ilimσ→0limσ→0\lim_{\sigma \to 0} Suponha que temos um conjunto de dados {x1,…,xN}{x1,…,xN}\{x_1, \dots ,x_N\} de observações de variável aleatória XXX . A …




1
Como encontrar uma densidade a partir de uma função característica?
Uma distribuição tem a função característica ϕ ( t ) = ( 1 - t2/ 2)exp( - t2/ 4),-∞<t<∞ ϕ(t)=(1−t2/2)exp⁡(−t2/4), −∞<t<∞\phi(t) = (1-t^2/2)\exp(-t^2/4),\ -\infty \lt t \lt \infty Mostre que a distribuição é absolutamente contínua e escreva a função de densidade da distribuição. Tentativa: ∫∞- ∞| (1- t2/ 2)exp( - …

2
Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?
Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis ​​(id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly spendé a …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 



2
Razão de verossimilhança para distribuição exponencial de duas amostras
Sejam e duas variáveis ​​aleatórias independentes com os respectivos PDFs:XXXYYY f(x;θi)={1θie−x/θi0&lt;x&lt;∞,0&lt;θi&lt;∞0elsewheref(x;θi)={1θie−x/θi0&lt;x&lt;∞,0&lt;θi&lt;∞0elsewheref \left(x;\theta_i \right) =\begin{cases} \frac{1}{\theta_i} e^{-x/ {\theta_i}} \quad 0<x<\infty, 0<\theta_i< \infty \\ 0 \quad \text{elsewhere} \end{cases} para . Duas amostras independentes são coletadas para testar contra dos tamanhos e dessas distribuições. Eu preciso mostrar que o LRT pode ser escrito …


2
Quando n aumenta, o valor t aumenta em um teste de hipótese, mas a tabela t é exatamente o oposto. Por quê?
A fórmula para em um teste de hipótese é dada por: t = ˉ X - μtttt = X¯- μσ^/ n--√.t=X¯−μσ^/n. t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}. Quando aumenta, o valor aumenta de acordo com a fórmula acima. Mas por que o valor crítico diminui na tabela medida que (que é uma função de …

2
Aproximando as quantidades relativas de moedas no Canadá
Seria possível aproximar com precisão as quantidades relativas de Loonies , Twoonies , moedas, moedas de dez centavos, nickles (e talvez o centavo descontinuado) em circulação, simplesmente obtendo uma amostra suficientemente grande de moedas pelo uso diário? No uso diário, refiro-me às moedas que você troca novamente quando faz uma …

2
Verificando se uma densidade é uma família exponencial
Tentando provar que isso não pertence à família exponencial. f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4\frac{(y+a)}{(1+4a)} ; 0 < y < 1 , a>0 Aqui está a minha abordagem: f(y|a)=4(y+a)e−log(1+4a)f(y|a)=4(y+a)e−log(1+4a)f(y|a) = 4(y+a)e^{-log(1+4a)} f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a) = (4y)(1+\frac{a}{y})e^{-log(1+4a)} Comparando isto com a forma padrão, e , que tem de ser uma função de apenas , não pode ser definida …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.