Perguntas com a marcação «r»

Use esta tag para qualquer pergunta * no tópico * que (a) envolva `R` como parte crítica da pergunta ou resposta esperada, & (b) não seja * apenas * sobre como usar` R`.

3
como interpretar o termo de interação na fórmula lm em R?
Em R, se eu chamar a lm()função da seguinte maneira: lm.1 = lm(response ~ var1 + var2 + var1 * var2) summary(lm.1) Isso me dá um modelo linear da variável resposta com var1, var2e a interação entre eles. No entanto, como exatamente interpretamos numericamente o termo de interação? A documentação …
9 r  regression 



1
Como especificar uma matriz de contraste (em R) para a diferença entre um nível e uma média dos outros?
Eu tenho um modelo de regressão parecido com este:Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y=β0+β1X1+β2X2+β3X3+β12X1X2+β13X1X3+β123X1X2X3Y = \beta_0+\beta_1X_1 + \beta_2X_2 + \beta_3X_3 +\beta_{12}X_1X_2+\beta_{13}X_1X_3+\beta_{123}X_1X_2X_3 ... ou na notação R: y ~ x1 + x2 + x3 + x1:x2 + x1:x3 + x1:x2:x3 Digamos que e são variáveis ​​categóricas e é numérico. A complicação é que tem três níveis …
9 r  contrasts 

3
Escolhendo clusters para k-means: o caso de 1 cluster
Alguém conhece um bom método para determinar se o agrupamento usando kmeans é apropriado? Ou seja, e se sua amostra for realmente homogênea? Eu sei que algo como um modelo de mistura (via mclust em R) fornecerá estatísticas de ajuste para o caso de cluster 1: k, mas parece que …
9 r  clustering  k-means 


3
Calculando Jaccard ou outro coeficiente de associação para dados binários usando multiplicação de matrizes
Quero saber se existe alguma maneira possível de calcular o coeficiente de Jaccard usando a multiplicação de matrizes. Eu usei esse código jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / …

1
Cálculo de valor p desconhecido
Eu estava depurando recentemente um script R e achei algo muito estranho, o autor definiu sua própria função de valor p pval <- function(x, y){ if (x+y<20) { # x + y is small, requires R.basic p1<- nChooseK(x+y,x) * 2^-(x+y+1); p2<- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else …


2
Como você usa a suavização exponencial simples em R?
Eu sou iniciante em R. Você poderia explicar como usar ses no pacote de previsão de previsão R ? Eu gostaria de escolher o número de períodos iniciais e a constante de suavização. d <- c(3,4,41,10,9,86,56,20,18,36,24,59,82,51,31,29,13,7,26,19,20,103,141,145,24,99,40,51,72,58,94,78,11,15,17,53,44,34,12,15,32,14,15,26,75,110,56,43,19,17,33,26,40,42,18,24,69,18,18,25,86,106,104,35,43,12,4,20,16,8) Tenho 70 períodos, gostaria de usar 40 períodos para o inicial e 30 para …

4
Box Cox Transforms para regressão
Estou tentando ajustar um modelo linear em alguns dados com apenas um preditor (digamos (x, y)). Os dados são tais que, para valores pequenos de x, os valores de y ajustam-se firmemente a uma linha reta; no entanto, à medida que os valores de x aumentam, os valores de y …

4
Como plotar 20 anos de dados diários em séries temporais
Eu tenho o seguinte conjunto de dados: https://dl.dropbox.com/u/22681355/ORACLE.csv e gostaria de plotar as alterações diárias em 'Abrir' por 'Data', então fiz o seguinte: oracle <- read.csv(file="http://dl.dropbox.com/u/22681355/ORACLE.csv", header=TRUE) plot(oracle$Date, oracle$Open, type="l") e recebo o seguinte: Agora, obviamente, este não é o melhor enredo de todos os tempos, então estou me perguntando …

2
Determinando o maior colaborador de um grupo
Eu não sei muito sobre estatísticas, então tenha paciência comigo. Digamos que eu tenho um conjunto de 1000 trabalhadores. Quero descobrir quem é o trabalhador mais esforçado, mas só posso medir a quantidade de trabalho realizado em grupos de 1 a 100 em mais de uma hora de trabalho. Supondo …

2
Cálculo de problemas, interpretação de conjuntos de regsubs e perguntas gerais sobre o procedimento de seleção de modelos
Eu quero selecionar modelos usando regsubsets(). Eu tenho um quadro de dados chamado olympiadaten (upload de dados: http://www.sendspace.com/file/8e27d0 ). Primeiro anexo esse quadro de dados e, em seguida, começo a analisar, meu código é: attach(olympiadaten) library(leaps) a<-regsubsets(Gesamt ~ CommunistSocialist + CountrySize + GNI + Lifeexp + Schoolyears + ExpMilitary + …

1
Intervalos de confiança e previsão do modelo de regressão linear
Ok, estou tentando entender a regressão linear. Eu tenho um conjunto de dados e parece tudo bem, mas estou confuso. Este é o meu resumo-modelo linear: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.2068621 0.0247002 8.375 4.13e-09 *** temp 0.0031074 0.0004779 6.502 4.79e-07 *** --- Signif. codes: 0 ‘***’ …
9 r  regression 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.