Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

5
Os estatísticos assumem que não se pode regar demais uma planta, ou estou apenas usando os termos de pesquisa incorretos para a regressão curvilínea?
Quase tudo o que li sobre regressão linear e GLM se resume a isso: y=f(x,β)y=f(x,β)y = f(x,\beta) onde f(x,β)f(x,β)f(x,\beta) é uma função não-crescente ou não-decrescente de xxx e é o parâmetro que você estima e testar hipóteses sobre. Existem dezenas de funções de link e transformações de e para fazer …



9
Distâncias Pairhal Mahalanobis
Preciso calcular a distância de Mahalanobis da amostra em R entre cada par de observações em uma matriz de covariáveis. Preciso de uma solução que seja eficiente, ou seja, apenas as distâncias sejam calculadas e implementadas preferencialmente em C / RCpp / Fortran etc. Suponho que , a matriz de …
18 r  algorithms  distance 


1
Como lidar com alta correlação entre preditores em regressão múltipla?
Encontrei uma referência em um artigo que é como: Segundo Tabachnick e Fidell (1996), as variáveis ​​independentes com correlação bivariada maior que 0,70 não devem ser incluídas na análise de regressão múltipla. Problema: usei em um projeto de regressão múltipla 3 variáveis ​​correlacionadas> 0,80, VIF em cerca de 0,2 - …

3
Períodos no histórico de estatísticas
A história de muitos campos da ciência pode ser dividida em um pequeno número de intervalos de tempo que geralmente começam com algumas descobertas importantes. Mas nunca vi algo semelhante na linha do tempo das estatísticas. Obviamente, existem algumas datas importantes que podem ser consideradas como pontos de partida de …
18 history 

1
Os números truncados de um gerador de números aleatórios ainda são 'aleatórios'?
Aqui 'truncar' implica reduzir a precisão dos números aleatórios e não truncar a série de números aleatórios. Por exemplo, se eu tiver números verdadeiramente aleatórios (extraídos de qualquer distribuição, por exemplo, normal, uniforme etc.) com precisão arbitrária e truncar todos os números para que, finalmente, acabe com um conjunto de …


2
A teoria da variância mínima é uma estimativa imparcial super enfatizada na escola de pós-graduação?
Recentemente, fiquei muito envergonhado quando dei uma resposta imediata sobre as estimativas imparciais da variância mínima para parâmetros de uma distribuição uniforme que estava completamente errada. Felizmente, fui imediatamente corrigido pelo cardeal e Henry, com Henry fornecendo as respostas corretas para o OP . Isso me fez pensar. Aprendi a …


6
Opções de análise de dados fora do núcleo
Uso SAS profissionalmente há quase 5 anos. Eu o instalei no meu laptop e frequentemente tenho que analisar conjuntos de dados com 1.000 a 2.000 variáveis ​​e centenas de milhares de observações. Tenho procurado alternativas ao SAS que me permitam realizar análises em conjuntos de dados de tamanhos semelhantes. Estou …
18 r  sas  large-data 

3
Qual é o papel do MDS nas estatísticas modernas?
Recentemente, deparei-me com dimensionamento multidimensional. Estou tentando entender melhor essa ferramenta e seu papel na estatística moderna. Então, aqui estão algumas perguntas norteadoras: Quais perguntas ele responde? Quais pesquisadores geralmente estão interessados ​​em usá-lo? Existem outras técnicas estatísticas que executam funções semelhantes? Que teoria é desenvolvida em torno dela? Como …

2
Qual é o valor "
Qual é o valor de dado no resumo de um modelo de coxph em R? Por exemplo,R2R2R^2 Rsquare= 0.186 (max possible= 0.991 ) Eu tolamente incluí um manuscrito como valor e o revisor saltou dizendo que não estava ciente de um análogo da estatística a partir da regressão linear clássica …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.