Estatísticas e Big Data python

6

Recursos para aprender a implementar métodos de conjunto

Entendo teoricamente (mais ou menos) como eles funcionariam, mas não tenho certeza de como usar um método de conjunto (como votação, misturas ponderadas etc.). Quais são os bons recursos para implementar métodos de ensemble? Existem recursos específicos em relação à implementação em Python? EDITAR: Para esclarecer alguns com base na …

13 machine-learning python ensemble

3

Ruby como bancada de estatística

Essa também é uma questão que se relaciona muito com o Python como bancada de estatística e o Excel como bancada de estatística . Eu sei que há uma enorme discussão sobre Ruby versus Python, mas este não é o ponto nesta questão. Eu pensei que Ruby ser mais rápido …

13 r python software ruby

4

Existem tutoriais sobre a teoria das probabilidades bayesianas ou modelos gráficos por exemplo?

Eu já vi referências ao aprendizado da teoria das probabilidades bayesianas em R, e eu queria saber se há mais como isso, talvez especificamente em Python? Voltado para o aprendizado da teoria da probabilidade bayesiana, inferência, estimativa da máxima verossimilhança, modelos gráficos e o tipo?

13 machine-learning bayesian python graphical-model

9

Árvores de decisão melhoradas em python? [fechadas]

Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico de Validação cruzada. Fechado há 4 meses . Existe uma boa biblioteca python para o treinamento de árvores de decisão aprimoradas?

13 python cart boosting

2

Usando o BIC para estimar o número de k em KMEANS

No momento, estou tentando calcular o BIC para o meu conjunto de dados de brinquedos (ofc iris (:). Quero reproduzir os resultados conforme mostrado aqui (Fig. 5). Esse documento também é minha fonte para as fórmulas do BIC. Eu tenho 2 problemas com isso: Notação: ninin_i = número de elementos …

13 python k-means scikit-learn bic

2

Como usar um filtro Kalman?

Eu tenho uma trajetória de um objeto em um espaço 2D (uma superfície). A trajetória é dada como uma sequência de (x,y)coordenadas. Sei que minhas medições são barulhentas e às vezes tenho discrepâncias óbvias. Então, eu quero filtrar minhas observações. Tanto quanto eu entendi o filtro Kalman, ele faz exatamente …

12 python kalman-filter smoothing

1

Pacote GBM vs. Caret usando GBM

Estive usando o ajuste de modelo caret, mas depois executei novamente o modelo usando o gbmpacote. Entendo que o caretpacote usa gbme a saída deve ser a mesma. No entanto, apenas um teste rápido usando data(iris)mostra uma discrepância no modelo de cerca de 5% usando RMSE e R ^ 2 …

12 r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

4

Como ajustar (sistematicamente) a taxa de aprendizado com o Gradient Descent como o Otimizador?

Um estranho para o campo ML / DL; iniciou o curso Udacity Deep Learning, baseado no Tensorflow; fazendo a tarefa 3, problema 4; tentando ajustar a taxa de aprendizado com a seguinte configuração: Tamanho do lote 128 Número de etapas: o suficiente para preencher duas épocas Tamanhos de camadas ocultas: …

12 python machine-learning tensorflow deep-learning

1

Regressão logística ordinal em Python

Gostaria de executar uma regressão logística ordinal em Python - para uma variável de resposta com três níveis e com alguns fatores explicativos. O statsmodelspacote suporta os modelos binário de logit e multinomial logit (MNLogit), mas não o logit ordenado. Como a matemática subjacente não é tão diferente, gostaria de …

12 categorical-data python logit ordered-logit statsmodels

1

Como interpretar o gráfico de autocorrelação no MCMC

Estou me familiarizando com as estatísticas bayesianas lendo o livro Doing Bayesian Data Analysis , de John K. Kruschke, também conhecido como "livro de filhotes". No capítulo 9, modelos hierárquicos são introduzidos com este exemplo simples: yj iθjμκ~ B e r n o u l l i ( θj)~ B …

12 bayesian interpretation python mcmc autocorrelation

5

Como executar a imputação de valores em um número muito grande de pontos de dados?

Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Por que essa distribuição é uniforme?

Estamos investigando testes estatísticos bayesianos e deparamos com um fenômeno estranho (para mim pelo menos). Considere o seguinte caso: estamos interessados em medir qual população, A ou B, tem uma taxa de conversão mais alta. Para uma verificação de sanidade, definimos pA=pBpA=pBp_A = p_B , ou seja, a probabilidade de …

12 hypothesis-testing bayesian binomial python beta-distribution

1

Pacotes Python para trabalhar com modelos de mistura gaussianos (GMMs)

Parece haver várias opções disponíveis para trabalhar com GMMs (Gaussian Mixture Models) em Python. À primeira vista, existem pelo menos: PyMix - http://www.pymix.org/pymix/index.php Ferramentas para modelagem de mistura PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, que faz parte da caixa de ferramentas Scipy e parece se concentrar na atualização dos GMMs : Agora conhecida …

12 normal-distribution python mixture

1

Interpretação de saída Scikit predict_proba

Estou trabalhando com a biblioteca scikit-learn em python. No código abaixo, estou prevendo probabilidade, mas não sei ler a saída. Testando dados from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) Dividir o conjunto de dados X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, …

12 python scikit-learn

2

É possível avaliar o GLM no Python / scikit-learn usando as distribuições Poisson, Gamma ou Tweedie como a família para a distribuição de erros?

Tentando aprender um pouco de Python e Sklearn, mas para o meu trabalho eu preciso executar regressões que usem distribuições de erro das famílias Poisson, Gamma e, especialmente, Tweedie. Não vejo nada na documentação sobre eles, mas eles estão em várias partes da distribuição R, então eu queria saber se …

12 generalized-linear-model python scikit-learn gradient-descent tweedie-distribution

Perguntas com a marcação «python»