Perguntas com a marcação «python»

Python é uma linguagem de programação comumente usada para aprendizado de máquina. Use esta tag para qualquer pergunta * no tópico * que (a) envolva `Python` como parte crítica da pergunta ou resposta esperada, & (b) não seja * apenas * sobre como usar o` Python`.

6
Recursos para aprender a implementar métodos de conjunto
Entendo teoricamente (mais ou menos) como eles funcionariam, mas não tenho certeza de como usar um método de conjunto (como votação, misturas ponderadas etc.). Quais são os bons recursos para implementar métodos de ensemble? Existem recursos específicos em relação à implementação em Python? EDITAR: Para esclarecer alguns com base na …

3
Ruby como bancada de estatística
Essa também é uma questão que se relaciona muito com o Python como bancada de estatística e o Excel como bancada de estatística . Eu sei que há uma enorme discussão sobre Ruby versus Python, mas este não é o ponto nesta questão. Eu pensei que Ruby ser mais rápido …
13 r  python  software  ruby 


9
Árvores de decisão melhoradas em python? [fechadas]
Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico de Validação cruzada. Fechado há 4 meses . Existe uma boa biblioteca python para o treinamento de árvores de decisão aprimoradas?
13 python  cart  boosting 

2
Usando o BIC para estimar o número de k em KMEANS
No momento, estou tentando calcular o BIC para o meu conjunto de dados de brinquedos (ofc iris (:). Quero reproduzir os resultados conforme mostrado aqui (Fig. 5). Esse documento também é minha fonte para as fórmulas do BIC. Eu tenho 2 problemas com isso: Notação: ninin_i = número de elementos …

2
Como usar um filtro Kalman?
Eu tenho uma trajetória de um objeto em um espaço 2D (uma superfície). A trajetória é dada como uma sequência de (x,y)coordenadas. Sei que minhas medições são barulhentas e às vezes tenho discrepâncias óbvias. Então, eu quero filtrar minhas observações. Tanto quanto eu entendi o filtro Kalman, ele faz exatamente …

1
Pacote GBM vs. Caret usando GBM
Estive usando o ajuste de modelo caret, mas depois executei novamente o modelo usando o gbmpacote. Entendo que o caretpacote usa gbme a saída deve ser a mesma. No entanto, apenas um teste rápido usando data(iris)mostra uma discrepância no modelo de cerca de 5% usando RMSE e R ^ 2 …




5
Como executar a imputação de valores em um número muito grande de pontos de dados?
Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


1
Pacotes Python para trabalhar com modelos de mistura gaussianos (GMMs)
Parece haver várias opções disponíveis para trabalhar com GMMs (Gaussian Mixture Models) em Python. À primeira vista, existem pelo menos: PyMix - http://www.pymix.org/pymix/index.php Ferramentas para modelagem de mistura PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, que faz parte da caixa de ferramentas Scipy e parece se concentrar na atualização dos GMMs : Agora conhecida …

1
Interpretação de saída Scikit predict_proba
Estou trabalhando com a biblioteca scikit-learn em python. No código abaixo, estou prevendo probabilidade, mas não sei ler a saída. Testando dados from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) Dividir o conjunto de dados X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, …

2
É possível avaliar o GLM no Python / scikit-learn usando as distribuições Poisson, Gamma ou Tweedie como a família para a distribuição de erros?
Tentando aprender um pouco de Python e Sklearn, mas para o meu trabalho eu preciso executar regressões que usem distribuições de erro das famílias Poisson, Gamma e, especialmente, Tweedie. Não vejo nada na documentação sobre eles, mas eles estão em várias partes da distribuição R, então eu queria saber se …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.