Perguntas com a marcação «python»

Python é uma linguagem de programação comumente usada para aprendizado de máquina. Use esta tag para qualquer pergunta * no tópico * que (a) envolva `Python` como parte crítica da pergunta ou resposta esperada, & (b) não seja * apenas * sobre como usar o` Python`.

2
Seleção de recursos com florestas aleatórias
Eu tenho um conjunto de dados com principalmente variáveis ​​financeiras (120 recursos, exemplos de 4k) que são altamente correlacionadas e muito barulhentas (indicadores técnicos, por exemplo), então eu gostaria de selecionar cerca de 20-30 máx. Para uso posterior no treinamento de modelo (classificação binária - aumentar diminuir). Eu estava pensando …



3
Regressão logística: Scikit Learn vs glmnet
Estou tentando duplicar os resultados da sklearnbiblioteca de regressão logística usando o glmnetpacote em R. A partir da documentação dasklearn regressão logística , ele está tentando minimizar a função de custo sob pena de l2 min w , c 1minw , c12WTw + C∑i = 1Nregistro( exp( - yEu( XTEuw …


3
Como plotar a saída de dados do clustering?
Tentei agrupar um conjunto de dados (um conjunto de marcas) e obtive 2 clusters. Eu gostaria de representá-lo graficamente. Um pouco confuso sobre a representação, já que não tenho as coordenadas (x, y). Também procurando pela função MATLAB / Python para fazer isso. EDITAR Acho que a publicação de dados …

1
Qual método de comparação múltipla usar para um modelo mais antigo: lsmeans ou glht?
Estou analisando um conjunto de dados usando um modelo de efeitos mistos com um efeito fixo (condição) e dois efeitos aleatórios (participante devido ao design do sujeito e ao par). O modelo foi gerado com o lme4pacote: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Em seguida, realizei um teste de razão de verossimilhança desse modelo em …


2
Amostragem da distribuição de von Mises-Fisher em Python?
Estou procurando uma maneira simples de fazer uma amostra de uma distribuição multivariada de von Mises-Fisher em Python. Eu procurei no módulo de estatísticas no scipy e no módulo numpy, mas só encontrei a distribuição univariada de von Mises. Existe algum código disponível? Ainda não encontrei. Aparentemente, Wood (1994) projetou …

1
Ajuste de distribuição beta no Scipy
Segundo a Wikipedia, a distribuição de probabilidade beta tem dois parâmetros de forma:αα\alpha eββ\beta . Quando ligo scipy.stats.beta.fit(x)para Python, onde xhá um monte de números no intervalo , quatro valores são retornados. Isso me parece estranho.[0,1][0,1][0,1] Após pesquisar no Google, achei que um dos valores de retorno deve ser 'location', …



2
Diferença entre selecionar recursos com base em "regressão F" e com base em
Está comparando recursos usando F-regressiono mesmo que correlacionando recursos com o rótulo individualmente e observando o R2R2R^2 valor? Muitas vezes vi meus colegas usarem um F regression seleção de recursos em seu pipeline de aprendizado de máquina em sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Alguns me dizem - por que eles dão os mesmos …

1
Usando o iloc para definir valores [fechado]
Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico de Validação cruzada. Fechado há 2 anos . Essa linha retorna as 4 primeiras linhas no quadro de dados combinedparafeature_a combined.iloc[0:4]["feature_a"] Como esperado, …
13 python  pandas 

2
Quando registrar / expandir suas variáveis ​​ao usar modelos aleatórios de floresta?
Estou fazendo regressão usando florestas aleatórias para prever preços com base em vários atributos. O código é escrito em Python usando o Scikit-learn. Como você decide se deve transformar suas variáveis ​​usando exp/ logantes de usá-las para se ajustar ao modelo de regressão? É necessário ao usar uma abordagem do …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.