Perguntas com a marcação «python»

Use para questões de ciência de dados relacionadas à linguagem de programação Python. Não se destina a perguntas gerais de codificação (-> stackoverflow).

1
Gere previsões ortogonais (não correlacionadas) para uma determinada variável
Eu tenho uma Xmatriz, uma yvariável e outra variável ORTHO_VAR. Preciso prever a yvariável usando X, no entanto, as previsões desse modelo precisam ser ortogonais e, ao ORTHO_VARmesmo tempo, estar o mais correlacionadas ypossível. Eu preferiria que as previsões fossem geradas com um método não paramétrico como, por exemplo, xgboost.XGBRegressormas …
8 correlation  machine-learning  dataset  logistic-regression  prediction  linear-regression  prediction  dummy-variables  neural-network  image-classification  python  k-nn  python  neural-network  neural-network  deep-learning  keras  tensorflow  image-classification  tensorflow  reinforcement-learning  policy-gradients  machine-learning  decision-trees  neural-network  overfitting  data-analysis  metric  python  scikit-learn  distance  scipy  machine-learning  python  scikit-learn  decision-trees  logistic-regression  keras  image-classification  implementation  machine-learning  python  scikit-learn  random-forest  decision-trees  machine-learning  feature-selection  feature-engineering  word2vec  word-embeddings  natural-language-process  scikit-learn  time-series  clustering  k-means  python  cross-validation  pyspark  statistics  cross-validation  multiclass-classification  evaluation  machine-learning  nlp  machine-translation  neural-network  deep-learning  keras  tensorflow  image-classification  machine-learning  python  similarity  distance  lstm  text  named-entity-recognition  machine-learning  keras  optimization  gan  learning-rate  neural-network  data-mining  dataset  databases  books  neural-network  rnn 

1
Como treinar dados por lote do disco?
Estou trabalhando em uma rede neural convolucional para classificação de imagens. O conjunto de dados de treinamento é muito grande para ser carregado na memória do meu computador (4 gb), além disso, também preciso tentar algum aprimoramento para equilibrar as classes. Eu estou usando keras. Eu olhei em muitos exemplos, …

2
Usando o TF-IDF com outros recursos no SKLearn
Qual é a melhor / maneira correta de combinar a análise de texto com outros recursos? Por exemplo, eu tenho um conjunto de dados com algum texto, mas também outros recursos / categorias. O vetorizador TF-IDF do SKlearn transforma dados de texto em matrizes esparsas. Eu posso usar essas matrizes …

1
Estou fazendo uma transformação de log de dados corretamente?
Estou fazendo uma análise de dados exploratória em alguns dados e recebo estes histogramas: Isso parece um candidato para uma transformação de log nos dados, então eu executo o seguinte código Python para transformar os dados: df["abv"].apply(np.log).hist() df["ibu"].apply(np.log).hist() plt.show() E eu recebo este novo gráfico dos histogramas transformados: Estou certo …

3
ReLU vs sigmoid no exemplo mnist
ATENÇÃO: Não estou tentando melhorar o exemplo a seguir. Eu sei que você pode obter mais de 99% de precisão. O código inteiro está na pergunta. Quando tentei esse código simples, obtive cerca de 95% de precisão; se eu simplesmente alterar a função de ativação de sigmoid para relu, ela …



3
Descubra se os dois conjuntos de dados estão próximos um do outro
Eu tenho os seguintes três conjuntos de dados. data_a=[0.21,0.24,0.36,0.56,0.67,0.72,0.74,0.83,0.84,0.87,0.91,0.94,0.97] data_b=[0.13,0.21,0.27,0.34,0.36,0.45,0.49,0.65,0.66,0.90] data_c=[0.14,0.18,0.19,0.33,0.45,0.47,0.55,0.75,0.78,0.82] data_a são dados reais e os outros dois são os simulados. Aqui, estou tentando verificar qual deles (data_b ou data_c) é o mais próximo ou se assemelha ao data_a. Atualmente, estou fazendo isso visualmente e com o teste ks_2samp …



3
Como converter lista aninhada em uma única lista em python? [fechadas]
Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico do Data Science Stack Exchange. Fechado há 2 anos . Eu tenho uma lista que contém o número de identificação. Alguns elementos da …
7 python 



1
Saco de Palavras Visuais
O que estou tentando fazer: Estou tentando classificar algumas imagens usando recursos locais e globais. O que eu fiz até agora: Eu extraí descritores de peneiração para cada imagem e estou usando isso como minha entrada para k-means para criar meu vocabulário a partir de todos os recursos de cada …

2
migrando para python do R: perguntas específicas
Eu tenho usado o R e o RStudio para criação de protótipos e modelos e, devido a alguns problemas persistentes (que só seriam aplicáveis ​​ao ambiente em que estou usando), decidimos usar o python. Estou procurando saber: existe um ambiente de desenvolvimento python como "RStudio Server"? Quão fácil / difícil …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.