Perguntas com a marcação «python»

Use para questões de ciência de dados relacionadas à linguagem de programação Python. Não se destina a perguntas gerais de codificação (-> stackoverflow).


8
Diferença entre fit e fit_transform nos modelos scikit_learn?
Sou iniciante em ciência de dados e não entendo a diferença entre fite fit_transformmétodos no scikit-learn. Alguém pode simplesmente explicar por que precisamos transformar dados? O que significa ajustar modelo em dados de treinamento e transformar em dados de teste? Significa, por exemplo, converter variáveis ​​categóricas em números no trem …

15
Python vs R para aprendizado de máquina
Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a recomendação?


1
Diferença entre isna () e isnull () em pandas
Eu tenho usado pandas por algum tempo. Mas não entendi qual é a diferença entre isna()e isnull()nos pandas. E, mais importante, qual usar para identificar valores ausentes no quadro de dados. Qual é a diferença básica subjacente de como um valor é detectado como um naou outro null?




8
Coordenadas de localização geográfica em cluster (pares longos e latinos)
Qual é a abordagem correta e o algoritmo de clustering para clustering de geolocalização? Estou usando o seguinte código para agrupar coordenadas de localização geográfica: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y …



7
ValueError: a entrada contém NaN, infinito ou um valor muito grande para dtype ('float32')
Eu obtive o ValueError ao prever dados de teste usando um modelo RandomForest. Meu código: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) O erro: ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). Como encontro os valores incorretos no …


3
Multi GPU em keras
Como você pode programar na biblioteca keras (ou tensorflow) para particionar o treinamento em várias GPUs? Digamos que você esteja em uma instância do Amazon ec2 com 8 GPUs e que gostaria de usá-los para treinar mais rapidamente, mas seu código é apenas para uma única CPU ou GPU.


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.