Perguntas com a marcação «pandas»

Pandas é uma biblioteca Python para manipulação e análise de dados, por exemplo, quadros de dados, séries temporais multidimensionais e conjuntos de dados transversais comumente encontrados em estatísticas, resultados de ciências experimentais, econometria ou finanças. O Pandas é uma das principais bibliotecas de ciência de dados em Python.


13
Como imprimir um objeto groupby
Quero imprimir o resultado do agrupamento com os pandas. Eu tenho um quadro de dados: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one …
133 python  pandas 



5
Normalizar dados em pandas
Suponha que eu tenha um quadro de dados do pandas df: Quero calcular a média da coluna de um quadro de dados. Isso é facil: df.apply(average) então o intervalo sábio da coluna max (col) - min (col). Isso é fácil novamente: df.apply(max) - df.apply(min) Agora, para cada elemento, quero subtrair …
131 python  pandas  numpy 

10
Pandas convertem dataframe em matriz de tuplas
Manipulei alguns dados usando pandas e agora quero executar um salvamento em lote no banco de dados. Isso requer que eu converta o quadro de dados em uma matriz de tuplas, com cada tupla correspondendo a uma "linha" do quadro de dados. Meu DataFrame se parece com: In [182]: data_set …
131 python  pandas 

3
qual é a maneira mais eficiente de contar ocorrências em pandas?
Eu tenho um grande dataframe df (cerca de 12M linhas) com dizer: df.columns = ['word','documents','frequency'] Portanto, o seguinte foi executado em tempo hábil: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index() MaxFrequency_perWord.columns = ['word','MaxFrequency'] No entanto, isso está demorando muito tempo para ser executado: Occurrences_of_Words = word_grouping[['word']].count().reset_index() O que eu estou fazendo …
131 python  pandas 

2
verifique se a variável é dataframe
quando minha função f é chamada com uma variável, quero verificar se var é um dataframe do pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Eu acho que a solução pode ser bastante simples, mas mesmo com def f(var): if var.values != None: print "do stuff" Não consigo …
130 python  pandas 

6
como verificar o tipo de uma coluna em pandas python
Eu preciso usar funções diferentes para tratar colunas numéricas e colunas de seqüência de caracteres. O que estou fazendo agora é realmente burro: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:, (agg.dtypes!=np.float64)&(agg.dtypes!=np.int)]).columns) for y in allc: treat_str(agg[y]) Existe uma maneira mais elegante de fazer isso? Por …
130 python  pandas 


8
Como plotar separar DataFrames do Pandas como subtramas?
Eu tenho alguns DataFrames do Pandas compartilhando a mesma escala de valor, mas com colunas e índices diferentes. Ao invocar df.plot(), recebo imagens de plotagem separadas. o que eu realmente quero é tê-los todos no mesmo enredo que os sub-enredos, mas infelizmente não estou conseguindo encontrar uma solução para como …


7
Removendo a coluna de índice nos pandas ao ler um csv
Eu tenho o seguinte código que importa um arquivo CSV. Existem 3 colunas e quero definir as duas primeiras para variáveis. Quando defino a segunda coluna para a variável "eficiência", a coluna de índice também é abordada. Como posso me livrar da coluna do índice? df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False) …
128 python  pandas 


8
Use .corr para obter a correlação entre duas colunas
Eu tenho o seguinte quadro de dados de pandas Top15: Crio uma coluna que estima o número de documentos citáveis ​​por pessoa: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Quero conhecer a correlação entre o número de documentos citáveis …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.