Perguntas com a marcação «pandas»

Pandas é uma biblioteca Python para manipulação e análise de dados, por exemplo, quadros de dados, séries temporais multidimensionais e conjuntos de dados transversais comumente encontrados em estatísticas, resultados de ciências experimentais, econometria ou finanças. O Pandas é uma das principais bibliotecas de ciência de dados em Python.


5
Adicionar datas ausentes ao quadro de dados do pandas
Meus dados podem ter vários eventos em uma determinada data ou NENHUM evento em uma data. Pego esses eventos, conto por data e os traço. No entanto, quando os traço, minhas duas séries nem sempre correspondem. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() No código acima, o idx se torna …
126 python  date  plot  pandas  dataframe 

6
Como manter o índice ao usar a mesclagem de pandas
Gostaria de mesclar dois DataFramese manter o índice do primeiro quadro como o índice no conjunto de dados mesclado. No entanto, quando faço a mesclagem, o DataFrame resultante possui um índice inteiro. Como posso especificar que quero manter o índice do quadro de dados esquerdo? In [4]: a = pd.DataFrame({'col1': …
126 python  pandas 

4
tipos de data e hora em pandas read_csv
Estou lendo em um arquivo csv com várias colunas datetime. Eu precisaria definir os tipos de dados após a leitura no arquivo, mas às vezes parece ser um problema. Por exemplo: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Quando a …

9
python pandas remove colunas duplicadas
Qual é a maneira mais fácil de remover colunas duplicadas de um dataframe? Estou lendo um arquivo de texto com colunas duplicadas por meio de: import pandas as pd df=pd.read_table(fname) Os nomes das colunas são: Time, Time Relative, N2, Time, Time Relative, H2, etc... Todas as colunas Tempo e Relativo …
126 python  pandas 


4
Como formar uma coluna de tupla a partir de duas colunas no Pandas
Eu tenho um DataFrame do Pandas e quero combinar as colunas 'lat' e 'long' para formar uma tupla. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values …




8
Pandas groupby: Como obter uma união de cordas
Eu tenho um quadro de dados como este: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! Chamando In [10]: print df.groupby("A")["B"].sum() retornará A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 …
122 python  pandas 

3
Encontre o nome da coluna que tem o valor máximo para cada linha
Tenho um DataFrame como este: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Aqui, eu quero perguntar como obter o nome da coluna …
122 python  pandas  dataframe  max 




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.