Perguntas com a marcação «pandas»

Pandas é uma biblioteca Python para manipulação e análise de dados, por exemplo, quadros de dados, séries temporais multidimensionais e conjuntos de dados transversais comumente encontrados em estatísticas, resultados de ciências experimentais, econometria ou finanças. O Pandas é uma das principais bibliotecas de ciência de dados em Python.



7
Qual é a diferença entre ingressar e mesclar no Pandas?
Suponha que eu tenha dois DataFrames como este: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Quero mesclá-los, então tento algo assim: pd.merge(left, right, left_on='key1', right_on='key2') E eu estou feliz key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 …
208 python  pandas  dataframe  join 

7
Pandas agrupados e soma
Estou usando esse quadro de dados: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 …

9
Mantenha apenas parte da data ao usar pandas.to_datetime
Eu uso pandas.to_datetimepara analisar as datas nos meus dados. Por padrão, os pandas representam as datas datetime64[ns], embora as datas sejam apenas diárias. Gostaria de saber se existe uma maneira elegante / inteligente de converter as datas para datetime.dateou datetime64[D]para que, quando eu escrevo os dados em CSV, as datas …
201 python  pandas  csv  datetime  series 



11
Como dividir uma coluna em duas colunas?
Eu tenho um quadro de dados com uma coluna e gostaria de dividi-lo em duas colunas, com um cabeçalho de coluna como ' fips'e o outro'row' Meu dataframe dffica assim: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 …
196 python  dataframe  pandas 



8
Selecione linhas DataFrame entre duas datas
Estou criando um DataFrame a partir de um CSV da seguinte maneira: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) O DataFrame possui uma coluna de data. Existe uma maneira de criar um novo DataFrame (ou apenas substituir o existente) que contém apenas linhas com valores de data que se …
195 python  pandas 

7
Adicione rótulos x e y a um gráfico de pandas
Suponha que eu tenha o seguinte código que plota algo muito simples usando pandas: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video streaming dropout by category') Como defino facilmente os rótulos x …

15
Como leio um arquivo csv grande com pandas?
Estou tentando ler um arquivo csv grande (aprox. 6 GB) no pandas e estou recebendo um erro de memória: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Alguma ajuda nisso?
194 python  pandas  csv  memory  chunks 



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.