Perguntas com a marcação «pandas»

Pandas é uma biblioteca Python para manipulação e análise de dados, por exemplo, quadros de dados, séries temporais multidimensionais e conjuntos de dados transversais comumente encontrados em estatísticas, resultados de ciências experimentais, econometria ou finanças. O Pandas é uma das principais bibliotecas de ciência de dados em Python.

4
Quando devo usar o Pandas apply () no meu código?
Tenho visto muitas respostas postadas para perguntas no Stack Overflow envolvendo o uso do método Pandas apply. Eu também vi usuários comentando abaixo deles dizendo que " applyé lento e deve ser evitado". Eu li muitos artigos sobre o tópico de desempenho que explicam que applyé lento. Também vi um …

1
Estratégias de teste do método Pandas read_xml ()
Atualmente, as ferramentas Pandas I / O não mantêm um read_xml()método e a contraparte to_xml(). No entanto, read_jsonprova que estruturas semelhantes a árvores podem ser implementadas para importação de dataframe e read_htmlpara formatos de marcação. Se a equipe de pandas faz considerar tal read_xmlmétodo para uma versão futura pandas, que …
109 python  xml  pandas  xslt  xpath 


5
Python Pandas mescla apenas algumas colunas
É possível mesclar apenas algumas colunas? Eu tenho um DataFrame df1 com colunas x, y, z e df2 com colunas x, a, b, c, d, e, f, etc. Quero mesclar os dois DataFrames em x, mas só quero mesclar as colunas df2.a, df2.b - não o DataFrame inteiro. O resultado …
109 python  merge  pandas 

7
Como alterar o formato de data e hora no pandas
Meu dataframe tem uma DOBcoluna (formato de exemplo 1/1/2016) que, por padrão, é convertida para 'objeto' do tipo pandas dtype:DOB object Convertendo isso para formato de data com df['DOB'] = pd.to_datetime(df['DOB']), a data é convertido em: 2016-01-26e sua dtypeé: DOB datetime64[ns]. Agora, quero converter esse formato de data para 01/26/2016ou …

5
Leia um arquivo compactado como um DataFrame do pandas
Estou tentando descompactar um arquivo csv e passá-lo para o pandas para que eu possa trabalhar no arquivo. O código que tentei até agora é: import requests, zipfile, StringIO r = requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip') z = zipfile.ZipFile(StringIO.StringIO(r.content)) crime2013 = pandas.read_csv(z.read('crime_incidents_2013_CSV.csv')) Após a última linha, embora o python seja capaz de obter o …
108 python  zip  pandas 

11
produto cartesiano em pandas
Eu tenho dois dataframes do pandas: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) Qual é a prática recomendada para obter seu produto cartesiano (claro, sem escrever explicitamente como eu)? #df1, df2 cartesian product df_cartesian = DataFrame({'col1':[1,2,1,2],'col2':[3,4,3,4],'col3':[5,5,6,6]})
108 python  pandas 

4
Pandas a cada enésima linha
Dataframe.resample () funciona apenas com dados de série temporal. Não consigo encontrar uma maneira de obter cada enésima linha de dados que não sejam da série temporal. Qual é o melhor método?

5
Como adicionar título ao boxplot de origem marinha
Parece bastante pesquisável, mas não consegui encontrar algo online que funcione. Eu tentei tanto sns.boxplot('Day', 'Count', data= gg).title('lalala')e sns.boxplot('Day', 'Count', data= gg).suptitle('lalala'). Nenhum funcionou. Acho que pode ser porque também estou trabalhando com matplotlib.

11
FutureWarning: falha na comparação elemento a elemento; retornando escalar, mas no futuro executará a comparação elemento a elemento
Estou usando o Pandas 0.19.1no Python 3. Estou recebendo um aviso nessas linhas de código. Estou tentando obter uma lista que contém todos os números de linha onde string Peterestá presente na coluna Unnamed: 5. df = pd.read_excel(xls_path) myRows = df[df['Unnamed: 5'] == 'Peter'].index.tolist() Produz um Aviso: "\Python36\lib\site-packages\pandas\core\ops.py:792: FutureWarning: elementwise …



5
Obtenha o total da coluna Pandas
Alvo Eu tenho um quadro de dados do Pandas, como mostrado abaixo, com várias colunas e gostaria de obter o total da coluna MyColumn,. Quadro de dados -df: print df X MyColumn Y Z 0 A 84 13.0 69.0 1 B 76 77.0 127.0 2 C 28 69.0 16.0 3 …
107 python  pandas  dataframe  sum 



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.