Perguntas com a marcação «dataframe»

Um quadro de dados é uma estrutura de dados tabular. Geralmente, ele contém dados em que linhas são observações e colunas são variáveis ​​de vários tipos. Enquanto "quadro de dados" ou "quadro de dados" é o termo usado para esse conceito em várias línguas (R, Apache Spark, deedle, Maple, a biblioteca de pandas em Python e a biblioteca de DataFrames em Julia), "tabela" é o termo usado em MATLAB e SQL.




5
Criando um DataFrame Pandas vazio e preenchendo-o?
Estou começando nos documentos do DataFrame do pandas aqui: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Gostaria de preencher iterativamente o DataFrame com valores em um tipo de cálculo de série temporal. Então, basicamente, eu gostaria de inicializar o DataFrame com as colunas A, B e as linhas de registro de data e hora, todas as …
461 python  dataframe  pandas 




11
Selecione por string parcial de um DataFrame do pandas
Eu tenho um DataFramecom 4 colunas, das quais 2 contêm valores de seqüência de caracteres. Eu queria saber se havia uma maneira de selecionar linhas com base em uma correspondência de seqüência parcial contra uma coluna específica? Em outras palavras, uma função ou função lambda que faria algo como re.search(pattern, …


7
Obter estatísticas para cada grupo (como contagem, média, etc.) usando os pandas GroupBy?
Eu tenho um quadro de dados dfe uso várias colunas para groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Da maneira acima, quase recebo a tabela (quadro de dados) necessária. O que está faltando é uma coluna adicional que contém o número de linhas em cada grupo. Em outras palavras, quero dizer, mas também gostaria de …

7
Como filtrar o dataframe do Pandas usando 'in' e 'not in' como no SQL
Como posso obter os equivalentes de SQL INeNOT IN ? Eu tenho uma lista com os valores necessários. Aqui está o cenário: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Minha maneira atual de fazer isso é a seguinte: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) …

18
UnicodeDecodeError ao ler o arquivo CSV no Pandas com Python
Estou executando um programa que está processando 30.000 arquivos semelhantes. Um número aleatório deles está parando e produzindo esse erro ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", …


16
Alterando nomes de colunas de um quadro de dados
Eu tenho um quadro de dados chamado "newprice" (veja abaixo) e quero alterar os nomes das colunas no meu programa em R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 De fato, é isso que estou fazendo: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Não …
399 r  dataframe  rename 


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.