Gostaria de ler vários arquivos csv de um diretório para pandas e concatená-los em um grande DataFrame. Ainda não consegui descobrir. Aqui está o que eu tenho até agora:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Acho que preciso de ajuda dentro do loop for ???
big_frame = pd.concat(dfs, ignore_index=True)
, de qualquer maneira uma vez que você tem uma lista de dataframes você precisará iterar sobre a lista e concat para?big_frame
dfs
agora, para que algo como for df in dfs: big_frame.concat(df, ignore_index=True)
funcione, você também pode tentar em append
vez de concat
também.
concat
deve lidar com uma lista de DataFrames tão bem quanto você. Eu acho que essa é uma abordagem muito boa.
dfs
lista, que você não deseja substituir a linhadata = pd.read_csv(filename)
comdfs.append(pd.read_csv(filename)
. Você precisaria percorrer a lista econcat
, acho que nãoconcat
funcionará em uma lista dedf
s.