Gostaria de ler vários arquivos csv de um diretório para pandas e concatená-los em um grande DataFrame. Ainda não consegui descobrir. Aqui está o que eu tenho até agora:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Acho que preciso de ajuda dentro do loop for ???
big_frame = pd.concat(dfs, ignore_index=True), de qualquer maneira uma vez que você tem uma lista de dataframes você precisará iterar sobre a lista e concat para?big_frame
dfsagora, para que algo como for df in dfs: big_frame.concat(df, ignore_index=True)funcione, você também pode tentar em appendvez de concattambém.
concatdeve lidar com uma lista de DataFrames tão bem quanto você. Eu acho que essa é uma abordagem muito boa.
dfslista, que você não deseja substituir a linhadata = pd.read_csv(filename)comdfs.append(pd.read_csv(filename). Você precisaria percorrer a lista econcat, acho que nãoconcatfuncionará em uma lista dedfs.