백엔드/데이터

파이썬 엑셀파일 합치기 concat 파일병합

silvering0 2021. 4. 1. 14:13

지정된 폴더에 있는 파일들을 모두 합쳐서 하나의 파일로 사용하고 싶을 때,

엑셀의 파워쿼리 병합과 같은 기능을 하기 위해

concat 함수를 사용할 수 있습니다.

import pandas as pd
import glob


input=glob.glob('C:\~~\*.xls')


alldata=[]


for file in input:
    df=pd.read_excel(file)
    alldata.append(df)
    

datacombine=pd.concat(alldata,axis=0,ignore_index=True)


alldata

 

결과창은 아래와 같습니다.

 

glob.glob을 사용하면, 폴더 내 있는 파일 목록을 불러올 수 있습니다.

이때 '경로/*.xlsx'를 넣어 주었는데요, 지정된 경로 뒤에 /*.파일형식 을 넣어주면

지정된 파일 형식을 가진 파일을 모두 불러오게 됩니다.

 

이것을 input 으로 두고,

for 문으로 엑셀파일을 모두 읽어와 새롭게 저장을 해 주었습니다.

 

그리고, pd.concat을 사용해서 새롭게 저장한 그 파일을 합치고 부르면,

모든 파일이 합쳐진 모습을 볼 수 있습니다.