각종공부/파이썬 오류 해결 & 팁
[파이썬] 여러개의 csv파일을 한번에 import하고, 합친 파일을 export 하는 법(예제파일 첨부)
달슬
2020. 1. 5. 17:21
반응형
In [1]:
import pandas as pd
import glob
import os
from IPython.core.display import display, HTML
display(HTML("<style> .container{width:90% !important;}</style>"))
In [2]:
input_file = r'C:\Users\lleon\practice\metro' # csv파일들이 있는 위치
output_file = r'C:\Users\lleon\practice\metro\result_line.csv' # 병합하고 저장하려는 파일명
In [3]:
allFile_list = glob.glob(os.path.join(input_file, 'line_*')) # glob함수로 line_으로 시작하는 파일들을 모은다
print(allFile_list)
In [4]:
allData = [] # 읽어 들인 csv파일 내용을 저장할 빈 리스트를 하나 만든다
for file in allFile_list:
df = pd.read_csv(file, engine='python') # for구문으로 csv파일들을 읽어 들인다
allData.append(df) # 빈 리스트에 읽어 들인 내용을 추가한다
In [5]:
dataCombine = pd.concat(allData, axis=0, ignore_index=True) # concat함수를 이용해서 리스트의 내용을 병합
# axis=0은 수직, axis=1은 수평으로 병합함. ignore_index=True는 인덱스 값이 기존 순서를 무시하고 순서대로 정렬되도록 한다.
dataCombine.to_csv(output_file, index=False, encoding='utf-8-sig') # to_csv함수로 저장한다. 인데스를 빼려면 False로 설정
In [6]:
result_line = pd.read_csv(r"C:\Users\lleon\practice\metro\result_line.csv", engine='python', encoding='utf-8')
result_line.head(30) # 잘 병합되었는지 확인
Out[6]:
반응형