반응형
In [1]:
import pandas as pd
import glob
import os
from IPython.core.display import display, HTML
display(HTML("<style> .container{width:90% !important;}</style>"))
In [2]:
input_file = r'C:\Users\lleon\practice\metro' # csv파일들이 있는 위치
output_file = r'C:\Users\lleon\practice\metro\result_line.csv' # 병합하고 저장하려는 파일명
In [3]:
allFile_list = glob.glob(os.path.join(input_file, 'line_*')) # glob함수로 line_으로 시작하는 파일들을 모은다
print(allFile_list)
In [4]:
allData = [] # 읽어 들인 csv파일 내용을 저장할 빈 리스트를 하나 만든다
for file in allFile_list:
df = pd.read_csv(file, engine='python') # for구문으로 csv파일들을 읽어 들인다
allData.append(df) # 빈 리스트에 읽어 들인 내용을 추가한다
In [5]:
dataCombine = pd.concat(allData, axis=0, ignore_index=True) # concat함수를 이용해서 리스트의 내용을 병합
# axis=0은 수직, axis=1은 수평으로 병합함. ignore_index=True는 인덱스 값이 기존 순서를 무시하고 순서대로 정렬되도록 한다.
dataCombine.to_csv(output_file, index=False, encoding='utf-8-sig') # to_csv함수로 저장한다. 인데스를 빼려면 False로 설정
In [6]:
result_line = pd.read_csv(r"C:\Users\lleon\practice\metro\result_line.csv", engine='python', encoding='utf-8')
result_line.head(30) # 잘 병합되었는지 확인
Out[6]:
반응형
'각종공부 > 파이썬 오류 해결 & 팁' 카테고리의 다른 글
[파이썬] csv 데이터프레임에서 문자열 분리 & 특정 위치 문자열 추출하는 방법 (0) | 2020.01.05 |
---|---|
[파이썬] csv 데이터프레임에서 특정 문자열을 포함하는 행만 추출하는 법(결측치 있을 때 포함) (0) | 2020.01.05 |
pipenv 배치파일 인식 오류(virtualenv와의 충돌 해결법) (0) | 2019.12.15 |
Tensorflow) RuntimeError: Attempted to use a closed Session. 오류 (0) | 2019.12.01 |
[파이썬] Graphviz PATH 오류 (0) | 2018.12.16 |
댓글