본문 바로가기
각종공부/파이썬 오류 해결 & 팁

[파이썬] csv 데이터프레임에서 특정 문자열을 포함하는 행만 추출하는 법(결측치 있을 때 포함)

by 달슬 2020. 1. 5.
반응형

 

 

In [1]:
import pandas as pd
from IPython.core.display import display, HTML
display(HTML("<style> .container{width:90% !important;}</style>"))
 
 
In [2]:
result_line = pd.read_csv(r"C:\Users\lleon\practice\metro\result_line.csv", encoding='utf-8')
result_line.head() #'지번주소' 열의 data 중에서 '서울특별시' 문자열을 포함하는 행만 sort하려 합니다.
Out[2]:
  철도운영기관명 선명 역명 지번주소 도로명주소
0 코레일 1호선 소요산 경기도 동두천시 상봉암동 126-3 경기도 동두천시 평화로 2925
1 코레일 1호선 동두천 경기도 동두천시 동두천동 245-210 경기도 동두천시 평화로 2687
2 코레일 1호선 보산 경기도 동두천시 보산동 422 경기도 동두천시 평화로 2539
3 코레일 1호선 동두천중앙 경기도 동두천시 생연동 726-3 경기도 동두천시 동두천로 228
4 코레일 1호선 지행 경기도 동두천시 지행동 424-1 경기도 동두천시 평화로 2285
In [3]:
result_line_seoul = result_line.loc[result_line['지번주소'].str.contains('서울특별시', na=False)] #결측치가 있을 경우 'na=False'를 포함하면 됩니다.
result_line_seoul.head()
Out[3]:
  철도운영기관명 선명 역명 지번주소 도로명주소
13 코레일 1호선 도봉산 서울특별시 도봉구 도봉동 18-1 서울특별시 도봉구 도봉로 964-33
14 코레일 1호선 도봉 서울특별시 도봉구 도봉동 639 서울특별시 도봉구 도봉로 170길 2
15 코레일 1호선 방학 서울특별시 도봉구 방학동 728 서울특별시 도봉구 도봉로 150다길 3
16 코레일 1호선 창동 서울특별시 도봉구 창동 135-1 서울특별시 도봉구 마들로11길 77
17 코레일 1호선 녹천 서울특별시 도봉구 창동 57-11 서울특별시 도붕구 덕릉로 376
반응형

댓글