본문 바로가기
반응형

각종공부32

머신러닝 공부 요약 정리 1편 - 비용함수, 학습률 | Machine Learning(Coursera, Andrew Ng) ○ 머신러닝 알고리즘의 종류 - Supervised Learning(지도학습) : 회귀(Regression), 분류(Classification) - Unsupervised Learning(비지도학습) - 기타 : Reinforcement learning, recommender systems ○ 비용함수(Cost Function) - 가설 : $ h_{\Theta }(x) = \Theta _{0}+\Theta _{1}x $ - 모수 : $ \Theta _{0}, \Theta _{1} $ - 비용함수 : $ J(\Theta_{0}, \Theta _{1}) = \frac{1}{2m} \sum_{i=1}^{m}(h_{\Theta }(x^{i})-y^{(i))})^2 $ - 목표 : $minimize_{\Thet.. 2020. 5. 29.
[파이썬] xlwings 모듈 com_error: (-2147352570, '알 수 없는 이름입니다.', None, None) 오류 해결 방법 KB에서 제공되는 '★(월간)KB주택가격동향_시계열' 엑셀 파일(xls, xlsx)을 파이썬 xlwings 모듈로 불러오는 도중 계속 다음과 같은 오류가 발생하였습니다. import pandas as pd import xlwings as xw path = r'C:\★(월간)KB주택가격동향_시계열.xls' wb = xw.Book(path) → com_error: (-2147352570, '알 수 없는 이름입니다.', None, None) 코드에는 문제가 없는 것 같던데 자꾸 위와 같은 오류가 떠서 멘붕이었습니다ㅠㅠ 어떻게 해결해야 할지 몰라 정말 한참을 구글링을 했는데요. 답은 정말 가까이에 있었습니다. 제가 엑셀 파일을 열어놓고 파일이랑 수식이랑 비교해가면서 코딩을 하고 있었는데요. https://sta.. 2020. 1. 7.
[파이썬] 데이터프레임에서 해당 열의 값을 그룹별로 행의 갯수를 세는 방법 아래 데이터프레임의 '소속구' 열을 보시면, 도봉구, 노원구, 동대문구 등 서울시의 각 구 이름의 data로 이루어져 있습니다. 저는 '소속구' 열에서 각 data별로 갯수가 각각 몇개인지 알고 싶은데요. (도봉구 : 00개, 노원구 : 00개, 동대문구 : 00개 이런 식으로!) 즉, '소속구' 열은 범주형 데이터로 이루어져 있고, 저는 각 범주의 값이 몇개인지 알고싶은 것입니다! 코드는 다음과 같습니다. result_line_seoul.groupby('소속구').size() 여기까지 해당 열을 그룹별로 행의 갯수를 세는 방법이었습니다^^ 2020. 1. 6.
[파이썬] csv 데이터프레임에서 문자열 분리 & 특정 위치 문자열 추출하는 방법 위 데이터프레임에서 지번주소는 모두 "서울특별시 ㅇㅇ구 ㅇㅇ동 ~~~" 형태의 문장 구조를 가지고 있습니다. 저는 여기에서 구 data만 필요하므로 ㅇㅇ구 문자열만 따로 추출하도록 하겠습니다. 문장이 띄어쓰기로 구분되어 있으므로, " "를 이용하여 나누도록 하겠습니다. 코드는 다음과 같습니다. result_line_seoul['소속구'] = result_line_seoul['지번주소'].str.split(" ").str[1] '지번주소' 열의 문자열을 " "를 기준으로 split를 통해 나누고, 'ㅇㅇ구'가 위치해 있는 문자열을 '소속구' 열에 담는다는 뜻의 코드입니다. 결과는 다음과 같습니다. 2020. 1. 5.
[파이썬] csv 데이터프레임에서 특정 문자열을 포함하는 행만 추출하는 법(결측치 있을 때 포함) In [1]: import pandas as pd from IPython.core.display import display, HTML display(HTML("")) In [2]: result_line = pd.read_csv(r"C:\Users\lleon\practice\metro\result_line.csv", encoding='utf-8') result_line.head() #'지번주소' 열의 data 중에서 '서울특별시' 문자열을 포함하는 행만 sort하려 합니다. Out[2]: 철도운영기관명 선명 역명 지번주소 도로명주소 0 코레일 1호선 소요산 경기도 동두천시 상봉암동 126-3 경기도 동두천시 평화로 2925 1 코레일 1호선 동두천 경기도 동두천시 동두천동 245-210 경기도 동두천시 평.. 2020. 1. 5.
[파이썬] 여러개의 csv파일을 한번에 import하고, 합친 파일을 export 하는 법(예제파일 첨부) In [1]: import pandas as pd import glob import os from IPython.core.display import display, HTML display(HTML("")) In [2]: input_file = r'C:\Users\lleon\practice\metro' # csv파일들이 있는 위치 output_file = r'C:\Users\lleon\practice\metro\result_line.csv' # 병합하고 저장하려는 파일명 In [3]: allFile_list = glob.glob(os.path.join(input_file, 'line_*')) # glob함수로 line_으로 시작하는 파일들을 모은다 print(allFile_list) ['C:\\Users\.. 2020. 1. 5.
반응형