Machine Learning 3

[Machine Learning] KonlPY 라이브러리 설치하는 방법

이번 포스팅에서는 KonlyPY 을 설치하는 방법에 대해 알아보려고 한다. KonlyPY는 한국어를 자연어처리, 형태소 분석 할 수 있도록 지원해주는 라이브러리를 말한다. 공식 홈페이지에는 설치 방법을 간단하게 세단계의 절차로 적어놨지만 각 단계에서 해야하는 작업들이 있기에 자세하게 남겨본다. 필요한 선행작업 1 : Python 버전 확인 주피터에서 '!python --version' 을 입력해서 버전을 확인한다. (다운 받을 JPype 파일이 파이썬의 버전에 따라서 달라진다.) 필요한 선행작업 2 : 환경 변수 설정 1) [내 PC] - 우클릭 - [속성] 2) [속성]창의 왼쪽에 [고급 시스템 설정] 클릭 3) [고급 시스템 설정] - [고급] - [환경변수] 4) [환경 변수] - 시스템 변수 목록..

Machine Learning 2021.04.22

[Machine Learning] Support Vector Machine (SVM)

Support Vector Machine (SVM) 가장 떨어진 선을 예측 값으로 사용하겠다. 두 데이터 집단, 사이의 거리가 동일할 때 선과의 거리를 margine이라고 한다. 이 margine의 길이가 가장 긴 선형함수를 찾아내는 과정이다. 선형 함수와 가장 가까이 있는 데이터를 'support vector' 라고 한다. 회귀 선형 모델 : alpha 선형 분류 모델 강도 : C C값이 클수록 규제가 약해진다. 기본적으로 L2규제를 사용, 하지만 중요한 특성이 몇 개 없다면 L1규제를 사용해도 무방. (주요 특성을 알고 싶을 때 L1규제를 사용하기도 함) / 선형 모델의 장점 선형 모델은 학습이 빠르고 예측도 빠르다. 매우 큰 데이터 세트와 희소한 데이터 세트, 모두 잘 동작한다. 특성이 많을 수록 ..

Machine Learning 2021.04.22

[MachineLearning] 지도 학습 - 회귀

머신러닝은 크게 세종류로 나눠진다. 지도 학습, 비지도 학습, 강화 학습 세 종류가 있으며 지도 학습은 분류와 회귀로 나눠진다. 이번 포스팅에서는 지도 학습의 회귀에 대해 알아보자. 회귀 연속적인 숫자를 예측하는 것을 말한다. 분류보다 회귀를 많이 사용하며, 오랜 기간 현대 통계학에서 발생되어 다양하게 이용되는 학문 분야이다. 선형 모델 (Linear Model) 데이터가 있을 때 가장 잘 설명할 수 있는 선을 찾는 방법 입력 특성에 대한 선형 함수(예측값)을 만들어 예측을 진행한다. 다양한 선형 모델이 존재한다. 분류와 회귀에 모두 사용 가능하다. 선 하나하나가 예측 값이 된다. 선형 함수 = 예측 값 회귀 계수 (W,b) w : 가중치(weight), 계수(coefficient) b : 편향(bias..

Machine Learning 2021.04.21