딥러닝에 관심을 가지게 되면서 머신러닝/딥러닝에 관련된 좋은 강좌를 알게 되어 해당 강좌를 보면서 개인적으로 필기 및 정리를 하기 위해서 쓴 글입니다.

https://www.youtube.com/user/hunkims

(모두를 위한 딥러닝 강좌)

 

머신러닝(Machine Learning) 이란?

어떤 소프트웨어에서 input과 output이 존재한다면 모든 output을 인간이 정해줄 수 없는 상황에 학습 데이터를 이용한 컴퓨터의 학습을 통해 output을 정해줄 수 있도록 고안된 기술

예를 들어, 스팸 메일을 분류하는 소프트웨어가 있고 모든 메일을 input이라고 생각하고 스팸 메일을 output이라고 생각한다면 스팸 메일이라는 output이 너무 광범위한 룰을 적용해야 하기 때문에 인간이 모든 input에 대하여 output을 정해줄 수가 없고 이런 상황에 대해 컴퓨터가 학습 데이터를 이용한 반복적인 학습을 통해(머신러닝을 통해) 스팸메일을 분류하는 소프트웨어(모델)를 만들 수 있다.

 

머신 러닝의 종류?

이런 머신러닝의 학습에는 크게 두 가지 종류가 있는데 지도 학습(Supervised Learning)과 비지도 학습(Unsupervised Learning)이다.

 

1. 지도학습(Supervised Learning)

지도 학습이란, label이 정해진 학습 데이터를 이용한 학습을 하는 것인데 쉽게 말해 정답이 정해져 있는 학습 데이터를 사용하는 것이다. 

예를 들어, 어떤 이미지를 통해 이것이 개인지 고양이인지 등을 판단하는 Image labeling이 있다면 이때의 label은 개, 고양이 등이 될 것이며 또한, 앞서 말했던 스팸 메일 필터의 경우 스팸 메일이 label이 될 것이다.

이전에 오세돌 9단과 대국을 했던 AlphaGo의 경우도 이런 지도 학습을 이용하였다. 이 경우 기존에 사람들이 했던 대국의 정보를 학습 데이터로 사용하여 다음 수를 둘 곳을 label로 정하였다고 생각할 수 있을 것이다.

 

2. 비지도학습(Unsupervised Learning)

비지도 학습은 지도 학습과 반대로 label을 정해주기 어려운 것들을 대상으로 label을 정해주는 것이 아닌 데이터 자체를 보고 학습하는 것이다.

예를 들어, 비슷한 뉴스끼리 그룹을 형성시키는 Google news grouping은 미리 label을 정해주는 것이 어렵기 때문에 이런 경우에 비지도 학습을 사용했다고 할 수 있다.

 

지도 학습의 종류

지도학습도 결과에 따라 크게 regression(회귀) 방식과 classification(분류) 방식으로 나뉠 수 있다.

예를 들어, 공부한 시간에 따라 성적이나 합격 여부를 판단하는 프로그램이 있다고 가정한다면

regression 방식은 0에서 100까지의 성적을 예견하는 것과 같이 특정 정수가 아닌 범위가 결과 값으로 주어지는 형식이며,

classification 방식 중 binary classification 방식은 PASS, FAIL 두 가지의 결과 값이 주어지는 형태이며

multi-label classification은 A,B,C,D,F 와 같이 세 가지 이상의 결과 값이 주어지는 형식이다.

'Machine Learning & Deep Learning' 카테고리의 다른 글

6. Loading Data from File  (0) 2020.04.18
5. Multi-variable linear regression  (0) 2020.04.17
4. Hypothesis and Cost  (0) 2020.04.16
3. Linear Regression  (0) 2020.04.15
2. Tensorflow 사용 환경 구축  (0) 2020.04.15

+ Recent posts