본문 바로가기
Machine Learning/Basic Machine Learning

기본적인(Basic) Machine Learning의 용어와 개념 설명

by Sin_ 2021. 10. 17.
728x90

안녕하세요 뚜디 입니다:)

Machine Learning 에 대하여 간단하게 공부하고있어

제가 공부하는 내용을 공유하는 포스팅 입니다.


Machine Learning의 용어와 개념 설명


 

1. 머신 러닝이란?
* 명시적인 프로그래밍의 제한(Limitation of eplicit programming)
  - Spam Filter : many rules
  - Automatic driving : too many rules

* Machine learning : "Field of study that gives computers the ability to learn without being explicitly programmed" Arthusr Samuel (1959)

 

2. 학습하는 방법
* Supervised learning
  - 정해져있는 데이터 : training set
    -> 임의의 이미지를 입력하면 고양이, 강아지를 구분한다.
      -> 사람들이 고양이, 강아지 그림(사진)을 모은 데이터를 주어주고 학습한다.

* Unsupervised learning : un-labeled data
  - Google New : 비슷한 뉴스끼리 모아서 구분
  - Word clustering : 비슷한 단어끼리 모아서 구분
    -> 스스로 알아서 판단하고 학습한다.

 

3. Supervised learning
* 머신러닝에서 가장 일반적인 유형
  - Image labeling : 주어진 이미지를 통한 학습
  - Email spam filter : 주어진 labeled(spam) mail을 통한 학습
  - Predicting exam score : 이전 시험에서 소요된 시간에따른 점수를 통한 학습

 

4. Type of supervised learning 
* Predicting final exam score based on time spent
  - regression 모델
    -> 시험 점수가 0점~100점까지, 시간대비 공부를 할 경우 몇점이 나올지 점수를 예측 모델
* Pass/non-pass based on time spent
  - binary classification 모델
    -> Pass/non-pass의 두가지 경우, 합격/불합격을 판단하는 예측 모델
    -> 두가지 경우 binary가 붙으며 경우의 수가 좀더 있다면 classification 모델이라고 부른다.
* Letter grade (A, B, C, E and F) based on time spent
  - multi-label classification 모델
    -> 정해진 등급을 나누는 경우

 

5. Predicting final exam score based on time spent

 

x (hours) y (score)
10 90
8 80
5 65
2 30
x는 시간 y는 점수를 가르키는 표를 주며 시간대비 공부했을때 점수를 예측하는 머신러닝의 기법으로 regression 모델을 사용할수 있다. x = 7 (7시간)을 입력 할 때, y = ? (점수) 몇점이 나올것인지 예측을 해볼수 있다.

 

6. Pass/non-pass based on time spent

 

x (hours) y (pass/fail)
10 P
9 P
3 F
2 F
binary classification 모델의 경우도 마찬가지로 x(시간)을 입력 할 때, y(결과)를 예측 해볼수 있다.

 

7. Letter grade (A, B, C, E and F) based on time spent

 

x (hours) y (grade)
10 A
9 B
3 D
2 F
multi-label classification 모델의 경우도 마찬가지로 x(시간)을 입력 할 때, y(결과)를 예측 해볼수 있다.

 

 

728x90