본문 바로가기
Machine Learning/Basic Machine Learning

[ML/DL] 로지스틱 회귀/분류 (Logistic Regresion/Classification)

by Sin_ 2022. 1. 21.
728x90

안녕하세요 뚜디 입니다

이번 포스팅에서는 Logistic Regresion에 대해 알아보도록 하겠습니다.

 

Classification
Binary Classification (0:Positive / 1:negative)
※ Exam : Pass or Fail
※ Spam : Not Spam or Spam
※ Face : Real of Fake
※ Tumor : Not Malignant of Malignant

 

Logistic VS Linear

Logistic :
 구분선을 통해 두 가지 케이스로 구분할 수 있는 데이터들이라고 할 수 있다.
 예) 신발사이즈(270 / 285), 소규모기업(100명) 대기업(1000명)
Linear :
 데이터들이 연속적이고 즉, 새로운 데이터가 있더라도 이어지는 데이터 예측할수 있는 데이터
 예) 시간과 같은 연속적인 데이터, 몸무게70~90kg, 키160~190cm

 

Hypothesis Representation

※ Exam : Pass or Fail
y축은 합격 여부, x축은 공부한 시간 이라고 가정할때, Linear Regression에 적용했을 경우에는 위 그림과 같은 수치형의 데이터가 나오게 된다.

x를 넣었을 때 세타(w:weigth)곱해서 나온 값이 Linear가 되고, Linear한 값을 Logisic function을 통해 0과 1의 구간으로(0<=y<=1) 표현할 수 있고, 특정 Decision Boundary를 통해서 0과 1의 결과값으로 출력할 수 있다.
 -> 이과정을 Hypothesis이라 할 수있다. / g(z) function은 Logistic function

 

Sigmoid (Logistic) function

g(z) function out value is between 0 and 1

 

Decision Boundary

sigmoid 함수를 좀 더 자세히 살펴보면 함수 자체가 구부러지는 값으로 표현되는 것을 확인할 수 있고, g(z) = 1/(1 + e^-z) 수식을 대입했을 때 값이 구부러지는 값으로 출력된다는것을 알 수 있다.
이 경우 1과 0에 딱 떨어지는 값을 필요로 하므로 즉, sigmoid를 통해서 0과 1의 값이 나온 것을 0.5를 기준(Decision Boundary)으로 두가지 값으로 구해낼수 있다.
728x90