728x90
안녕하세요 뚜디 입니다
이번 포스팅에서는 Logistic Regresion에 대해 알아보도록 하겠습니다.
Classification
Binary Classification (0:Positive / 1:negative)
※ Exam : Pass or Fail
※ Spam : Not Spam or Spam
※ Face : Real of Fake
※ Tumor : Not Malignant of Malignant
Logistic VS Linear
Logistic :
구분선을 통해 두 가지 케이스로 구분할 수 있는 데이터들이라고 할 수 있다.
예) 신발사이즈(270 / 285), 소규모기업(100명) 대기업(1000명)
Linear :
데이터들이 연속적이고 즉, 새로운 데이터가 있더라도 이어지는 데이터 예측할수 있는 데이터
예) 시간과 같은 연속적인 데이터, 몸무게70~90kg, 키160~190cm
Hypothesis Representation
※ Exam : Pass or Fail
y축은 합격 여부, x축은 공부한 시간 이라고 가정할때, Linear Regression에 적용했을 경우에는 위 그림과 같은 수치형의 데이터가 나오게 된다.
x를 넣었을 때 세타(w:weigth)곱해서 나온 값이 Linear가 되고, Linear한 값을 Logisic function을 통해 0과 1의 구간으로(0<=y<=1) 표현할 수 있고, 특정 Decision Boundary를 통해서 0과 1의 결과값으로 출력할 수 있다.
-> 이과정을 Hypothesis이라 할 수있다. / g(z) function은 Logistic function
Sigmoid (Logistic) function
g(z) function out value is between 0 and 1
Decision Boundary
sigmoid 함수를 좀 더 자세히 살펴보면 함수 자체가 구부러지는 값으로 표현되는 것을 확인할 수 있고, g(z) = 1/(1 + e^-z) 수식을 대입했을 때 값이 구부러지는 값으로 출력된다는것을 알 수 있다.
이 경우 1과 0에 딱 떨어지는 값을 필요로 하므로 즉, sigmoid를 통해서 0과 1의 값이 나온 것을 0.5를 기준(Decision Boundary)으로 두가지 값으로 구해낼수 있다.
728x90
'Machine Learning > Basic Machine Learning' 카테고리의 다른 글
[ML/DL]다변수 선형 회귀 분석 Multi-variable Linear Regression(2) (0) | 2022.01.20 |
---|---|
[ML/DL] 다변수 선형 회귀 분석 Multi-variable Linear Regression (0) | 2022.01.19 |
[ML/DL] 선형 회귀 분석 및 비용 최소화 방법(2) (0) | 2021.10.29 |
[ML/DL] 선형 회귀 분석 및 비용 최소화 방법 (0) | 2021.10.19 |
[ML/DL] 선형회귀(Linear Regression)를 TensorFlow로 구현하기 (0) | 2021.10.18 |