손실 함수 (Loss Function)

1. 손실 함수의 본질

머신러닝의 핵심 목표는 “예측을 잘하게 만드는 것”입니다.
그런데 “잘한다”를 수학적으로 어떻게 표현할 수 있을까요?

바로 손실 함수(Loss Function)가 그 기준점입니다.
손실 함수는 모델이 예측한 값과 실제 값의 차이를 숫자로 정량화한 오차 측정기입니다.

즉, 손실 함수는 모델 학습의 나침반(Compass) 역할을 합니다.

손실 함수를 최소화하려면, 언덕에서 가장 낮은 골짜기(최적점)를 찾아야 합니다. 이때 필요한 수학 도구가 미분(Differentiation)입니다.

모델은 이 기울기를 이용해서 손실이 줄어드는 방향으로 파라미터(가중치)를 업데이트합니다.
이것이 바로 경사하강법(Gradient Descent)입니다.

비유하면, 손실 함수는 “목표 맛과의 차이”, 평가 지표는 “손님 만족도 점수”에 가깝습니다.

단순히 MSE를 쓰면 곡선이 휘어져 학습이 잘 안 될 수 있으므로, 보통 교차 엔트로피 손실(Cross Entropy Loss)을 사용합니다.

[ -y \log(h_\theta(x)) - (1-y)\log(1-h_\theta(x)) ]

해석:

즉, 확률을 잘 맞출수록 손실이 작아지고 틀리면 큰 페널티를 받는 구조입니다.

손실 함수는 오차를 줄이는 것뿐 아니라, 모델이 과적합(Overfitting)하지 않도록 제어할 수 있습니다. 이때 사용하는 방법이 정규화(Regularization)입니다.

결론적으로, 손실 함수는 머신러닝 모델의 심장이라고 볼 수 있습니다.

손실 함수는 모델의 틀림 정도를 수학적으로 정의한 기준이며, 미분과 경사하강법으로 최소화됩니다. 선형 회귀는 MSE, 로지스틱 회귀는 크로스 엔트로피를 주로 사용하며, L1/L2 정규화로 일반화 성능을 높일 수 있습니다.

농담 한 스푼: 모델은 손실을 줄이려고 애쓰는데, 통장은 왜 손실만 늘어나는 걸까요?