회귀 알고리즘 평가
어떤 모델이 좋은 모델인지, 목표를 얼마나 잘 달성했는지 정도를 평가하는 지표
평가 지표 선정 방법
절대적인 평가 지표는 존재하지 않음
다양한 평가 지표를 적용해보고, 결과값을 비교하며 모델의 성능을 다양한 측면에서 확인해봐야 함
목표 달성 평가 방법
실제 값과 모델이 예측하는 값의 차이에 기반한 평가 방법 사용
- RSS, MSE, MAE, MAPE, R^2
- RSS(Residual Sum of Squares) - 단순 오차 : 실제값과 예측값의 단순 오차 제곱 합, 값이 작을수록 모델의 성능이 높음.
- 가장 간단한 평가 방법으로 직관적인 해석이 가능함
- 전체 데이터에 대한 실제 값과 예측하는 값의 오차 제곱의 총합
- 오차를 그대로 이용하기 때문에 입력값의 크기에 의존적임
- MSE(Mean Squared Error) - 평균 제곱 오차 : RSS에서 데이터 수만큼 나눈 값, 작을 수록 모델의 성능이 높다고 평가할 수 있음.
- MAE(Mean Absolute Error) - 평균 절대값 오차 : 실제값과 예측값의 오차의 절대값의 평균, 작을 수록 모델의 성능이 높다고 평가할 수 있음.
- MSE : 이상치(outlier) 즉, 데이터들 중 크게 떨어진 값에 민감함
- MAE : 변동성이 큰 지표와 낮은 지표를 같이 예측할 시 유용
- 가장 간단한 평가 방법들로 직관적인 해석이 가능함
- 그러나 평균을 그대로 이용하기 때문에 입력값의 크기에 의존적임
- R^2 - 결정계수 : 회귀 모델의 설명력을 표현하는 지표, 1에 가까울 수록 높은 성능의 모델이라고 해석할 수 있음.
- 백분율로 표현하기 때문에 크기에 의존적이지 않음
- 실제값이 1보다 작을 경우, 무한대에 가까운 값 도출, 실제값이 0일 경우엔 계산 불가
출처: 앨리스 교육
반응형