[HG ML&DL] 03. 회귀 알고리즘과 모델 규제 (1)

지도 학습 알고리즘은 크게 분류와 회귀(regression)으로 나뉜다.

k-최근접 이웃 분류 알고리즘은 예측하려는 샘플에 가장 가까운 샘플 k를 선택해서 다수 클래스를 새로운 샘플 클래스로 예측한다.

그렇다면 k-최근접 이웃 회귀 알고리즘은? 가장 가까운 샘플 k를 선택해 값들의 합의 평균을 출력하는 알고리즘.

실습하며 이해하기위해 데이터를 준비해보죠.

준비한 데이터는 위와 같은 그림으로 표현됩니다.

훈련데이터 생성해준다.

이떄, (N,) -> (N,1)으로 일부러 2차원 배열로 바꿔준다. 2장에서는 특성을 2개 사용해서 2차원배열이였지만, 이번에는 1개의 특성만 사용하되, 모델 훈련에 있어 2차원배열을 인자로 받기 때문에 2차원으로 변환.

k-최근접 이웃 회귀 모델은 sklearn.neighbors / KNeighborsRegressor

지도 학습이므로 fit(input, target)

분류모델의 score는 결정계수.

test_input에 대한 predict를 만들고, 평균 얼마나 오차가 나는지 계산해보았다.

- 필기

(주)창민연구소