지도 학습 알고리즘은 크게 분류와 회귀(regression)으로 나뉜다.
k-최근접 이웃 분류 알고리즘은 예측하려는 샘플에 가장 가까운 샘플 k를 선택해서 다수 클래스를 새로운 샘플 클래스로 예측한다.
그렇다면 k-최근접 이웃 회귀 알고리즘은? 가장 가까운 샘플 k를 선택해 값들의 합의 평균을 출력하는 알고리즘.
실습하며 이해하기위해 데이터를 준비해보죠.


준비한 데이터는 위와 같은 그림으로 표현됩니다.

훈련데이터 생성해준다.

이떄, (N,) -> (N,1)으로 일부러 2차원 배열로 바꿔준다. 2장에서는 특성을 2개 사용해서 2차원배열이였지만, 이번에는 1개의 특성만 사용하되, 모델 훈련에 있어 2차원배열을 인자로 받기 때문에 2차원으로 변환.


k-최근접 이웃 회귀 모델은 sklearn.neighbors / KNeighborsRegressor
지도 학습이므로 fit(input, target)
분류모델의 score는 결정계수.
test_input에 대한 predict를 만들고, 평균 얼마나 오차가 나는지 계산해보았다.


- 필기


'DATA & AI > HG ML&DL' 카테고리의 다른 글
| [HG ML&DL] 03. 회귀 알고리즘과 모델 규제 (3) - 특성 공학과 규제 (0) | 2023.05.01 |
|---|---|
| [HG ML&DL] 03. 회귀 알고리즘과 모델 규제 (2) - 선형 회귀 (0) | 2023.05.01 |
| [HG ML&DL] 02. 데이터 다루기 (2) - 데이터 전처리 (0) | 2023.04.28 |
| [HG ML&DL] 02. 데이터 다루기 (1) (0) | 2023.04.28 |
| [HG ML&DL] 01. 나의 첫 머신러닝 (0) | 2023.04.28 |