지도학습
-
[지도학습] KNNStudy/Statistics 2019. 5. 23. 09:52
지도학습 중 가장 간단하다고 볼 수 있는 거리를 이용하여 예측하는 모델 테스트 데이터와 가장 가까운 k개의 특징을 보고 테스트 데이터 예측 k-최근접 이웃(K-Nearest Neighbors, KNN) 거리가 가장 가까운 데이터포인트를 찾고, 가장 많은 클래스가 예측 결과가 됨 훈련방법 : 훈련데이터 저장 예측방법 : 궁금한 데이터에서 가장 가까운 훈련 데이터를 찾아 선택 이웃을 몇개 찾을 지 몰라서 k! 이웃개수는 내가 정하면 됨~ 이웃수는 홀수로 정하기 예측 결과는 가장 많은 이웃의 상태가 됨! knn 과정 1. 데이터셋 나누기(train/test) 2. 이웃 수(= k) 정하기 3. 훈련 : 훈련데이터 저장 4. 예측 : 테스트 데이터에서 가장 가까운 k개 데이터 포인트가 속한 클래스 중 과반수에 ..