본문 바로가기

Programming/Deep Learning

KNN(K - Nearest Neighbors Alogorithm) - K-최근접 알고리즘 1. KNN(K - Nearest Neighbors) KNN, K - 최근접 이웃 알고리즘 : 특정공간내에서 입력과 제일 근접한 K개의 요소를 찾아, 더 많이 일치하는 것으로 분류하는 알고리즘이다. 위의 좌표공간에서 파란색 점으로 되어 있는 그룹을 A그룹이라고 생각하고, 주황색 점으로 되어 있는 그룹을 B라고 하자.이때 우리는 별 모양으로 표시된 입력값이 A그룹에 속하는지, B그룹에 속하는지를 알고싶다. 이럴때 사용되는 KNN 알고리즘은 다음과 같이 적용된다.우선 K의 값을 정한다. 해당 K 값에 대한 설명은 밑에서 하기로 하고, 우선 K를 3이라는 값으로 정했다고 생각해보자. 입력값과 가장 근접한 K개의 요소를 찾아보자. K = 3 이므로 3개의 요소를 찾아보면 다음 그림과 같다. 별 모양의 점을 기준.. 더보기
K-Fold Cross Validaion(교차 검증) 정의 및 설명 K Folds Cross Validaion Method 1. Sample Data를 K개로 나눈다.2. 1개를 Test를 위해 사용하고, K-1개를 Train한다.3. Test Set을 순환하여 Train하는 과정을 K번 반복한다.4. 반복하여 얻은 결과에 근거하여 *예상되는 수치 를 결정한다. * 평균 제곱근 오차(Mean Square Error) 오분류 에려율(Misclassification error rate) 신뢰구간(Confidence interval) 정의 - K개의 fold를 만들어서 진행하는 교차검증 사용이유- 총 데이터 갯수가 적은 데이터 셋에 대하여 정확도를 향상시킬수 있음 - 이는 기존에 Training / Validation / Test 세 개의 집단으로 분류하는 것보다, Train.. 더보기