홀드아웃 데이터셋 - 학습, 검증, 테스트 데이터 셋을 분할하는 방법(단순 홀드아웃 데이터셋, K-겹 검증)
학습, 검증, 테스트 데이터 학습데이터 셋을 갖고 알고리즘을 학습시키고, 검증 데이터셋을 이용해 알고리즘의 *하이퍼파라미터를 튜닝한다. 알고리즘 학습이 완료되면 테스트 데이터셋을 이용해 알고리즘 성능을 측정한다. 하이퍼파라미터란 네트워크를 구성하는 레이어 수, 학습률 등...을 가리킴. 일반적으로 수동으로 변경됨 학습, 검증 및 테스트 분할 홀드아웃 데이터셋(holdout dataset) 학습 데이터셋으로만 알고리즘을 학습 검증 데이터셋으로 알고리즘의 하이퍼파라미터를 튜닝 기대 성능이 달성될때까지 1, 2번을 반복적으로 수행 알고리즘과 하이퍼파라미터를 고정하고, 테스트 데이터셋으로 성능을 평가 데이터를 두 부분으로 분할하고 학습할 경우 알고리즘에 정보유출이 발생할 수 있다. 또한 알고리즘 학습과 테스트에..