k-fold1 [혼공학습단] 혼공머신 4주차 - 교차 검증, k-fold 기본미션 주차 진도 기본 미션 4주차 Chatper 05 교차 검증을 그림으로 설명하기 검증세트 만약에 훈련세트만 가지고 모델링을 하면 훈련 세트에 대한 성능은 매우 좋아지지만, 테스트 세트에 대한 성능은 보장하기 어렵다. 이것을 과대적합(overfitting)이라고 하며, 앞선 챕터에서 반복적으로 알려 주고 있는 개념이다. 그럼 테스트세트를 훈련하는 건 어떨까? 그 역시도 마찬가지다. 현실 세계의 데이터세트에서 성능이 좋지 않을 수 있기 때문이다. 따라서 테스트세트는 말 그대로 테스트용도로만 쓰는 것이 좋다. 이런 문제를 해결하기 위해 훈련세트(train set) 안에서 다시 검증세트(validation set)를 만들어서 사용한다. 앞서 훈련세트에서 테스트세트를 분리하기 위한 scikit learn의.. 2023. 7. 24. 이전 1 다음