1. Train / Dev / Test sets

2023. 9. 10. 15:29Google ML Bootcamp/2. Improving Deep Neural Networks

Train / Valid / Test sets.

 

dev : cross-validation set

 

how about ratio?

- train / test = 7:3 or train / valid / test = 6:2:2

- but 빅데이터 시대에서는 총 데이터가 1,000,000개 이상일 때 Valid , Test set은 10,000개만 있어도 충분하다.

- 거의 98:1:1

 

**중요 : Mistmatched train/test distribution**

- train과 test set의 분포 양상이 다르다면, 학습한게 의미가 없는 결과를 나을 수도 있다.

 

Not having a test set might be okay. (Only dev set)

 

'Google ML Bootcamp > 2. Improving Deep Neural Networks' 카테고리의 다른 글

6. Dropout Regularization  (0) 2023.09.10
5. Why Regularization Reduces Overfitting  (0) 2023.09.10
4. Regularization  (0) 2023.09.10
3. Basic recipe for machine learning  (0) 2023.09.10
2. Bias / Variance  (0) 2023.09.10