1. 데이터 준비 클래스 불균형 (class imbalance) 클래스가 불균형하게 분포되어 있는 것을 의미한다. 주로 특이한 경우(은행 거래 사기, 희귀 질병, 기계 불량음 등)가 포함된 데이터에서 볼 수 있으며, 이러한 문제들을 이상 탐지(anomaly detection)라고 부른다. 불균형 문제는 모델 학습에 매우 부정적인 영향을 기친다. 과소표집/과대표집 (Under/Over sampling) 과소표집은 다른 클래스에 비해 상대적으로 많이 나타나 있는 클래스의 개수를 줄이는 것. 이를 통해 균형은 유지할 수 있지만, 유용한 정보가 제거될 수 있다. 과대표집은 데이터를 복제하는 것. 무작위로 하거나, 기준을 정해서 복제한다. 정보를 잃지 않기 때문에 학습용 데이터에서 높은 성능을 보이지만 실험용 데..