scikit-learn11 [scikit-learn] 데이터 분할과 스케일링 목차1. 서론2. 주요 함수 소개2-1. 데이터 분할: train_test_split()2-2. 표준화: StandardScaler()2-3. 정규화: MinMaxScaler()2-4. 이상치에 강한 정규화: RobustScaler()2-5. 벡터 정규화: Normalizer()3. 결론1. 서론scikit-learn은 파이썬 기반의 대표적인 머신러닝 라이브러리로, 간결하면서도 강력한 기능들을 제공합니다. 데이터 전처리부터 모델링, 평가, 하이퍼파라미터 튜닝까지 전 과정을 지원하며, 초보자와 전문가 모두에게 사랑받고 있습니다.이번 시리즈에서는 머신러닝의 핵심 프로세스인 데이터 전처리를 중심으로, 실무에서 자주 사용되는 scikit-learn 함수들을 직접 코드와 함께 소개하고자 합니다. 그 첫 번째 주제.. 2025. 4. 16. 이전 1 2 다음