pbj0812의 코딩 일기

[kaggle] Intermediate Machine Learning 수료 과정 본문

인공지능 & 머신러닝/kaggle

[kaggle] Intermediate Machine Learning 수료 과정

pbj0812 2021. 4. 13. 02:46

0. 목차 및 내용

 1) Introduction

  - 이전 과정(Intro to Machine Learning) 에 대한 복습 및 앞으로의 과정 소개

 2) Missing Values

  - 결측값에 관한 처리 방안(sklearn.impute 의 SimpleImputer 소개)

  (1) 칼럼 삭제

  (2) 다른 숫자로 채우기

  (3) 라벨링? 을 통한 표기

 3) Categorical Variables

  - 카테고리 항목에 대한 라벨링 방안 및 학습 과정 소개(sklearn.preprocessing 의 LabelEncoder, OneHotEncoder 소개)

  (1) 칼럼 삭제

  (2) 다른 숫자로 라벨링

  (3) 원-핫 인코딩

 4) Pipelines

  - 데이터 전처리부터 모델구성까지 도와주는 pipeline 에 대한 소개

  - pipeline 을 사용할 시 아래의 장점을 얻을 수 있음

  (1) 코드가 깔끔해짐

  (2) 에러가 작아지거나 전처리 과정을 잊지 않을 수 있음.

  (3) 모델 구성이 쉬워짐

  (4) 모델 검증의 다양성(cross-validation 등)

 5) Cross-Validation

  - cross-validation 에 대한 소개

cross-validation(링크)

 6) XGBoost

  - XGBoost 에 대한 소개(모델을 계속 추가하며 로스를 줄임)

Gradient Boosting(링크)

 7) Data Leakage

  - 모델을 망가뜨리는 항목을 추려내는 방안에 대한 소개

1. 수료증

2. 참고

 - Intermediate Machine Learning

Comments