Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- tensorflow
- 월간결산
- 독후감
- SQL
- 블로그
- 텐서플로
- Visualization
- 서평
- Python
- Tistory
- 파이썬 시각화
- matplotlib
- MySQL
- 매틀랩
- 서평단
- python visualization
- 통계학
- 한빛미디어
- 파이썬
- Ga
- 한빛미디어서평단
- 리눅스
- Linux
- 티스토리
- Google Analytics
- Blog
- 시각화
- 딥러닝
- Pandas
- MATLAB
Archives
- Today
- Total
pbj0812의 코딩 일기
[kaggle] Intermediate Machine Learning 수료 과정 본문
0. 목차 및 내용
1) Introduction
- 이전 과정(Intro to Machine Learning) 에 대한 복습 및 앞으로의 과정 소개
2) Missing Values
- 결측값에 관한 처리 방안(sklearn.impute 의 SimpleImputer 소개)
(1) 칼럼 삭제
(2) 다른 숫자로 채우기
(3) 라벨링? 을 통한 표기
3) Categorical Variables
- 카테고리 항목에 대한 라벨링 방안 및 학습 과정 소개(sklearn.preprocessing 의 LabelEncoder, OneHotEncoder 소개)
(1) 칼럼 삭제
(2) 다른 숫자로 라벨링
(3) 원-핫 인코딩
4) Pipelines
- 데이터 전처리부터 모델구성까지 도와주는 pipeline 에 대한 소개
- pipeline 을 사용할 시 아래의 장점을 얻을 수 있음
(1) 코드가 깔끔해짐
(2) 에러가 작아지거나 전처리 과정을 잊지 않을 수 있음.
(3) 모델 구성이 쉬워짐
(4) 모델 검증의 다양성(cross-validation 등)
5) Cross-Validation
- cross-validation 에 대한 소개
6) XGBoost
- XGBoost 에 대한 소개(모델을 계속 추가하며 로스를 줄임)
7) Data Leakage
- 모델을 망가뜨리는 항목을 추려내는 방안에 대한 소개
1. 수료증
2. 참고
'인공지능 & 머신러닝 > kaggle' 카테고리의 다른 글
[kaggle] pandas 수료과정 (0) | 2021.04.18 |
---|---|
[kaggle] Advanced SQL 수료과정 (0) | 2021.04.16 |
[kaggle] Intro to SQL 수료과정 (0) | 2021.04.14 |
[kaggle] Intro to Machine Learning 수료 과정 (0) | 2021.04.04 |
[kaggle] titanic 문제 풀기 (0) | 2020.05.07 |
Comments