Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- tensorflow
- Visualization
- Pandas
- matplotlib
- 시각화
- Tistory
- 티스토리
- 서평단
- Python
- 딥러닝
- 텐서플로
- MySQL
- 파이썬 시각화
- 매틀랩
- Blog
- SQL
- 파이썬
- 독후감
- 통계학
- 월간결산
- Linux
- 블로그
- 서평
- 리눅스
- Google Analytics
- MATLAB
- Ga
- 한빛미디어서평단
- 한빛미디어
- python visualization
Archives
- Today
- Total
pbj0812의 코딩 일기
[kaggle] Intermediate Machine Learning 수료 과정 본문
0. 목차 및 내용
1) Introduction
- 이전 과정(Intro to Machine Learning) 에 대한 복습 및 앞으로의 과정 소개
2) Missing Values
- 결측값에 관한 처리 방안(sklearn.impute 의 SimpleImputer 소개)
(1) 칼럼 삭제
(2) 다른 숫자로 채우기
(3) 라벨링? 을 통한 표기
3) Categorical Variables
- 카테고리 항목에 대한 라벨링 방안 및 학습 과정 소개(sklearn.preprocessing 의 LabelEncoder, OneHotEncoder 소개)
(1) 칼럼 삭제
(2) 다른 숫자로 라벨링
(3) 원-핫 인코딩
4) Pipelines
- 데이터 전처리부터 모델구성까지 도와주는 pipeline 에 대한 소개
- pipeline 을 사용할 시 아래의 장점을 얻을 수 있음
(1) 코드가 깔끔해짐
(2) 에러가 작아지거나 전처리 과정을 잊지 않을 수 있음.
(3) 모델 구성이 쉬워짐
(4) 모델 검증의 다양성(cross-validation 등)
5) Cross-Validation
- cross-validation 에 대한 소개
6) XGBoost
- XGBoost 에 대한 소개(모델을 계속 추가하며 로스를 줄임)
7) Data Leakage
- 모델을 망가뜨리는 항목을 추려내는 방안에 대한 소개
1. 수료증
2. 참고
'인공지능 & 머신러닝 > kaggle' 카테고리의 다른 글
[kaggle] pandas 수료과정 (0) | 2021.04.18 |
---|---|
[kaggle] Advanced SQL 수료과정 (0) | 2021.04.16 |
[kaggle] Intro to SQL 수료과정 (0) | 2021.04.14 |
[kaggle] Intro to Machine Learning 수료 과정 (0) | 2021.04.04 |
[kaggle] titanic 문제 풀기 (0) | 2020.05.07 |
Comments