'decision tree' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/01 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록decision tree (3)

pbj0812의 코딩 일기

[kaggle] Intro to Machine Learning 수료 과정

0. 목차 - Machine Learning 입문 과정으로 Pandas 로 데이터를 읽고 전처리 하는 과정부터 시작하여, Decision Tree, Random Forest 등을 통해 모델을 만들고 학습하는 과정, 그리고 평가하는 방법을 배울 수 있음. - kaggle 에서 제공하는 내부 jupyter notebook 으로 진행하기에 1) How Models Work 2) Basic Data Exploration 3) Your First Machine Learning Model 4) Model Validation 5) Underfitting and Overfitting 6) Random Forest 7) Machine Learning Competitions 1. 최종 코드 # Code you have p..

인공지능 & 머신러닝/kaggle 2021. 4. 4. 22:51

[통계학] CART 구현을 통한 TITANIC 변수 선택

0. 목표 - CART 알고리즘을 통해 우선적으로 분류되어야 할 변수를 선택 1. 이론 1) Gini Index를 통해 데이터의 대상 속성을 얼마나 잘못 분류할지를 계산 2) 각 속성별(male, female, 1, 2, 3...)로 계산하여 최소값을 계산 2. 데이터셋 준비 1) kaggle 타이타닉 데이터 셋 다운로드(링크에서 titanic 검색) 2) 데이터 전처리 import pandas as pd data = pd.read_csv('E:/수료증/인프런/밑바닥부터시작하는머신러닝/train.csv') data2 = data[['Pclass', 'Sex', 'Survived']] - Pclass : 승선권 클래스(1, 2, 3) - Sex : 성별(male, female) - Survived : 생존..

Science/통계학 2020. 3. 10. 02:41

[통계학] ID3 구현을 통한 변수 선택

0. 목표 - 타이타닉 데이터 셋에서 ID3 알고리즘을 통해 우선적으로 분류되어야 할 변수 선택 1. 수식 - Gain(A) = Info(D) - Info A(D) => A의 정보 소득 = 전체 데이터(D)의 정보량 - 속성 A로 분류시 정보량 => 우선적으로 분류되어야 할 변수는 최종 결과값(A의 정보 소득)이 가장 큰 값 2. 준비물 1) kaggle 타이타닉 데이터 셋 다운로드(링크에서 titanic 검색) 2) 데이터 전처리 import pandas as pd data = pd.read_csv('E:/수료증/인프런/밑바닥부터시작하는머신러닝/train.csv') data2 = data[['Pclass', 'Sex', 'Survived']] - Pclass : 승선권 클래스(1, 2, 3) - Sex..

Science/통계학 2020. 3. 9. 02:40

Prev 1 Next

목록decision tree (3)

pbj0812의 코딩 일기

티스토리툴바