일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 딥러닝
- 한빛미디어서평단
- Blog
- 독후감
- Google Analytics
- 파이썬 시각화
- 통계학
- python visualization
- Ga
- Pandas
- Linux
- 서평단
- 리눅스
- 매틀랩
- 시각화
- MATLAB
- 파이썬
- tensorflow
- 서평
- Python
- 월간결산
- Visualization
- MySQL
- 텐서플로
- 한빛미디어
- 티스토리
- 블로그
- SQL
- Tistory
- matplotlib
- Today
- Total
목록데이터 과학 (5)
pbj0812의 코딩 일기
0. 목표 - 이탈 회원 확인 1. 실습 1) 테이블 생성 CREATE TABLE sql_test.login_table ( id int, when_login datetime ); 2) 데이터 삽입 INSERT INTO sql_test.login_table(id, when_login) VALUES(1, '2022-01-01 00:00:00'); INSERT INTO sql_test.login_table(id, when_login) VALUES(1, '2022-01-02 00:00:00'); INSERT INTO sql_test.login_table(id, when_login) VALUES(2, '2022-01-03 00:00:00'); INSERT INTO sql_test.login_table(id, wh..
0. 목표 - Python 의 Pandas 를 이용하여 SQL 스럽게 데이터 전처리 하기 1. 실습 1) SELECT (1) 필드 하나 df = pd.DataFrame({'a' : [1, 2, 3, 4, 1], 'b' : [2, 3, 4, 5, 6], 'c' : [2, 4, 6, 8, 6]}) df['a'] (2) 필드 여러개 df[['a', 'b']] (3) 행 인덱스로 접근 df.loc[0] 2) WHERE - a 가 3 이상 df[df['a'] >= 3] - a 가 3 이상이고 b 가 5 미만 a = ((df['a'] >= 3) & (df['b'] < 5)) df.loc[a] 3) CASE def case(x): if x < 2: return '2 미만' elif x < 4: return '4 미만..
0. 목표 - PYTHON을 이용한 AUC 계산 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt 2) 데이터 생성 index = [i for i in range(1, 21)] label = ['p', 'p', 'n', 'p', 'p', 'p', 'n', 'n', 'p', 'n', 'p', 'n', 'p', 'n', 'n', 'n', 'p', 'n', 'p', 'n'] probability = [0.9, 0.8, 0.7, 0.6, 0.55, 0.54, 0.53, 0.52, 0.51, 0.505, 0.4, 0.39, 0.38, 0.37, 0.36, 0.35, 0.34, 0.33, 0.3, 0.1] 3) 데이터 프레임화 data ..
0. 목표 - PYTHON을 이용한 RMSE, MAPE 구현 및 데이터에 따른 결과 비교 1. 실습 1) library 호출 import matplotlib.pyplot as plt 2) 제곱근 함수 def sqrt(inp): result = inp/2 for i in range(30): result = (result + (inp / result)) / 2 return result 3) RMSE # inp1 : real # inp2 : esti def rmse(inp1, inp2): result = 0 for i in range(len(inp1)): result += (inp1[i] - inp2[i]) ** 2 result = sqrt(result / len(inp1)) return result 4) M..
0. 목표 - python을 통한 범주형 피처 처리(클래스, 이진법, 원핫인코딩) 1. 실습 1) library 호출 import pandas as pd import copy 2) 데이터 생성 data = ['A', 'B', 'AB', 'O'] 3) 클래스 ID 모듈 def class_id(inp): result = [] for i in range(len(inp)): result.append(i + 1) return result - 확인 print(class_id(data)) # 결과 [1, 2, 3, 4] 4) 이진법 표현 (1) 최대 몫 구하기 - 인풋을 넣으면 결과값으로 해당 인풋을 2로 나눌 수 있는 최대의 몫 도출 def from_ten_int2(inp): i = 0 while 2 ** i 0:..