일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Python
- Blog
- 통계학
- MySQL
- Tistory
- 파이썬
- Linux
- Ga
- 한빛미디어
- python visualization
- SQL
- 한빛미디어서평단
- 텐서플로
- Visualization
- 시각화
- tensorflow
- 서평
- 딥러닝
- 매틀랩
- 서평단
- 월간결산
- 파이썬 시각화
- MATLAB
- Pandas
- 티스토리
- 독후감
- Google Analytics
- 블로그
- 리눅스
- matplotlib
- Today
- Total
목록데이터 분석 (7)
pbj0812의 코딩 일기
0. 목표 - 이탈 회원 확인 1. 실습 1) 테이블 생성 CREATE TABLE sql_test.login_table ( id int, when_login datetime ); 2) 데이터 삽입 INSERT INTO sql_test.login_table(id, when_login) VALUES(1, '2022-01-01 00:00:00'); INSERT INTO sql_test.login_table(id, when_login) VALUES(1, '2022-01-02 00:00:00'); INSERT INTO sql_test.login_table(id, when_login) VALUES(2, '2022-01-03 00:00:00'); INSERT INTO sql_test.login_table(id, wh..
0. 목표 - rolling retention 계산 1. 실습 1) 데이터 만들기 - 링크 2) 쿼리 작성 (1) 각 id 별 첫 번째 접속일과 마지막 접속일 연산 WITH summary AS ( SELECT id, MIN(dated) AS first_login, MAX(dated) AS last_login FROM sql_test.classic_retention GROUP BY 1 ORDER BY 1 ), (2) 달력 생성 Calendar AS ( SELECT CONCAT(y, '0101') + INTERVAL tt*1000 + a*100 + b*10 + c DAY AS dt FROM (SELECT 0 AS tt UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SE..
0. 목표 - 전월 대비 실적 파악하기 1. 실습 1) 테이블 생성 CREATE TABLE sql_test.full_test ( id int, amount int, dated datetime ); 2) 데이터 삽입 INSERT INTO sql_test.full_test(id, amount, dated) VALUES(1, 100, '2021-11-12 12:12:12'); INSERT INTO sql_test.full_test(id, amount, dated) VALUES(1, 1000, '2021-11-12 12:12:12'); INSERT INTO sql_test.full_test(id, amount, dated) VALUES(3, 1000, '2021-11-12 12:12:12'); INSERT IN..
0. 책 정보 - 도서명 : Do it! 구글 애널리틱스 입문 - 지은이 : (Google이 인정한 GA 전문가) 김선영, 한수창 - 출판사 : 이지스 퍼블리싱 - 구매정보 : 링크 2. 후기 - 내겐 너무나 난해하였던 Google Analytics... Google Analytics(이하 GA)는 IT 에 입문하기로 마음먹은 2017 년부터 한 회사의 데이터 분석가로 일하고 있는 지금까지 사용해오고 있는 툴이다. GA 를 공부하기 위해 온라인 동영상 강의도 들어보고, 시중의 책도 구매하였었다. GA 를 알기 위하여 뭔가 많이 보고 따라하였지만, 내가 GA 에서 제공하는 여러 보고서와 데이터를 제대로 알고 있는지에 대해서는 항상 의구심이 들었다. 수십개의 보고서들이 어떤 기준으로 나누어졌는지, 이 데이터..
0. 목표 - dataprep 을 통한 EDA 1. 설치 pip install dataprep 2. 실습 1) library 호출 from dataprep.eda import * import pandas as pd 2) 데이터 읽기 - titanic 데이터 사용 train_df = pd.read_csv('/Users/pbj0812/Desktop/titanic/train.csv') 3) 전체 데이터에 대한 plot plot(train_df) - 위의 Show Stats Info 클릭시 요약 테이블 정보 호출 4) 데이터 카테고리화 및 재 시각화 - Survived와 Pclass는 숫자가 아닌 카테고리이기 때문에 object로 변환 for col in ['Survived', 'Pclass']: train_d..
0. 목표 - pandas_profiling을 통한 jupyter notebook 에서의 EDA 1. 설치 pip install pandas-profiling 2. 실습 1) library 호출 import numpy as np import pandas as pd from pandas_profiling import ProfileReport 2) 데이터 호출 - 타이타닉 데이터 사용 df = pd.read_csv("/Users/pbj0812/Desktop/titanic/train.csv") 3) 보고서 생성 profile = ProfileReport(df, title='Pandas Profiling Report', explorative=True) 4) 보여주기 profile.to_widgets() - 결과..
0. 목적 - 양승화님의 발표자료를 알고 있었기에 자세한 내용에 대한 호기심 - 내가 생각하고 있는 것이 맞는지(정답은 없겠지만...) 혹은 부족한 점이 없는지 확인 1. 강의내용 - 그로스 팀의 목적, 구성 방법, 해야할 일 등 - AARRR 에서 확인해야 할 점 - 지표를 쪼개 보는 방법 - 서비스 지표 분석에 있어서 잘못 판단하는 사례들 2. 난이도 - 쉬움(GA나 기본 데이터 분석 방법을 알고 있다는 가정하에...) - 쉽지만 인사이트가 있음 3. 후기 대학교, 대학원, 3 개의 회사를 다니면서 데이터를 가진 직업은 거의 다 해본거 같다. 수치 모델러(+ 관측 데이터 분석)에서 딥러닝 엔지니어에서 서비스 회사의 데이터 분석가로... 이직때마다 항상 처음부터 다시 시작하기에 이번엔 서비스 회사에서의..