일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 텐서플로
- tensorflow
- matplotlib
- Visualization
- 통계학
- 매틀랩
- Linux
- 독후감
- MySQL
- 파이썬 시각화
- 블로그
- 파이썬
- python visualization
- 서평단
- Python
- 한빛미디어
- 티스토리
- MATLAB
- 딥러닝
- Ga
- 한빛미디어서평단
- 시각화
- 서평
- 월간결산
- Google Analytics
- Blog
- SQL
- Tistory
- 리눅스
- Pandas
- Today
- Total
목록데이터분석 (9)
pbj0812의 코딩 일기
"한빛미디어 활동을 위해서 책을 제공받아 작성된 서평입니다." 1. 도서 정보 - 도서명 : 혼자 공부하는 데이터 분석 with 파이썬 - 저자 : 박해선 - 링크 2. 후기 - 제목처럼 파이썬을 통한 데이터 분석 입문용으로는 추천할 수 있다. 기본 환경 세팅인 코랩 설치를 시작으로 csv, api 를 통한 데이터 수집 및 크롤링을 통한 데이터 수집 방법도 기술되어 있다. 데이터 분석 방법으로는 기본적인 판다스 라이브러리 사용 및 기초 통계(중앙값, 표준편차), 간단한 시각화 방법도 기술되어 있다. 그렇기에 데이터 분석에 대한 절차를 알아보기에는 좋은 책이라고 할 수 있으나... 넓은 분야를 다루다보니 깊이가 깊을수는 없기에 이미 데이터 분석을 할 수 있으신 분들께는 추천드리지 않으며 또한, 파이썬도 모..
0. 참석 - 쏘카에서 진행하는 Data Meetup 에 뽑혀서 참석 - 쏘카 건물에서 진행 1. 발표 내용 요약 1) 현재 쏘카 데이터 본부는 50명, 9개 팀으로 이루어져 있음 - 데분, 데엔, 데싸, iot 등으로 이루어져 있는데 그럼에도 불구하고 굉장히 인원이 많다고 느낌. - 커머스 플랫폼과는 달리 플랫폼보다 쏘카라는 서비스에 대한 문제 및 최적화를 풀기 위하여 이렇게 조직이 큰 거 같음. (자사에서 보유한 차량을 최적화 하고, 문제가 되는 부분(기름 도둑 잡기 등) 을 해결) - 프로덕트(앱)에 대한 발표는 하나도 없었음 2) 비즈니스 데이터 팀 - 수기로 할 수 있는 것들 이상으로 비즈니스 성장 극대화 목표 - 쏘카는 보유한 2만대의 차량으로 운영을 해야 하는데, 7, 8월의 성수기와 겨울의..
0. 목표 - 윈도우 함수를 이용한 이동 평균 구하기 1. 실습 1) 테이블 / 데이터 생성 DROP TABLE sql_test.window_practice; CREATE TABLE sql_test.window_practice ( id varchar(256), category varchar(256), price int ); INSERT INTO sql_test. window_practice(id, category, price) VALUES('A', 'a', 100); INSERT INTO sql_test. window_practice(id, category, price) VALUES('A', 'b', 100); INSERT INTO sql_test. window_practice(id, category, ..
0. 목표 - classic retention 계산 1. 실습 1) 테이블 생성 CREATE TABLE sql_test.classic_retention ( id int, is_visited int, dated datetime ); 2) 데이터 삽입 INSERT INTO sql_test.classic_retention(id, is_visited, dated) VALUES(1, 1, '2022-01-01 00:00:00'); INSERT INTO sql_test.classic_retention(id, is_visited, dated) VALUES(2, 1, '2022-01-01 00:00:00'); INSERT INTO sql_test.classic_retention(id, is_visited, dated)..
0. 목표 - 서브쿼리로 휴일을 제외한 근무일수 계산하기 1. 실습하기 1) 테이블 생성 (1) procedure_test CREATE TABLE sql_test.procedure_test ( id int, date1 datetime, date2 datetime ); (2) holiday CREATE TABLE sql_test.holiday ( holiday datetime ); 2) 데이터 삽입 INSERT INTO sql_test.procedure_test(id, date1, date2) VALUES(1, '2021-01-01 11:11:11', '2021-01-20 11:11:11'); INSERT INTO sql_test.procedure_test(id, date1, date2) VALUES(2,..
0. 목차 및 내용 1) Hello, Seaborn - notebook 설명, csv 읽기, lineplot plt.figure(figsize=(16,6)) sns.lineplot(data=fifa_data) 2) Line Charts - title, xlabel, label plt.figure(figsize=(14,6)) plt.title("Daily Global Streams of Popular Songs in 2017-2018") sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You") sns.lineplot(data=spotify_data['Despacito'], label="Despacito") plt.xlabel("Date")..
0. 도서정보 - 도서명 : 빅데이터, 생활을 바꾸다. - 저자 : BC카드 빅데이터센터 - 링크 : 교보문고 1. 후기 - 뭔가 참식한 분석 아이디어가 없을까 하다가 서점에서 구한 책. 코드는 단 한줄도 없으며, BC 카드 데이터와 여러 데이터를 조합하여 50 가지의 비즈니스에 대한 인사이트를 뽑아낸 책이다. 해당 데이터를 바탕으로 1차원적인 EDA(상관도, 기간 별 차트, 워드클라우드 등) 를 진행하였다. 캐글마냥 고급적인 분석방법을 원하시는 분들에게는 적합하지 않으며, 창업을 위해 아이템이 필요하신 분들, 비즈니스에서는 어떻게 데이터를 보고 있는지 맛보기를 원하시는 분들에게 추천을 드린다.
0. 참가 이유 - 주최자님의 패널 요청 - 한 번 해보고 싶었음 - 모임 정보 1. 모임장소 2. 진행 순서 - 주제 하나 진행하고 프리토킹 20분 반복 3. 경품 - 퀴즈 맞춰서 장패드 받음 - 그 외 스티커, 머그컵, 강의 할인권 4. 내 소개 자료 - 링크 2019 데분 세션 발표자료(커리어 변신 데이터 분석가)_박범진 모임 : 데분 세션 발표자료(스크립트용) 일시 : 2019.12.07. 발표자 : 박범진 발표 내용 : 커리어 변신 데이터 분석가 www.slideshare.net 5. 후기 - 지난 2년간 많은 세미나를 다니면서 언젠가는 저 자리에 한 번쯤 서보고 싶다는 생각을 했었습니다. 제가 생각했던 거 보다 엄청 빨리 그 이루게 된 거 같아 마치 꿈을 꾼 거 같기도 합니다. 2년 전 진로를..
- Big Data ㄴ Volume + Variety + Velocity + Veracity + Value - Data Analysis Tool ㄴ pandas, scipy, numpy - Data Visualization Tool ㄴ matplotlib, seaborn, D3(java script 기반) - Jupyter notebook 설치 ㄴ https://brunch.co.kr/@mapthecity/16 참고 ㄴ 수업 소스 : https://github.com/tyoon10/T-academy - Jupyter notebook 장점 ㄴ 결과를 바로 확인할 수 있다는 점 ㄴ 마크다운을 통해서 교육하거나 보기 편함 # USEFUL SHORTCUTS run_and_pass = 'shift + enter'..