Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 서평
- Pandas
- 파이썬
- 티스토리
- Linux
- 서평단
- 매틀랩
- Python
- 통계학
- 시각화
- 월간결산
- python visualization
- MySQL
- 텐서플로
- Tistory
- Ga
- tensorflow
- matplotlib
- Visualization
- 리눅스
- MATLAB
- Google Analytics
- 한빛미디어서평단
- 한빛미디어
- 블로그
- 딥러닝
- 독후감
- 파이썬 시각화
- Blog
- SQL
Archives
- Today
- Total
pbj0812의 코딩 일기
[kaggle] Advanced SQL 수료과정 본문
0. 목차 및 내용
1) JOINs and UNIONs
- JOIN, UNION 설명
- UNION DISTINCT = UNION ALL
2) Analytic Functions
- analytic Function = analytic window function = window function
- 수행 과정(링크)
3) Nested and Repeated Data(링크)
- Nested Data
- 타입이 INTEGER, STRING 이 아닌 RECORD 형태
- Repeated Data
- NULL 유무 부분이 REPEATED
- 아래와 같은 쿼리를 이용하여 REPEATED 된 형태를 레코드 형태로 풀어버릴 수 있음
SELECT l.name, l.bytes
FROM `bigquery-public-data.github_repos.languages`,
UNNEST(language) as l
WHERE repo_name = 'polyrabbit/polyglot'
ORDER BY l.bytes DESC
4) Writing Efficient Queries
- show_amount_of_data_scanned(), show_time_to_run() 함수를 통해 작업량 확인 가능
- 연산량을 줄이기 위한 계획
(1) 필요한 컬럼만 읽기
(2) 적은양의 데이터를 읽기
(3) N:N Join 피하기
==> 다중 조인 시 한 번에 조인을 하지 말고 with 구문을 통해 내부에서 유니크하게 만든 다음 조인을 하면 더 빠르게 연산이 수행 가능
1. 수료증
2. 참고
'인공지능 & 머신러닝 > kaggle' 카테고리의 다른 글
[kaggle] Data Cleaning 수료과정 (0) | 2021.04.18 |
---|---|
[kaggle] pandas 수료과정 (0) | 2021.04.18 |
[kaggle] Intro to SQL 수료과정 (0) | 2021.04.14 |
[kaggle] Intermediate Machine Learning 수료 과정 (0) | 2021.04.13 |
[kaggle] Intro to Machine Learning 수료 과정 (0) | 2021.04.04 |
Comments