Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 블로그
- matplotlib
- 파이썬
- python visualization
- 텐서플로
- 리눅스
- 서평단
- SQL
- MATLAB
- Blog
- MySQL
- 딥러닝
- 파이썬 시각화
- Visualization
- 서평
- 티스토리
- Tistory
- 한빛미디어
- 한빛미디어서평단
- Google Analytics
- 매틀랩
- 통계학
- Ga
- 시각화
- Python
- 월간결산
- tensorflow
- 독후감
- Linux
- Pandas
Archives
- Today
- Total
pbj0812의 코딩 일기
[kaggle] Advanced SQL 수료과정 본문
0. 목차 및 내용
1) JOINs and UNIONs
- JOIN, UNION 설명
- UNION DISTINCT = UNION ALL
2) Analytic Functions
- analytic Function = analytic window function = window function
- 수행 과정(링크)


3) Nested and Repeated Data(링크)
- Nested Data
- 타입이 INTEGER, STRING 이 아닌 RECORD 형태

- Repeated Data
- NULL 유무 부분이 REPEATED

- 아래와 같은 쿼리를 이용하여 REPEATED 된 형태를 레코드 형태로 풀어버릴 수 있음
SELECT l.name, l.bytes
FROM `bigquery-public-data.github_repos.languages`,
UNNEST(language) as l
WHERE repo_name = 'polyrabbit/polyglot'
ORDER BY l.bytes DESC
4) Writing Efficient Queries
- show_amount_of_data_scanned(), show_time_to_run() 함수를 통해 작업량 확인 가능
- 연산량을 줄이기 위한 계획
(1) 필요한 컬럼만 읽기
(2) 적은양의 데이터를 읽기
(3) N:N Join 피하기
==> 다중 조인 시 한 번에 조인을 하지 말고 with 구문을 통해 내부에서 유니크하게 만든 다음 조인을 하면 더 빠르게 연산이 수행 가능
1. 수료증

2. 참고
'인공지능 & 머신러닝 > kaggle' 카테고리의 다른 글
[kaggle] Data Cleaning 수료과정 (0) | 2021.04.18 |
---|---|
[kaggle] pandas 수료과정 (0) | 2021.04.18 |
[kaggle] Intro to SQL 수료과정 (0) | 2021.04.14 |
[kaggle] Intermediate Machine Learning 수료 과정 (0) | 2021.04.13 |
[kaggle] Intro to Machine Learning 수료 과정 (0) | 2021.04.04 |
Comments