pbj0812의 코딩 일기

[kaggle] Advanced SQL 수료과정 본문

인공지능 & 머신러닝/kaggle

[kaggle] Advanced SQL 수료과정

pbj0812 2021. 4. 16. 04:06

0. 목차 및 내용

 1) JOINs and UNIONs

  - JOIN, UNION 설명

  - UNION DISTINCT = UNION ALL

 2) Analytic Functions

  - analytic Function = analytic window function = window function

  - 수행 과정(링크)

 3) Nested and Repeated Data(링크)

  - Nested Data

  - 타입이 INTEGER, STRING 이 아닌 RECORD 형태

  - Repeated Data

  - NULL 유무 부분이 REPEATED 

  - 아래와 같은 쿼리를 이용하여 REPEATED 된 형태를 레코드 형태로 풀어버릴 수 있음

SELECT l.name, l.bytes
FROM `bigquery-public-data.github_repos.languages`,
	UNNEST(language) as l
WHERE repo_name = 'polyrabbit/polyglot'
ORDER BY l.bytes DESC

 4) Writing Efficient Queries

  - show_amount_of_data_scanned(), show_time_to_run() 함수를 통해 작업량 확인 가능

  - 연산량을 줄이기 위한 계획

   (1) 필요한 컬럼만 읽기

   (2) 적은양의 데이터를 읽기

   (3) N:N Join 피하기

    ==> 다중 조인 시 한 번에 조인을 하지 말고 with 구문을 통해 내부에서 유니크하게 만든 다음 조인을 하면 더 빠르게 연산이 수행 가능

1. 수료증

2. 참고

 - Advansed SQL

Comments