Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 한빛미디어서평단
- 블로그
- tensorflow
- Visualization
- MySQL
- Tistory
- 매틀랩
- 한빛미디어
- 독후감
- 서평
- Blog
- Google Analytics
- SQL
- Linux
- 텐서플로
- matplotlib
- 서평단
- 월간결산
- 통계학
- 파이썬
- 티스토리
- Python
- 딥러닝
- Pandas
- 시각화
- Ga
- MATLAB
- 파이썬 시각화
- python visualization
- 리눅스
Archives
- Today
- Total
pbj0812의 코딩 일기
[SQL] not in 과 left join 연산 시간 비교 실험(1/2) 본문
0. 목표
- not in을 통한 제거와 left join 이후 where 를 통한 제거간의 연산 시간 비교 실험
1. 실습
1) 데이터 생성
- df_a.csv : 10만
- df_b.csv : 1만
import pandas as pd
a = [i for i in range(100000)]
df_a = pd.DataFrame({'a': a})
df_a.to_csv("./df_a.csv")
b = [i for i in range(10000)]
df_b = pd.DataFrame({'a': b})
df_b.to_csv("./df_b.csv")
2) 테이블 생성
- Table Data Import Wizard를 통한 테이블 생성 및 삽입
- index 칼럼을 날리고 a만 가져옴
3) 데이터 확인
SELECT * FROM sql_test.df_a LIMIT 100;
4) not in 을 통한 연산시간 확인
- 연산시간 : 0.091 sec / 0.0000079 sec
SELECT COUNT(A.a)
FROM sql_test.df_a AS A
WHERE
A.a not in (
SELECT a FROM sql_test.df_b);
5) left join 을 통한 연산시간 확인
- 연산시간 : 64.593 sec / 0.000025 sec
SELECT COUNT(A.a)
FROM sql_test.df_a AS A
LEFT JOIN sql_test.df_b AS B
ON A.a = B.a
WHERE B.a IS NULL;
2. 결과
- 수치상 말이 안됨...
'ComputerLanguage_Program > SQL' 카테고리의 다른 글
[SQL] LAG 함수를 이용한 전일대비 증가분 계산 (0) | 2020.11.03 |
---|---|
[SQL] not in 과 left join 연산 시간 비교 실험(2/2) (0) | 2020.10.15 |
[SQL] MySQL lock 실습 (0) | 2020.09.16 |
[SQL] MySQL ROLLBACK 실습하기 (0) | 2020.09.15 |
[SQL] MySQL 외래키 지정하기 (0) | 2020.09.13 |
Comments