일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 통계학
- Tistory
- 매틀랩
- 파이썬 시각화
- matplotlib
- 서평단
- 시각화
- 월간결산
- tensorflow
- 독후감
- Visualization
- Pandas
- SQL
- Blog
- 파이썬
- 서평
- 리눅스
- Google Analytics
- Ga
- 딥러닝
- MATLAB
- 티스토리
- 한빛미디어
- python visualization
- 블로그
- MySQL
- Python
- 텐서플로
- Linux
- 한빛미디어서평단
- Today
- Total
목록파이썬 (184)
pbj0812의 코딩 일기
0. 목표 - matplotlib 의 barh 로 분수 표현하기 1. 실습하기 1) library 호출 import matplotlib.pyplot as plt 2) 함수 제작 * 분자와 분모에는 정수 형태(분모 : 자연수, 분자 : 정수)만 삽입 가능 (1) a 에는 각 파트별 크기(1 / n), b 에는 분자의 절대값, c 에는 b 를 제외한 나머지의. 값 (2) 피규어 생성 (3) 분자가 0 이 아니면 반복문을 돌면서 b 의 크기만큼 빨간 바를 누적하여 그리고 이후 c 의 크기만큼 하얀색 바를 누적해서 그림 (4) 분자가 0 이면 c 의 크기만큼 하얀색 바를 누적해서 그림 (5) 분자가 0 보다 작은 경우와 아닌 경우를 나눠서 각 바마다 text 로 표시 (6) xlabel 표시 def fracti..
0. 목표 - bar 그래프에 백분율 표시하기 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt 2) 데이터 프레임 생성 df = pd.DataFrame({'date' : ['2017', '2018', '2019', '2020'], 'A' : [150, 200, 225, 270], 'B' : [30, 45, 52, 60]}) df['total'] = df['A'] + df['B'] df['A_percent'] = round(df['A'] / df['total'] * 100, 1) df['B_percent'] = round(100 - df['A_percent'], 1) 3) 그림 그리기 fig, ax = plt.subplots(..
0. 목표 - streamlit 으로 대시보드 만들기 1. 설치 및 데모 실행 1) library 설치 pip install streamlit 2) 데모 실행 streamlit hello # 아래 에러 발생시 아래쪽 업그레이드 진행 필요 # AttributeError: module 'google.protobuf.descriptor' has no attribute '_internal_create_key' # pip install --upgrade protobuf - 결과 - 여러 가지 데모들 2. 내 파일로 만들어보기 - 파일 명 : second_app.py - 그림 코드 설명 : 링크 1) library 호출 import numpy as np import matplotlib.pyplot as plt im..
0. 목표 - stackplot 으로 Age Of Empires 그래프 그리기 1. 실습 1) library 호출 import numpy as np import matplotlib.pyplot as plt import pandas as pd 2) 데이터 프레임 생성 df = pd.DataFrame({ 'A' : [np.random.randint(1, 10) for i in range(100)], 'B' : [np.random.randint(1, 10) for i in range(100)], 'C' : [np.random.randint(1, 10) for i in range(100)]}) 3) 인덱스를 시간으로 대체 df.index = pd.date_range('1/1/2000', periods=100, ..
해당 포스팅은 pandas-bokeh의 README.md(링크) 파일 중 일부를 변형 혹은 차용하여 만든 글로 원본을 보시면 더욱 많고 정확한 정보를 얻으실 수 있습니다. 0. 목표 - pandas-bokeh 라이브러리 써보기 1. 실습(jupyter notebook 에서 실습) 1) 설치 !pip install pandas-bokeh 2) library 호출 import pandas as pd import pandas_bokeh 3) 데이터 프레임 생성 - 0부터 999 까지 생성 df = pd.DataFrame({'A' : [i for i in range(1000)]}) 4) line plot 생성 - html 창이 새롭게 열리며 아래와 같이 그래프를 그려줌 df.plot_bokeh(kind="lin..
0. 목표 - relativedelta 를 활용한 date_add 구현 1. 실습하기 1) library 호출 import pandas as pd from dateutil.relativedelta import relativedelta 2) 데이터 프레임 생성 df = pd.DataFrame({'id' : [1, 2, 3, 4, 5], 'date' : ['2021-01-01 11:11:11', '2021-02-01 11:11:11', '2021-01-03 11:11:11', '2021-04-10 11:11:11', '2021-05-01 11:11:11']}) 3) 데이터 형식 변경 df['date'] = pd.to_datetime(df['date'], format="%Y-%m-%d %H:%M:%S") 4)..
0. 목표 - query 함수 사용하기 1. 실습하기 1) library 호출 import pandas as pd 2) dataframe 생성 df = pd.DataFrame({'A' : [1, 2, 3, 4, 5], 'B' : ['apple', 'banana', 'apple', 'berry', 'watermelon']}) 3) query 사용하기 (1) where A > 3 df.query('A > 3') (2) where A > 3 and A 3 and A < 5') (3) where A = 1 or A = 4 df.query('A == 1 or A == 4') (4) where A in (1, 3, 5) df.query("A in (1, 3, 5)") (5) wher..
0. 목표 - isin 으로 SQL in 구현 1. 실습하기 1) library 호출 import pandas as pd 2) 테이블 생성 df = pd.DataFrame({'A' : [1, 2, 3, 4, 5], 'B' : ['apple', 'banana', 'apple', 'berry', 'watermelon']}) 3) isin 으로 in 구현 df[df.B.isin([1, 'apple'])] 4) isin 으로 not in 구현 df[~df.B.isin([1, 'apple'])] 2. 참고 - How to filter Pandas dataframe using 'in' and 'not in' like in SQL
0. 목표 - lambda 와 정규표현식을 이용한 SQL like 구현 1. 실습 1) library 호출 import pandas as pd import re 2) 데이터 프레임 생성 df = pd.DataFrame({'a' : [1, 2, 3, 4, 5], 'b' : ['hello', 'ahello', 'hellob', 'hel', '123']}) 3) 함수 생성 - 정규식을 이용하여 결과가 re.Match 이면 True 반환 아니면 False 반환 def function(x, inp): p = re.compile(inp) m = p.search(x) return type(m) == re.Match 4) %hello% df['TrueOrFalse'] = df.apply(lambda x : functi..
0. 목표 - pandas 를 이용한 데이트 포맷 변경 1. 실습 1) library 호출 import pandas as pd 2) 데이터프레임 생성 df = pd.DataFrame({'id' : [1, 2, 3, 4, 5], 'date' : ['2021-01-01 11:11:11', '2021-02-01 11:11:11', '2021-01-03 11:11:11', '2021-04-10 11:11:11', '2021-05-01 11:11:11']}) 3) 데이터 타입 확인 df.dtypes 4) datetime 형식으로 변경 df['date2'] = pd.to_datetime(df['date'], infer_datetime_format=True) 5) 타입 확인 df.dtypes 6) YYYY-MM-DD..