일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Pandas
- 한빛미디어서평단
- 매틀랩
- 딥러닝
- 파이썬
- 티스토리
- Python
- 서평단
- matplotlib
- 리눅스
- 통계학
- Visualization
- 파이썬 시각화
- Tistory
- MATLAB
- Blog
- 블로그
- Linux
- Ga
- 서평
- tensorflow
- 한빛미디어
- Google Analytics
- 시각화
- MySQL
- 텐서플로
- SQL
- python visualization
- 독후감
- 월간결산
- Today
- Total
목록파이썬 (184)
pbj0812의 코딩 일기
0. 목표 - 연령 별 연봉 그래프 그리기 1. 실습하기 1) library 호출 import matplotlib.pyplot as plt from matplotlib import rc rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 2) 그림 그리기 - 가로축은 연령대, 세로축은 연봉, 색은 해당하는 인구수를 나타냄. data_x = ['20대', '30대', '40대', '50대', '60세 이상'] data_y = [3000, 4500, 5000, 4700, 3400] people = [380, 400, 350, 250, 100] fig, ax = plt.subplots(figsize=(15, 10)) # 바 차..
0. 목표 - 동일한 알파벳에 동일한 색을 매핑하여 파이차트 그리기 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt import numpy as np import seaborn as sns 2) 데이터 생성 df = pd.DataFrame({'category' : ['a', 'b', 'c', 'd', 'e', 'f'], 'num' : [1, 4, 7, 9, 3, 7]}) df2 = pd.DataFrame({'category' : ['e', 'g', 'c', 'b', 'a'], 'num' : [4, 2, 1, 6, 3]}) 3) 파이 차트 그리기 fig, ax = plt.subplots(1, 2) fig.set_size_inc..
0. 목표 - 특정 그룹에 해당하는 bar 들만 색칠하기 1. 실습 1) library 호출 import pandas as pd 2) 데이터 생성 df = pd.DataFrame({'x' : ['a', 'b', 'c', 'd', 'e'], 'y' : [2, 7, 3, 9, 4]}) 3) MultiIndex index = [['A', 'A', 'A', 'B', 'B'], [1, 2, 3, 4, 5]] df.index = index 4) 그림그리기 fig, ax = plt.subplots() fig.set_size_inches(15, 10) df.sort_values('y', ascending = True, inplace = True) df.reset_index(inplace = True) bars = pl..
0. 목표 - barh 그래프에서 특정 bar만 다른 색으로 칠하기 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt 2) 데이터 생성 df = pd.DataFrame({'catn' : ['a', 'b', 'c', 'd', 'e'], '2020' : [1, 2, 3, 4, 5], '2021' : [5, 4, 3, 2, 1], '2022' : [3, 5, 1, 5, 2]}) df_copy = df.copy() 3) 그림 제작에 사용될 필드명 저장 column_list = df_copy.columns[1:] 4) 그림 그리기 # 판 깔기 fig, ax = plt.subplots(len(column_list), 1) # 피규어 크기..
0. 목표 - 정해진 구역에 패턴 넣기 1. 실습 1) library 호출 import matplotlib.pyplot as plt import pandas as pd from matplotlib.patches import Ellipse, Polygon 2) 데이터 생성 x = [1, 2, 3, 4, 5, 6] a = [1, 2, 3, 7, 2, 2] b = [3, 5, 3, 5, 67, 3] c = [7, 3, 8, 2, 56, 3] df = pd.DataFrame({'x' : x, 'a' : a, 'b' : b, 'c' : c}) 3) 그림 그리기 # 칼럼명 갯수 확인 len_df = len(df.columns) - 1 # 판 그리기 fig, ax = plt.subplots(3, 1) # 그림 크기 ..
0. 목표 - 국내 프로야구 역대 관중 수 그리기 1. 실습 1) library 호출 import matplotlib.pyplot as plt import matplotlib import pandas as pd from matplotlib import rc rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False from matplotlib.patches import Ellipse, Polygon 2) 데이터 만들기 - crowdf2 는 그림자 효과를 위함 year = [i for i in range(1999, 2019, 1)] year2 = [] for i in year: year2.append(str(i)[2:]) crow..
0. 목표 - 보조 눈금 그리기 1. 실습 1) library 호출 import matplotlib.pyplot as plt import numpy as np 2) 데이터 생성 x = [1, 2, 3] y = [1, 2, 3] 3) 그림 그리기 fig, ax = plt.subplots() ax.plot(x, y) plt.show() 4) 라벨 값 받기 a = ax.get_yticklabels() 5) linspace 를 이용해 사이에 넣어줄 값 생성 - 0.05 간격 b = np.linspace(0.75, 3.25, int((3.25 - 0.75) / 0.05) + 1) 6) 그림 그리기 fig, ax = plt.subplots() ax.plot(x, y) ax.set_yticks(b, minor = T..
0. 목표 - matplotlib 으로 seaborn scatterplot 구현하기 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 2) 데이터 호출 df = sns.load_dataset('tips') 3) seaborn 으로 그리기 sns.scatterplot(x = 'total_bill', y = 'tip', hue = 'size', style = 'sex', palette = 'Blues', data = df) 4) matplotlib 으로 그리기 (1) 색깔만 바꾸기 fig, ax = plt.subplots() scatter = ax.scatter(df['total_bill']..
0. 도서 정보 - 도서명 : Pandas로 하는 데이터 과학 - 저자 : 마이클 헤이트 - 링크 1. 후기 - 책의 발행년도는 2018년으로 조금 기간이 지난 책이지만(그래서 pandas 최신 버전에 대한 내용이나 사장될 내용을 따라 잡지는 못하지만...) 파이썬을 통한 데이터 핸들링을 하기에는 좋은 책이다. 하지만 데이터 과학... 이라는 제목은 해당 도서와는 조금 멀게 느껴진다. 해당 도서에서는 기초적인 데이터 생성(파일 읽기, 데이터 프레임 만들기)에서 부터 시작하여 인덱스를 이용한 데이터 추출, 데이터 핸들링(결측값 처리, 그룹화, 롤링 윈도우 등), 기술 통계(평균, 최빈수, 분산, 분위수 등), 시각화(matplotlib 을 이용한 차트 생성) 를 다룬다. 그렇기에 만약, 머신러닝, 딥러닝 ..
0. 목표 - 인덱싱, 슬라이싱, iloc, loc, iat, at 정리 1. 리스트 1) 리스트 생성 a = [i for i in range(10)] - 결과 : [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 2) 인덱싱 a[1] - 결과 : 1 a[-1] - 결과 : 9 3) 슬라이싱 a[1:3] - 결과 : [1, 2] a[-3:-1] - 결과 : [7, 8] a[::2] - 결과 : [0, 2, 4, 6, 8] a[1::2] - 결과 : [1, 3, 5, 7, 9] a[::-1] - 결과 : [9, 8, 7, 6, 5, 4, 3, 2, 1, 0] a[::-2] - 결과 : [9, 7, 5, 3, 1] a[-2:1:-2] - 결과 : [8, 6, 4, 2] 2. 시리즈 1) 라이브러리 호출..