일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 매틀랩
- tensorflow
- 한빛미디어
- 독후감
- Linux
- 리눅스
- 파이썬
- Pandas
- Tistory
- 서평
- SQL
- 한빛미디어서평단
- 통계학
- python visualization
- MySQL
- matplotlib
- Blog
- Google Analytics
- Python
- 서평단
- 텐서플로
- 월간결산
- Ga
- 티스토리
- 블로그
- 딥러닝
- Visualization
- 파이썬 시각화
- MATLAB
- 시각화
- Today
- Total
목록Science/통계학 (35)
pbj0812의 코딩 일기

0. 목표 - PYTHON을 이용한 AUC 계산 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt 2) 데이터 생성 index = [i for i in range(1, 21)] label = ['p', 'p', 'n', 'p', 'p', 'p', 'n', 'n', 'p', 'n', 'p', 'n', 'p', 'n', 'n', 'n', 'p', 'n', 'p', 'n'] probability = [0.9, 0.8, 0.7, 0.6, 0.55, 0.54, 0.53, 0.52, 0.51, 0.505, 0.4, 0.39, 0.38, 0.37, 0.36, 0.35, 0.34, 0.33, 0.3, 0.1] 3) 데이터 프레임화 data ..

0. 목표 - ROC 곡선 그리기 1. 실습 1) library 호출 import pandas as pd import matplotlib.pyplot as plt 2) 데이터 생성 index = [i for i in range(1, 21)] label = ['p', 'p', 'n', 'p', 'p', 'p', 'n', 'n', 'p', 'n', 'p', 'n', 'p', 'n', 'n', 'n', 'p', 'n', 'p', 'n'] probability = [0.9, 0.8, 0.7, 0.6, 0.55, 0.54, 0.53, 0.52, 0.51, 0.505, 0.4, 0.39, 0.38, 0.37, 0.36, 0.35, 0.34, 0.33, 0.3, 0.1] 3) 데이터 프레임화 data = pd.Dat..

0. 목표 - PYTHON을 이용한 RMSE, MAPE 구현 및 데이터에 따른 결과 비교 1. 실습 1) library 호출 import matplotlib.pyplot as plt 2) 제곱근 함수 def sqrt(inp): result = inp/2 for i in range(30): result = (result + (inp / result)) / 2 return result 3) RMSE # inp1 : real # inp2 : esti def rmse(inp1, inp2): result = 0 for i in range(len(inp1)): result += (inp1[i] - inp2[i]) ** 2 result = sqrt(result / len(inp1)) return result 4) M..

0. 목표 - python을 이용한 최소제곱법과 경사하강법 구현(1차식 한정) 1. 실습 1) library 호출 import numpy as np import pandas as pd import matplotlib.pyplot as plt 2) 데이터 생성 - 대략 2x + 1 의 느낌으로 생성 df = pd.DataFrame({"x" : [1, 2, 3, 4, 5, 6, 7, 8, 9, 10], "y" : [3.1, 5.2, 7.1, 9.2, 11.2, 13.1, 15.2, 17.1, 18.9, 20.9]}) 3) 그림 plt.plot(df['x'], df['y']) plt.axis([0, max(df['x']), 0, max(df['y'])]) 4) 최소제곱법 테스트용 함수 구현 - 3x + 1 #..

0. 목표 - python을 통한 제곱합(SS), 제곱평균(MS), 처리간 제곱합(SSB), 처리내 제곱합(SSE), 총제곱합(SST) 구현 1. 기본 이론 1) 제곱합(Sum of Squares) - 관측값과 평균의 차이를 제곱하여 더해준 값, 변동(variation) 2) 제곱평균(Mean Squre) - 제곱합을 자유도로 나누어 준 값, 분산 3) 처리간 제곱합(Sum of Squares Between Treatments) - 각 처리평균 간의 차이를 측정 4) 처리내 제곱합(Sum of Squares due to Error) - 개별 관측값이 각 처리 평균으로부터 떨어진 차이를 측정 5) 총제곱합(Sum of Squares Total) - 개별관측값이 총평균으로부터 떨어진 차이를 측정 - 총 제곱..

0. 목표 - python을 통한 체계적 표본추출 구현 1. 이론 - 모집단의 기본단위를 순서대로 1 ~ N 까지 번호를 할당하고 표본추출간격 k=N/n으로 정함. - 첫째 구간에서 무작위로 기본단위 하나를 추출하여 그 번호가 a라면 표본은 a, a+k, a+2k... 인 기본단위들을 추출하여 구성 - 예시 원본 2. 실습 1) library 호출 import random 2) 함수 제작 (1) k 값으로는 모집단인 inp의 길이를 n 으로 나눠 구함. * 딱 맞아떨어지지 않는 경우가 많기에 int를 취하여 정수 형태(소수점 버림)로 만듬 (2) 모집단에서 k*n 이후의 나머지 부분은 버림 (3) 랜덤함수를 통해 0 ~ k-1 의 자연수 값을 구하여 a에 할당 (4) 반복문을 통하여 a + i*k 값을 ..
0, 목표 - python을 사용하여 단순 무작위 표본 추출을 사용한 표본의 수 계산 1. 준비 1) 단순무작위표본추출 정의 - 일정크기의 모든 표본조합이 표본으로 추출될 확률을 같게 놓으며, 모집단의 기본단위가 표본에 포함될 확률을 같게 하여 표본을 추출하는 방법 2) 문제 - 문제 10명의 선수를 가진 농구팀에서 각 선수가 경기당 올리는 평균득점을 편의상 3명의 평균득점으로 추정하고자 할때 가능한 표본의 수 2. 실습 1) factorial 구현 - 0이 입력값으로 들어갔을 경우에는 1 출력 def factorial(num): result = num while num > 1: num = num - 1 result = result * num if result == 0: result = 1 else: p..

0. 목표 - python을 이용한 귀무가설의 판정 1. 가설 설정(문제 원본 링크) - 여자와 남자의 성비는 1:1이라는 것은 편견이다.빨간색 차가 파란색 차보다 더 과속티켓을 많이 받는다고 한다. 전국적 평균 결과는 2:1의 비율로 빨간색 차가 높게 나타난다. 우리는 지역 경찰이 과속 티켓을 발부할 때 편견이 작용하는 것은 아닌지 알고 싶다. 만약 무작위로 빨간색 또는 파란색 자동차에 주어진 150장의 과속티켓을 추출했을 대, 지역 경찰이 편견을 가지고 티켓을 발부 했다면, 빨간색 차 100대, 파란색 차 50대가 나올 것이라고 예상할 수 있다. 2. 실습 1) 데이터 생성 dataset = ["r", "r", "r", "r", "r", "r", "r", "r", "r", "b", "b", "b", ..
0. 목표 - python을 이용한 U 값 계산 - U 값 : 두 집단을 순위 데이터로 변환하여 분포가 겹치는 정도를 나타내는 통계량 1. 방법 1) 데이터를 양 집단을 합친 순위로 변환 2) 양 집단을 합쳐서 작은순으로 순서를 붙임 3) A 집단보다 작은 B 직단의 개수를 계산하고 그 값을 합산한 값이 U 값 2. 구현 1) 두 집단(데이터) 생성 a = [10.2, 8.3, 5.1, 3.4] b = [90.0, 10.2, 7.7, 6.8, 4.0] 2) 두 집단(데이터)을 하나로 합침 - [10.2, 8.3, 5.1, 3.4, 90.0, 10.2, 7.7, 6.8, 4.0] total = a + b print(total) 3) 순서 정렬 - [3.4, 4.0, 5.1, 6.8, 7.7, 8.3, 10..

0. 목표 - scipy 패키지를 이용한 동전 던지기 1. 실습 1) library 호출 import numpy as np import matplotlib.pyplot as plt import matplotlib from IPython.core.pylabtools import figsize from matplotlib import rc import scipy.stats as stats 2) 함수 제작 - stats.beta : 베타분포 객체 생성(링크) - stats.bernoulli.rvs(0.5, size = inp[-1]) : 베르누이 시뮬레이션(확률 0.5로 계산, inp[-1]로 지정한 것은 리스트(숫자가 커지는 형태)로 받아서 돌릴때 가장 마지막 값(가장 긴 값)을 근거해서 그림을 그릴 것이기..