Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 월간결산
- 텐서플로
- 파이썬 시각화
- Blog
- Python
- 파이썬
- Tistory
- SQL
- matplotlib
- 티스토리
- Linux
- MATLAB
- 한빛미디어
- 딥러닝
- tensorflow
- Visualization
- 통계학
- Ga
- 독후감
- MySQL
- 서평
- 한빛미디어서평단
- 리눅스
- 매틀랩
- python visualization
- 시각화
- 블로그
- Pandas
- 서평단
- Google Analytics
Archives
- Today
- Total
pbj0812의 코딩 일기
[통계학] 부트스트랩을 통한 신뢰구간 만들기 본문
0. 이론
- 준비한 데이터에서 복원 추출을 반복해 많은 재표본을 생성하고, 그 통계량에서 모수를 추정
1. 실습
1) library 호출
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import random
import statistics
2) 데이터 생성
- t 분포를 활용한 신뢰구간 : 1.03 ~ 4.97
x = [1, 2, 3, 4, 5]
print('신뢰구간 : ', round(np.mean(x) - 2.78 * 0.71, 2), ' ~ ', round(np.mean(x) + 2.78 * 0.71, 2))
3) 부트스트랩
- 5개씩 뽑아서(복원추출) 평균을 만들고 해당 데이터들을 통해 신뢰구간 구현
var = []
stdev = []
mean = []
for i in range(10000):
tmp = [random.randrange(1, 6) for i in range(5)]
mean.append(np.mean(tmp))
print('100번 돌렸을 때 신뢰구간 : ', round(np.mean(mean[:99]) - 2.78 * statistics.stdev(mean[:99]), 2), ' ~ ', round(np.mean(mean[:99]) + 2.78 * statistics.stdev(mean[:99]), 2))
print('1000번 돌렸을 때 신뢰구간 : ', round(np.mean(mean[:999]) - 2.78 * statistics.stdev(mean[:999]), 2), ' ~ ', round(np.mean(mean[:999]) + 2.78 * statistics.stdev(mean[:999]), 2))
print('2000번 돌렸을 때 신뢰구간 : ', round(np.mean(mean[:1999]) - 2.78 * statistics.stdev(mean[:1999]), 2), ' ~ ', round(np.mean(mean[:1999]) + 2.78 * statistics.stdev(mean[:1999]), 2))
print('5000번 돌렸을 때 신뢰구간 : ', round(np.mean(mean[:4999]) - 2.78 * statistics.stdev(mean[:4999]), 2), ' ~ ', round(np.mean(mean[:4999]) + 2.78 * statistics.stdev(mean[:4999]), 2))
print('10000번 돌렸을 때 신뢰구간 : ', round(np.mean(mean[:9999]) - 2.78 * statistics.stdev(mean[:9999]), 2), ' ~ ', round(np.mean(mean[:9999]) + 2.78 * statistics.stdev(mean[:9999]), 2))
100번 돌렸을 때 신뢰구간 : 1.15 ~ 4.91
1000번 돌렸을 때 신뢰구간 : 1.22 ~ 4.78
2000번 돌렸을 때 신뢰구간 : 1.23 ~ 4.76
5000번 돌렸을 때 신뢰구간 : 1.22 ~ 4.76
10000번 돌렸을 때 신뢰구간 : 1.24 ~ 4.76
2. 참고
'Science > 통계학' 카테고리의 다른 글
[통계학] 중심극한정리 구현 (0) | 2023.05.22 |
---|---|
[통계학] 산술평균, 기하평균, 조화평균 python, sql 로 구현하기 (0) | 2023.02.27 |
[통계학] python, sql 로 t-test 구현 (1) | 2023.02.21 |
[통계학] z-score 를 python, MySQL 로 구현하기 (0) | 2023.02.15 |
[통계학] PYTHON 으로 t-test 구현하기 (0) | 2022.07.24 |
Comments