Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- Pandas
- Visualization
- 독후감
- 서평
- matplotlib
- python visualization
- 리눅스
- 텐서플로
- MySQL
- Ga
- 블로그
- 티스토리
- 한빛미디어
- 파이썬
- 시각화
- SQL
- Tistory
- Google Analytics
- 한빛미디어서평단
- 파이썬 시각화
- Linux
- MATLAB
- 통계학
- Python
- 월간결산
- 딥러닝
- 서평단
- 매틀랩
- Blog
- tensorflow
Archives
- Today
- Total
pbj0812의 코딩 일기
[통계학] 중심극한정리 구현 본문
0. 이론
- 개별 데이터의 모집단이 정규분포하지 않아도 거기서 추출한 표본이 충분히 크면 표본평균은 정규분포를 따른다.
1. 실습
1) library 호출
import matplotlib.pyplot as plt
import pandas as pd
import random
2) 데이터 생성 및 확인
- 봉우리 두 개를 가진 데이터
x = [1] * 25 + [2] * 75 + [3] * 100 + [4] * 75 + [5] * 25 + [6] * 75 + [7] * 100 + [8] * 75 + [9] * 25
df = pd.DataFrame({'x': x})
df2 = df.groupby('x').agg({'x' : 'count'})
plt.bar(df2.index, df2['x'])
3) 한 세트에 30개씩 뽑아 평균을 만들고(소수점 한자리) 1만번을 반복하여 히스토그램 생성
dummy_mean = []
for i in range(10000):
dummy = [random.randrange(0,574) for i in range(30)]
tmp = []
for j in dummy:
tmp.append(x[j])
dummy_mean.append(round(sum(tmp) / len(tmp), 1))
df3 = pd.DataFrame({'x': dummy_mean})
df4 = df3.groupby('x').agg({'x' : 'count'})
plt.bar(df4.index, df4['x'])
'Science > 통계학' 카테고리의 다른 글
[통계학] 부트스트랩을 통한 신뢰구간 만들기 (0) | 2023.05.22 |
---|---|
[통계학] 산술평균, 기하평균, 조화평균 python, sql 로 구현하기 (0) | 2023.02.27 |
[통계학] python, sql 로 t-test 구현 (1) | 2023.02.21 |
[통계학] z-score 를 python, MySQL 로 구현하기 (0) | 2023.02.15 |
[통계학] PYTHON 으로 t-test 구현하기 (0) | 2022.07.24 |
Comments