일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 딥러닝
- Visualization
- 텐서플로
- Python
- 매틀랩
- Tistory
- python visualization
- 파이썬
- Pandas
- 한빛미디어서평단
- Blog
- SQL
- MATLAB
- tensorflow
- 리눅스
- 블로그
- 시각화
- 파이썬 시각화
- 독후감
- Ga
- 서평단
- 서평
- MySQL
- Linux
- 통계학
- 월간결산
- 한빛미디어
- Google Analytics
- 티스토리
- matplotlib
- Today
- Total
목록통계 (3)
pbj0812의 코딩 일기
0. 목표 - PYTHON 으로 t-test 구현하기 1. t-test - 설명 T-검정 (T-test) T-검정 (T-test) Start. BioinformaticsAndMe 1. T검정(T-test) ? 통계학자 윌리엄 고셋(가명 'Student')이 기네스 양조 공장에서 일하고 있었는데, 적은 샘플에 대한 통계적 추정치가 잘 맞지 않은 점을 착.. bioinformaticsandme.tistory.com 2. 구현하기 1) library 호출 import numpy as np 2) 데이터 생성 a = [1, 4, 3, 6, 4, 7, 8, 10, 5, 11] b = [2, 5, 6, 3, 7, 4, 8, 3, 9, 19] a_num = np.array(a) b_num = np.array(b) 3)..
1. 정의 k-평균 알고리즘(K-means algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작한다. 이 알고리즘은 자율 학습의 일종으로, 레이블이 달려 있지 않은 입력 데이터에 레이블을 달아주는 역할을 수행한다. 이 알고리즘은 EM 알고리즘을 이용한 클러스터링과 비슷한 구조를 가지고 있다. 2. 절차 1) 초기 (군집의) 중심으로 k개의 객체를 임의로 선택한다. 2) 각 자료를 가장 가까운 군집 중심에 할당한다. 3) 각 군집 내의 자료들의 평균을 계산하여 군집의 중심을 갱신(update)한다. 4) 군집 중심의 변화가 거의 없을 때(또는 최대 반복수)까지 2) 와 3) 을 반복한다. * 군집의 수(k)는 미리 정해 주어야..
모집단의 특성이 모수 모집단에서 일부의 자료 : 표본 표본에서 뽑은 각종 특성 : 통계 한 시점에서 여러 개체를 관측한 자료 : 횡단면 자료 시계열자료 : 한 개체를 여러 시점에 걸쳐 관측한 자료 패널자료, 종적자료 : 횡단면과 시계열적인 측면을 다 가지고 있는 자료 렉시스 도표 : 가로에는 연도, 세로에는 나이 표시 종적 분석은 여러 개체를 여러 시점에 걸쳐 다양하게 비교함으로써 보다 풍부한 분석을 가능하게 해줌. 자료 대표성 문제 명목척도 : 척도의 명칭만 의미 있음(결혼 상태)순서척도 : 명칭 및 순서가 의미 있음(잘함, 중간, 못함)간격척도 : 명칭, 순서 및 간격이 의미를 지님(온도)비율척도 : 명칭, 순서, 간격 및 배율 모두 의미를 지님(키, 몸무게)