Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 텐서플로
- Ga
- python visualization
- 한빛미디어
- Tistory
- 통계학
- matplotlib
- 리눅스
- 매틀랩
- Linux
- MySQL
- Pandas
- 서평
- SQL
- Google Analytics
- tensorflow
- 시각화
- 독후감
- 서평단
- Python
- 블로그
- 파이썬 시각화
- MATLAB
- 월간결산
- 한빛미디어서평단
- 파이썬
- Blog
- 티스토리
- Visualization
- 딥러닝
Archives
- Today
- Total
pbj0812의 코딩 일기
[수학] PYTHON 을 통한 자카드 유사도 구현 본문
0. 목표
- PYTHON 을 통한 자카드 유사도 구현
1. 실습
1) 데이터 생성
data1 = 'I am a boy'
data2 = 'I am a girl'
2) 자카드 유사도 계산 모듈 구현
- set 을 통한 중복 단어 제거
- 자카드 유사도 : 교집합의 길이 / 합집합의 길이
# inp1 : data1
# inp2 : data2
def JaccardSimilarity(inp1, inp2):
list_inp1 = inp1.split()
list_inp2 = inp2.split()
mom = set(list_inp1).union(set(list_inp2))
son = set(list_inp1).intersection(set(list_inp2))
print(mom)
print(son)
return len(son)/len(mom)
3) 테스트
JaccardSimilarity(data1, data2)
- 결과
{'boy', 'am', 'I', 'a', 'girl'}
{'a', 'I', 'am'}
0.6
2. 참고
'Science > 수학' 카테고리의 다른 글
[수학] PYTHON 을 이용한 TF-IDF 구현 (0) | 2020.11.25 |
---|---|
[수학] PYTHON 을 이용한 문서 단어 행렬(DTM) 구현 (0) | 2020.11.23 |
[수학] python을 이용한 코사인 유사도 구현 (0) | 2020.11.17 |
[수학] PYTHON 으로 norm 구현하기 (0) | 2020.11.16 |
[수학] python을 통한 범주형 피처 처리(클래스, 이진법, 원핫인코딩) (0) | 2020.10.31 |
Comments