일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 블로그
- python visualization
- Tistory
- Visualization
- SQL
- 매틀랩
- 텐서플로
- Pandas
- 서평단
- tensorflow
- 티스토리
- Blog
- MySQL
- 딥러닝
- 독후감
- matplotlib
- Ga
- Python
- 리눅스
- 파이썬
- 통계학
- 파이썬 시각화
- 한빛미디어서평단
- MATLAB
- 시각화
- 월간결산
- Linux
- Google Analytics
- 한빛미디어
- 서평
- Today
- Total
목록크롤링 (3)
pbj0812의 코딩 일기
- 해당 코드는 pytchat 0.5.5 공식 문서를 그대로 옮긴 것 임을 먼저 밝힙니다. 0. 목표 - pytchat 을 통한 유투브 라이브 댓글 크롤링 1. 실습 1) pytchat 설치 pip install pytchat * 이미 설치하신 분 들 중 버전이 낮아서 안되는 분들은 업그레이드 필요 pip install --upgrade pytchat==0.5.5 2) library 호출 import pytchat 3) video_id 구하기 - 구하고자 하는 유투브 라이브 방송의 url 중 v= 이후 문자(여기서는 2p-7_CSQ1eU 가 video_id) 4) 코드 실행 chat = pytchat.create(video_id="위에서 구한 video_id 입력") while chat.is_alive(..
0. 목표 - youtube api를 통한 댓글 크롤링 1. 준비물 1) API 키 받기 - 참고 : pbj0812.tistory.com/259 [자동화] python을 이용한 유투브 라이브 채널의 정보 및 댓글 크롤링 0. 목표 - python을 이용하여 아래 라이브 채널의 댓글 및 채널의 정보 획득 1. flow chart - 유투브 라이브 채널을 파이썬을 이용하여 정보 및 실시간 댓글을 모으고 실시간으로 csv 파일로 저장하는 pbj0812.tistory.com 2) OAuth 2.0 클라이언트 ID 받기 (1) + 사용자 인증 정보 만들기 -> OAuth 클라이언트 ID (2) 데스크톱 앱 -> 만들기 (3) 맨 오른쪽의 다운로드 버튼을 눌러 다운로드 3) library 설치 pip install..
0. 목표 - 유투브 동영상 URL 추출 - selenium은 너무 느림 1. 실습 1) library 호출 import requests import pandas as pd from bs4 import BeautifulSoup 2) URL 추출 keyword = '미르방' req = requests.get('https://www.youtube.com/results?search_query=' + keyword) html = req.text soup = BeautifulSoup(html, 'html.parser') my_titles = soup.select( 'h3 > a' ) title = [] url = [] for idx in my_titles: title.append(idx.text) url.appe..