반응형
실시간 검색어를 크롤링한다.
from bs4 import BeautifulSoup
import requests
def favorSch():
daum_url = "https://www.daum.net"
html = requests.get(daum_url).text
soup = BeautifulSoup(html, 'html.parser')
try1 = soup.select('.slide_favorsch a[class*=link_favorsch]')
print("test1")
print(list(map(lambda x: x.text, try1)))
print('\n')
try2 = soup.find('div', class_='slide_favorsch').find_all('a', class_='link_favorsch')
print("test2")
for it in list(map(lambda x: x.text, try2)):
print(it)
print('\n')
print("test3")
i = 1
for it in soup.select('a.link_favorsch'):
print(str(i) + " :" + it.get_text())
i += 1
print('\n')
favorSch()
아래와 같은 결과를 가져올 수 있다.
test1
['코로나19 발생현황', '김병만 공식입장', '유망프랜차이즈창업', '봉재현 확진', '중량랙업체', '사회적 거리두기', '싱어게인 전체공개', '자전거거치대', '이하이 1위', '간이화장실']
test2
코로나19 발생현황
김병만 공식입장
유망프랜차이즈창업
봉재현 확진
중량랙업체
사회적 거리두기
싱어게인 전체공개
자전거거치대
이하이 1위
간이화장실
test3
1 :코로나19 발생현황
2 :김병만 공식입장
3 :유망프랜차이즈창업
4 :봉재현 확진
5 :중량랙업체
6 :사회적 거리두기
7 :싱어게인 전체공개
8 :자전거거치대
9 :이하이 1위
10 :간이화장실
반응형
'python' 카테고리의 다른 글
[python] 파이썬 time / timeit 사용법 (0) | 2021.05.27 |
---|---|
[python] 파이썬 사용자 입력받기 (input 함수 사용법) (0) | 2021.02.13 |
[python] 파이썬 문자열 치환 (replace & sub & subn) (0) | 2021.02.01 |
[python] 파이썬 requests 모듈 사용 (0) | 2020.12.18 |
[python] 파이썬 반복문 (0) | 2020.12.16 |
댓글