본문 바로가기
python

[python] 파이썬 실시간 검색어 크롤링

by hong0 2020. 12. 17.
반응형

실시간 검색어를 크롤링한다.

from bs4 import BeautifulSoup
import requests

def favorSch():
    daum_url = "https://www.daum.net"

    html = requests.get(daum_url).text
    soup = BeautifulSoup(html, 'html.parser')

    try1 = soup.select('.slide_favorsch a[class*=link_favorsch]')
    print("test1")
    print(list(map(lambda x: x.text, try1)))
    print('\n')

    try2 = soup.find('div', class_='slide_favorsch').find_all('a', class_='link_favorsch')
    print("test2")
    for it in list(map(lambda x: x.text, try2)):
        print(it)
    print('\n')
    
    print("test3")
    i = 1
    for it in soup.select('a.link_favorsch'):
        print(str(i) + " :" + it.get_text())
        i += 1
    print('\n')

favorSch()

아래와 같은 결과를 가져올 수 있다.

test1
['코로나19 발생현황', '김병만 공식입장', '유망프랜차이즈창업', '봉재현 확진', '중량랙업체', '사회적 거리두기', '싱어게인 전체공개', '자전거거치대', '이하이 1위', '간이화장실']

test2
코로나19 발생현황
김병만 공식입장
유망프랜차이즈창업
봉재현 확진
중량랙업체
사회적 거리두기
싱어게인 전체공개
자전거거치대
이하이 1위
간이화장실

test3
1 :코로나19 발생현황
2 :김병만 공식입장
3 :유망프랜차이즈창업
4 :봉재현 확진
5 :중량랙업체
6 :사회적 거리두기
7 :싱어게인 전체공개
8 :자전거거치대
9 :이하이 1위
10 :간이화장실

 

 

반응형

댓글