python-small-examples/md/98.md at master · data-python/python-small-examples

python-small-examples/md/98.md at master · data-python/python-small-examples

Skip to content

Latest commit

@author jackzhenguo
@desc 
@date 2019/8/8

98 爬取百度首页标题

import re
from urllib import request

#爬虫爬取百度首页内容
data=request.urlopen("http://www.baidu.com/").read().decode()

#分析网页,确定正则表达式
pat=r'<title>(.*?)</title>'

result=re.search(pat,data)
print(result) <re.Match object; span=(1358, 1382), match='<title>百度一下，你就知道</title>'>

result.group() # 百度一下，你就知道