@author jackzhenguo @desc @date 2019/8/8
98 爬取百度首页标题
import re from urllib import request #爬虫爬取百度首页内容 data=request.urlopen("http://www.baidu.com/").read().decode() #分析网页,确定正则表达式 pat=r'<title>(.*?)</title>' result=re.search(pat,data) print(result) <re.Match object; span=(1358, 1382), match='<title>百度一下,你就知道</title>'> result.group() # 百度一下,你就知道