python爬虫 |
您所在的位置:网站首页 › 电影名字怎么取 › python爬虫 |
python爬虫——三步爬得电影天堂电影下载链接,30多行代码即可搞定:
本次我们选择的爬虫对象是:https://www.dy2018.com/index.html 具体的三个步骤:1.定位到2020必看片 2.从2020必看片中提取到子页面地址 3.进去子页面,拿到迅雷下载链接 话不多说,上代码:(这个代码还存在问题!!完整解决版本代码在下面) import requests import re #s1,定位到2020必看片 domain="https://www.dy2018.com" resp=requests.get(domain,verify=False)#去掉安全验证 resp.encoding='gb2312'#一般网站会告诉你他编码格式,也可以写gbk,如果没有这一句则可能出现乱码 page=resp.text#用page表达一下,方便理解 #三次正则表达式都放到一起写了,也可以写到后面 obj1 = re.compile(r"2020必看热片.*?(?P.*?)",re.S) obj2 = re.compile(r" |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |