江湖小白之一起学Python （十二）开发视频网之获取m3u8真实播放地址

2024-07-16 18:49| 来源: 网络整理| 查看: 265

雨一直下，气氛还算融洽……，我这边下了一周的雨了，趁着目前有个把小时的间歇时间，赶紧接着上一篇更一波，哎，时间就是这么不够用，来吧，抓紧时间今天来实现一下提取m3u8真实的播放地址，实现上篇页面展示的在线播放功能.

既然要获取地址，首先还是得跟踪下目标网站的页面代码，把流程搞懂了，代码就好写了，具体操作这里就不多说了，之前的内容讲过，这里我们就把分析的结果提出来：

我们可以看到他是通过JS渲染后加载了一个iframe框架，如果我们直接查看源代码的话是没有这个内容的，那怎么获取这个链接地址呢，我们看下源代码：

找了半天没找到播放地址，但找到了这段JS，我们打开看下：

解析一下好看点：

果然，这段JS就是放视频地址的文件，它这里输出是中文转义过了，playname是播放的云接口，比如高清云，云播3什么什么的，playurls里是集合，每个集合第1个参数是集数，第2个就是视频播放地址，第3个是它对应的播放网址，这里其实有想法的同学可以按自己的方式去提取，这里包含了这个电视剧所有的剧集数，我们再看看这个播放地址是不是正确的，我们打开源网站查看下视频链接:

我们看到这里有2个index.m3u8，打开第1个内容看看：

第2个再看看：

上面可以看出，第2个才是我们想要的真实的m3u8地址：

由此可以看出，这真实的m3u8地址是通过一次访问js中给出的https://shishang.dingxiangzuida.com/20200520/6979_4533ef88/index.m3u8，在获取内容后拼接后得到真实的地址，但这里有点区别，我们通过JS获取的网址：https://shishang.dingxiangzuida.com/20200520/6979_4533ef8uQ6h/index.m3u8，这里6979_4533ef8uQ6h多了后面一段文字，如果直接访问这个链接是找不到文件的，

它是内部通过https://www.juji.tv/Player/dp.html?v=转换后得到的真实地址：

通过上面的仔细分析，我们搞懂了它执行及获取真实地址的方法，那接下来我们就通过代码来实现提取从而获得真实的视频播放地址，下面贴上代码部分：

#获取m3u8地址 def get_video_m3u8(self,videourl,videoname): #赋值给全局变量值 self.videourl = videourl self.videoname = videoname #截取网址域名部分 domainurl=re.search('http[s]?://[-\w.]+', videourl).group() #请求视频播放网址 r = requests.get(url=videourl, timeout=self.timeout) #提取包含视频m3u8地址的js网址 jsurl = re.search(r'src=\"\/dian(.*?)">', r.text).group(1) jsurl="{}/dian{}".format(domainurl,jsurl) #请求获取JS网址的内容 response = requests.get(url=jsurl,timeout=self.timeout) videostr=re.search(r'ff_urls=\'(.*?)\';',response.text).group(1) #格式化JS videojson=json.loads(videostr,encoding="utf-8") print(videojson) #定义一下我们显示的云类型及播放地址集合 videotype='swyun' playurls = [] #首先我们判断我们选择的swyun云端是否存在 for p in videojson["Data"]: if p["playname"]==videotype: playurls=p["playurls"] break #如果不存在，我们再尝试提取zdyun云端的内容，这里可以依次，因为这个视频网的云端比较多 if len(playurls)==0: for p in videojson["Data"]: if p["playname"]=="zdyun": videotype='zdyun' playurls=p["playurls"] break #获取对应的播放地址 for vp in playurls: if videoname.split("_")[1] == vp[0]: playurl = vp[1] break #通过下面地址转换，获取真正的播放地址，这里一定要加referer，否则请求不到内容 zurl = "https://www.juji.tv/Player/dp.html?v="+playurl headers = { 'referer': videourl } response = requests.get(url=zurl, headers=headers, timeout=self.timeout) #用正则获取到真正的播放地址 realurl=re.search(r'purl\s=\s\'(.*?)\';',response.text).group(1) #这里我们为了方便，发现有出现2次index.m3u8这样的，里面的内容都是/1000k/hls/*.m3u8,所以直接判断加上 if videotype == 'zdyun' or videotype == 'okyun': playurl = realurl[:realurl.rfind("/")] + "/1000k/hls/" + realurl.split("/")[-1] else: playurl=realurl print("真正的地址：",playurl) return playurl

下面我们运行打印看看：

我们在主文件里创建一个post方法，成功后返回该地址:

#在线播放 @app.route("/play",methods=["post"]) def play(): args = request.args if requesthod == 'GET' else request.form name = args.get('name', "", type=str) url = args.get('url', "", type=str) #载入Video类调用获取地址的方法 v = Video() url = v.get_video_m3u8(url,name) #成功后返回地址信息 msg={"code":200,"url":url} return jsonify(msg)

html部分通过jquery的ajax请求的，在线播放是引用了videojs，html中的JS我们全部引用的是别人CDN的镜像文件，你也可以下载到本地放到static文件夹中的JS文件夹中，我会提供源码作为参考，这里不做过多的说明，接下来我们就可以输出给页面实现进行点击播放：

好了，由于时间关系，今天就讲到这里，这篇实现了获取真实视频地址并实现在线播放，下篇会讲实现m3u8的下载并使用ffmpeg将多个ts文件合并成为web支持的MP4视频文件，敬请期待！

需要源码的童鞋请关注公众号回复：韩剧播放

江湖不说再见，咱们下篇见！

关注公众号，超越平凡才能成就自己

【本文地址】

公司简介

联系我们