Python 爬取酷我音乐中指定歌手的全部音频 |
您所在的位置:网站首页 › 酷我音乐歌单名称 › Python 爬取酷我音乐中指定歌手的全部音频 |
Python 爬取酷我音乐中指定歌手的全部音频
精选
原创
liubin0505star 2021-11-01 11:20:15 博主文章分类:编程脚本 ©著作权 文章标签 python requests 文章分类 Python 后端开发 ©著作权归作者所有:来自51CTO博客作者liubin0505star的原创作品,请联系作者获取转载授权,否则将追究法律责任本博客内容仅用于 Python 学习与交流。 本次用于学习测试的链接:http://www.kuwo.cn/singer_detail/6070625
使用 Chrome 浏览器打开要测试爬取的链接,在 Chrome 的控制台找要爬取的链接,流程步骤截图分别如下:
1.
最终的脚本内容如下: # -*- coding:utf-8 -*- import os import requests from datetime import datetime # 计划爬取的页面地址:http://www.kuwo.cn/singer_detail/6070625 def crawl_kuwo(): # 获取脚本当前路径,并在当前路径下创建一个时间命名的目录,用于存取爬取的数据,例如:20211027 current_dir = os.path.dirname(os.path.abspath(__file__)) data_dir = current_dir + '/' + datetime.now().strftime('%Y%m%d') if not os.path.exists(data_dir): os.mkdir(data_dir) id_info = {} headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36', 'Cookie': '_ga=GA1.2.1967878765.1635304658; _gid=GA1.2.1837218734.1635304658; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1635304658,1635306817; _gat=1; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1635317148; kw_token=R29LVYBLEKF', 'csrf': 'R29LVYBLEKF', 'Referer': 'http://www.kuwo.cn/singer_detail/6070625' } # 获取要爬取所有页面中音频的 rid 和 name 信息存到 id_info 中 for i in range(1, 33): # 爬取 32 页内容,结合 for 循环生成每一页的 url,其中 pn 表示为页数 url = 'http://www.kuwo.cn/api/www/artist/artistMusic?artistid=6070625&pn={}&rn=30&httpsStatus=1&reqId=936f35c0-36f1-11ec-b1a7-3b714416a17e'.format(i) res = requests.get(url, headers=headers) res_data = res.json()['data']['list'] for r in res_data: id_info[r['rid']] = r['name'] # 根据 rid 信息获取到所有的下载 url 并下载 if id_info: for j in id_info: page_url = 'http://www.kuwo.cn/api/v1/www/music/playUrl?mid={}&type=music&httpsStatus=1&reqId=936f35c0-36f1-11ec-b1a7-3b714416a17e'.format(j) download_info = requests.get(page_url, headers=headers) download_url = download_info.json()['data']['url'] audio_name = data_dir + '/' + id_info[j] + '.mp3' audio_info = requests.get(download_url, headers=headers) with open(audio_name, 'wb') as f: f.write(audio_info.content) print('{}已下载成功'.format(id_info[j])) else: print('{} 信息为空'.format(id_info)) if __name__ == '__main__': crawl_kuwo()上述脚本在 Python 3.8 中测试通过。 赞 收藏 评论 分享 举报上一篇:使用 Python3 脚本给多个人同时发送多个 excel 附件 下一篇:访问指定 Web URL 自动执行命令的 Python 小脚本 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |