Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习 | 您所在的位置:网站首页 › python爬取pdf › Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习 |
Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习
互联网 2021/4/30 22:25:38 标签: 爬取 安装 url python 转换器 wkhtmltopdf PDFKit 博文 hello,大家好,我是wangzirui32,今天我们来学习如何爬取CSDN博文之后还通过pdfkit转换为PDF方便学习。 学习目录 1. pdfkit安装及配置2. 编写代码1. pdfkit安装及配置 首先,在cmd中输入: pip install pdfkit安装完成后,我们需要再次安装一个转换器,链接https://wkht…![]() hello,大家好,我是wangzirui32,今天我们来学习如何爬取CSDN博文之后还通过pdfkit转换为PDF方便学习。 学习目录 1. pdfkit安装及配置2. 编写代码 1. pdfkit安装及配置首先,在cmd中输入: pip install pdfkit安装完成后,我们需要再次安装一个转换器,链接https://wkhtmltopdf.org/downloads.html,如图下载: 这里我以一篇博文为例,代码如下: import pdfkit # 博文url url = "https://blog.csdn.net/wangzirui32/article/details/116066478" # 转换器路径 path_wkthmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe' # 配置转换器 config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf) # 根据url生成PDF pdfkit.from_url(url, "Git安装使用.pdf", configuration=config)运行代码,等待一会,可以看见项目文件夹出现了Git安装使用.pdf,使用浏览器打开,显示: 好了,今天的课程就到这里了,喜欢的可以点个收藏和关注,我是wangzirui32,我们下次再见! ![]() 本站文章仅代表作者观点,不代表本站立场,所有文章非营利性免费分享。 本站提供了软件编程、网站开发技术、服务器运维、人工智能等等IT技术文章,希望广大程序员努力学习,让我们用科技改变世界。 [Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习]http://www.zyiz.net/tech/detail-165273.html 赞(0) 相关文章 更多> 2022-03-20三、python数据类型与基础语法 2022-03-19(Python Note) 11 对角线图 2022-03-19python list 列表 2022-03-19Python:批量保存好看的图片到本地,爱了吗? 2022-03-19python开发之正则表达式 2022-03-19摆放家具python版 2022-03-1920213426 2021-2022-2 《Python程序设计》实验一报告 2022-03-198个Python数据清洗代码,学起来~ 2022-03-19手把手带你学python自动化测试(七)——Cookie 处理 2022-03-19python selenium自动化测试模块 |
CopyRight 2018-2019 实验室设备网 版权所有 |