Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习 您所在的位置:网站首页 python爬取pdf Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习

Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习

#Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习| 来源: 网络整理| 查看: 265

Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习

互联网 2021/4/30 22:25:38

标签: 爬取 安装 url python 转换器 wkhtmltopdf PDFKit 博文 hello,大家好,我是wangzirui32,今天我们来学习如何爬取CSDN博文之后还通过pdfkit转换为PDF方便学习。 学习目录 1. pdfkit安装及配置2. 编写代码1. pdfkit安装及配置 首先,在cmd中输入: pip install pdfkit安装完成后,我们需要再次安装一个转换器,链接https://wkht…

hello,大家好,我是wangzirui32,今天我们来学习如何爬取CSDN博文之后还通过pdfkit转换为PDF方便学习。

学习目录 1. pdfkit安装及配置2. 编写代码

1. pdfkit安装及配置

首先,在cmd中输入:

pip install pdfkit

安装完成后,我们需要再次安装一个转换器,链接https://wkhtmltopdf.org/downloads.html,如图下载: 下载页面 下载完成后,打开下载的exe安装程序,按图操作: 所有选项全部默认,只需要一直点下一步即可。 安装接下来,需要找到转换器的路径,在笔者的电脑中,路径为C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe,如图: 位置

2. 编写代码

这里我以一篇博文为例,代码如下:

import pdfkit # 博文url url = "https://blog.csdn.net/wangzirui32/article/details/116066478" # 转换器路径 path_wkthmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe' # 配置转换器 config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf) # 根据url生成PDF pdfkit.from_url(url, "Git安装使用.pdf", configuration=config)

运行代码,等待一会,可以看见项目文件夹出现了Git安装使用.pdf,使用浏览器打开,显示: 结果展示 (有些内容可能没有正确显示,但结果也还是真不戳)

好了,今天的课程就到这里了,喜欢的可以点个收藏和关注,我是wangzirui32,我们下次再见!

随时随地学软件编程-关注百度小程序和微信小程序 关于找一找教程网

本站文章仅代表作者观点,不代表本站立场,所有文章非营利性免费分享。 本站提供了软件编程、网站开发技术、服务器运维、人工智能等等IT技术文章,希望广大程序员努力学习,让我们用科技改变世界。 [Python网络爬虫:爬取CSDN博文 并通过pdfkit转换为PDF方便学习]http://www.zyiz.net/tech/detail-165273.html

赞(0) 相关文章 更多> 2022-03-20三、python数据类型与基础语法 2022-03-19(Python Note) 11 对角线图 2022-03-19python list 列表 2022-03-19Python:批量保存好看的图片到本地,爱了吗? 2022-03-19python开发之正则表达式 2022-03-19摆放家具python版 2022-03-1920213426 2021-2022-2 《Python程序设计》实验一报告 2022-03-198个Python数据清洗代码,学起来~ 2022-03-19手把手带你学python自动化测试(七)——Cookie 处理 2022-03-19python selenium自动化测试模块


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有