python爬虫入门篇 您所在的位置:网站首页 爬虫网站源码 python爬虫入门篇

python爬虫入门篇

2022-05-16 06:15| 来源: 网络整理| 查看: 265

需求: 爬取用户输入网站的源代码,并导入到本地文件中. 实现思路: 利用python的urllib模块,打开网址读取源代码,然后在本地创建文件,将读取的代码写入.

import urllib.request def grab(url): # 打开传入的网址 resp = urllib.request.urlopen(url) # 读取网页源码内容 data = resp .read() # 输入存储文件名 name = input("请定义文件名") # 打开文件 file_name = open(name, "wb") # 将代码写入文件 file_name.write(data) # 关闭文件 file_name.close() print("下载源码完成") if __name__ == '__main__': # 按照格式输入网址 web_addr = input("请输入你要抓取的网址(例如http://www.baidu.com/):") try: grab(web_addr) except: print("网址输入有误")


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有