Python爬取国内新冠疫情数据及对其数据提取(2021

您所在的位置:网站首页 吴兴区干部任前公示陈芸 Python爬取国内新冠疫情数据及对其数据提取(2021

Python爬取国内新冠疫情数据及对其数据提取(2021

2024-07-07 23:29:17| 来源: 网络整理| 查看: 265

Python爬取国内新冠疫情数据及对其数据提取

要爬取的网页: https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5.

文章目录 Python爬虫-新冠疫情时实数据1.需要用到的库2.写入数据,保存本地json文件3.爬取国内疫情数据(csv文件保存)4.爬取结果截图(2021.1.20)5.总结

Python爬虫-新冠疫情时实数据

已经到来的2021年虽然没有去年疫情形势的那么严峻,但如今正值寒假期间,疫情还是会有所变化。宅在家的我,见不着好想见的人,唯有拓展其他技能来派遣无聊。

爬取的大致过程是先把爬取的数据以json文件形式保存,再对该文件进行数据分析和提取,并用csv库来展示爬取结果。 1.需要用到的库 import requests import json import csv 2.写入数据,保存本地json文件 # parse_text1.py def parse_txt(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36 QIHU 360EE' } response = requests.get(url, headers=headers) # 发起请求 words = json.loads(response.content) # json字符串转换为Python类型 # 响应对象保存为json格式文件 with open("D:\\py\\feiyan_new.json", "w", encoding='utf-8') as f: f.write(json.dumps(words, indent=2, ensure_ascii=False)) print("保存成功!") if __name__ == "__main__": url = "https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5" parse_txt(url) 3.爬取国内疫情数据(csv文件保存) # -*- Coding: UTF-8 -*- # new_infLast.py # @作者 love_WXD # @创建日期 2021-01-20T21:44:37.668Z+08:00 # @最后修改日期 2021-01-21T00:52:12.308Z+08:00 import json import csv fp = open("D:\\VScode\\py\\新冠数据提取\\feiyan_new.json", "r", encoding='utf-8') fp_read = fp.read() st = json.loads(fp_read) sta = json.loads(st['data']) # 我国疫情总体情况 chinaTotals = "确诊人数: "+str(sta['chinaTotal']['confirm'])+" 疑似人数: " +\ str(sta['chinaTotal']['suspect']) + " 死亡人数:" +\ str(sta['chinaTotal']['dead'])+" 治愈人数: "+str(sta['chinaTotal']['heal']) +\ " 更新日期:"+sta['lastUpdateTime'] print(chinaTotals) # 获取中国各省名称,确诊人数,疑似人数,死亡人数,治愈人数 # 从爬取的信息中提取所需信息 china = sta['areaTree'][0]['children'] csvfile = open("D:\\VScode\\py\\新冠数据提取\\newIlness.csv", 'w', encoding='utf-8', newline='') for i in range(len(china)): writer = csv.writer(csvfile) writer.writerow([china[i]['name']]) # 打印目前为止已知的确诊人数 print(china[i]['name'], '确诊:' + str(china[i]['total']['nowConfirm']), '死亡:' + str(china[i]['total']['dead']), '治愈:' + str(china[i]['total']['heal'])) for city in china[i]['children']: # 写入市的名称,确诊、死亡、治愈的人数 writer = csv.writer(csvfile) writer.writerow([city['name'], '确诊:' + str(city['total']['confirm']), '死亡:' + str(city['total']['dead']), '治愈:' + str(city['total']['heal'])]) print("保存成功!") fp.close() 4.爬取结果截图(2021.1.20)

在这里插入图片描述 在这里插入图片描述

5.总结

经历了前期痛苦的改bug,发现了一个很有意思的现象,就是一个json字符串必须要loads两次才可以。虽然结果是好的,但过程真太曲折啦!尤其是分析json的对象和数组。emm…就到这了,兄弟萌,我要去洗洗睡了。



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭