全国火车高铁站及车次数据爬虫(内含100W+数据) | 您所在的位置:网站首页 › 高铁次数查询 › 全国火车高铁站及车次数据爬虫(内含100W+数据) |
具体代码丢了 思路如下: 所需工具:Python、VBA、Arcgis、高德地图API数据来源:不记得了,之前爬过盛名火车站的,但是查了下,并不全。数据日期:这里的火车数据更新截止到2018-7月,可能以后还有新的火车站建设,有需要再搞数据总量:100W+吧,没仔细数
在相关网站上把各省各地的火车数据爬取下来,我爬完后是这个样 再通过一段VBA代码整理了一下,变成如下这样 可以具体到各地到各地的火车数据了,要克服的困难有:将上面的数据做成数据透视表的时候 数据透视表会按拼音顺序排列,这样的排列出来的火车数据是错误的,我想到的办法是在 火车车站名前加上1 、2、3这样的数字,便可解决。最后去掉即可 共有将近80W,还是挺多的 有了全国各地到各地的火车数据还不够 我还想把各地到各地的火车数据转化成各市到各市的 这里要用到一个叫Arcgis的地图工具 在这之前需要将各地的火车站转换成高德地图坐标,高德地图API提供了这么一个功能 用Python写一段代码即可实现,自己可以去高德地图开发者平台看看,挺简单的,不写具体的了 完成后如下: 接着在放到Arcgis里面操作 说实话,这个Arcgis自己琢磨了一天才会弄,有点无语,但是挺好用,蛮神奇 这里只列了高铁的数据,高铁的车型号一般为:G D C 以下就是各城市到各城市的高铁数据了 然后就完成了 数据列表如下: 全国火车及高铁车次源数据全部火车车次汇总高铁车次源数据(就是把第一个sheet数据里的G D C车型的给提炼出来)高铁车次汇总城市-城市 的高铁源数据城市-城市 高铁车次汇总各高铁站经纬度(火车站也有)共计应该有100W+吧
11..23更新
12.4更新
19.3.27更新 打算爬今年的数据了,其实不难的,按照步骤一步步来就okay了
|
CopyRight 2018-2019 实验室设备网 版权所有 |