爬取了同事的微博粉丝,结果发现300+涨粉中,真爱粉只有4个! 您所在的位置:网站首页 微博粉丝涨粉规则是什么意思 爬取了同事的微博粉丝,结果发现300+涨粉中,真爱粉只有4个!

爬取了同事的微博粉丝,结果发现300+涨粉中,真爱粉只有4个!

2024-07-14 17:30| 来源: 网络整理| 查看: 265

事情是这样的,同事小A说他最近微博涨粉老快了,但是自己还是和以前一样就偶尔发发动态,看看新闻吃吃瓜,也没买啥涨粉包之类的。

小A说这话的时候稍显淡定,但是小一清楚的看到小A的嘴角微微上扬,不禁撇了撇嘴。

可能是以为我不信他最近涨粉老快这件事,小A随后发来了这张图:

好家伙,他总共粉丝才几百人,这七天就涨了一百多,微博涨粉这么容易的?

要不我也换个阵地试试?这速度比小一现在的公众号涨粉快多了。【撇嘴】

这个时候小A又补了一句:“这只是近七天的,之前一周的更多呢!“说完这话,小A就转过身去了。

这家伙在炫耀!绝对是!

话说微博小一也有在玩,但是确实很少涨粉,粉丝基本都是一些认识的朋友,除非是:

僵尸粉!

其实小A也怀疑自己突然多的粉丝可能是僵尸粉,但是一个一个去检查似乎有点浪费时间。

于是在小A的请求下便有了下面的故事

强烈建议下面步骤在征得同事的同意下进行,不然可能会被打

获取粉丝数据

小一之前也写过微博的爬虫,大概爬了几十万条的土味情话和一些gif图,所以大概知道获取微博粉丝列表应该这样做:

获取用户的总粉丝数,计算运行次数解析每页的粉丝列表,获取粉丝数据通过粉丝uid构造粉丝主页链接url爬取粉丝的详细数据

要检测粉丝到底是不是僵尸粉,可以通过粉丝的粉丝数量、微博动态数这些数据

但是好像不够全面,所以在上面第④步小一获取每个粉丝的详细数据,例如简介、签名、性别等,其中最重要的是获取到该粉丝最近一次的发博情况。

这里面会用到两个链接,一个是微博用户主页信息的链接,一个是粉丝翻页链接,分别如下:

用户主页信息url:

url_master = "https://m.weibo.cn/profile/info?uid=" + uid

粉丝翻页url:

url_fans = "https://m.weibo.cn/api/container/getIndex?containerid=231051_-_fans_-_{0}&since_id={1}".format(uid, index)

注意:

uid是微博中每个用户默认的id唯一编号,我用的是小A的uid,在他的微博主页拿到的。

翻页的时候因为是一页默认20个粉丝,所以index应该是0、20、40这样子的

流程不难,篇幅有点多,所以就不贴具体的实现函数了,你可以在后台回复“微博粉丝”获取所有源码。

大致的主函数代码如下:

if __name__ == '__main__': uid = '用户uid' """获取详情数据""" master_info = get_master_info(uids=uid) print("用户id:{0},发博数:{1},关注{2}人,拥有粉丝{3}人".format( uid, master_info['statuses_count'], master_info['follow_count'], master_info['followers_count'])) """设置最大页数""" fans_count = master_info['followers_count'] # 由于当page大于250时就已经无法得到内容了,所以要设置最大页数为250 max_page = fans_count//20 + 1 if fans_count


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有