微博爬虫找人 您所在的位置:网站首页 怎么找一个人的微博 微博爬虫找人

微博爬虫找人

2024-05-26 13:51| 来源: 网络整理| 查看: 265

        假设一个场景:你认识一个人,你知道他的一些爱好,据此你想推测出他的微博账号?有可能么?

        有的。

        比如你知道此人从东吴大学毕业,他在大屋顶做过一段时间的实习。那么他极有可能微博帐户关注了东吴大学和大屋顶文化。根据这个推断,他即是东吴大学的微博粉丝,也是大屋顶文化的微博粉丝。你需要做的就是爬取这两个微博号的关注粉丝。你有关于他的信息越多,你越可能找到他的微博号——两个微博号的粉丝交集失败,多个微博号的粉丝交集存在的概率大很多。

        如何实现?先进入一个微博号的网站,如:https://weibo.com/6062684858/fans。检查元素(其中一个粉丝号)。你会发现它所在的位置为天空云飞高55,其中天空云高飞55就是大屋顶文化的一个粉丝名字信息,你可以使用BeautifulSoup获取一页网站的粉丝名字:soup.find_all('a',attrs={"class":"S_txt1"})。微博的粉丝信息通过json载入,所以麻烦很多。你需要将json的信息加载后再通过beautifulsoup获取tag。详见代码。json信息的加载请看https://github.com/Mannix1994/FindYou大神的介绍。

        获取粉丝列表result和other_result,转为set取集合即可获得他的微博号。理论上可实现,但是微博的api现在只开放前五页的粉丝信息(粉丝信息具有极大的商业价值)。所以你并不能获得一个微博号的所有粉丝名字,就此作罢。

        但你只要想的浪漫些,比如你最近关注了两个微博号,你想知道谁和你一样在最近也关注了这两个微博号,想和他交个朋友,那这个程序还是能实现的,哈哈😄!

        把一个失败的作品放上来,因为喜欢这个思路:取粉丝的交集找人,可感受到爬虫的价值。初心,也是想找某个微博号看看近况。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有