知乎已经完全禁止谷歌和必应搜索抓取内容 看起来真怕内容被训练AI? – 蓝点网 您所在的位置:网站首页 知乎APP下载链接 知乎已经完全禁止谷歌和必应搜索抓取内容 看起来真怕内容被训练AI? – 蓝点网

知乎已经完全禁止谷歌和必应搜索抓取内容 看起来真怕内容被训练AI? – 蓝点网

2024-06-01 20:17| 来源: 网络整理| 查看: 265

昨天蓝点网提到知乎开始强制要求登录账号,否则将禁止查看知乎问答和专栏的完整内容,之前通过脚本屏蔽知乎登录弹窗已经没有意义,因为屏蔽弹窗后要查看内容还是会继续弹出登录窗口。

为什么要强制用户登录暂时还不清楚,考虑到知乎在搜索引擎中的权重非常高,各大搜索引擎检索问题时都可能看到排在前面的知乎页面,强制登录将对大量用户造成影响。

一个可能的原因是知乎不愿意自己的内容被各大搜索引擎或其他爬虫抓取拿去训练 AI 模型,现在强制登录后想要限制抓取在技术手段上是非常容易的,比如某个用户短时间内访问大量页面,那肯定是不正常的。

知乎已经完全禁止谷歌和必应搜索抓取内容 看起来真怕内容被训练AI?

还禁止谷歌和必应等搜索引擎:

值得注意的是,今天早上蓝点网接到网友的反馈,知乎 robots.txt 文件已经在 4~5 月某个时候修改(具体时间可能是 5 月 22 日,与知乎强制登录时间近似),此次修改知乎仅允许百度搜索和搜狗(搜狗是新增的,之前禁止搜狗抓取内容)抓取其内容,不再允许其他搜索引擎内容。

知乎在几年前曾与百度达成合作因此在百度搜索中知乎的页面权重非常高可以获得更多点击量,现在只允许百度和搜狗而禁止其他一切搜索引擎,不知道知乎是否已经与百度达成了某些方面的协议。

目前的这种状况是用户在知乎发布的任何新内容,都不会被谷歌和必应收录了,也就是知乎所有新内容在谷歌和必应上都无法再查到。

大概率还是 AI 训练问题:

无论是强制登录还是禁止搜索引擎抓取内容,这些操作看起来都非常像是知乎为了避免自己的内容被抓取而拿去训练人工智能,这和之前埃隆马斯克对 X/Twitter 的操作本质上也就是类似的。

对于大型内容网站来说趁着 AI 热潮卖数据确实是个比较不错的变现方式,但禁止抓取也意味着开放的互联网正在逐渐走向封闭。

未来可能会有更多网站禁止搜索引擎或其他爬虫抓取内容甚至也同样强制要求登录,对互联网用户来说这肯定不是一个好消息。

附知乎此前的 robots.txt 文件:(2024-04-28)

User-agent: Googlebot Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Googlebot-Image Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider-news Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider-render Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider-image Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: bingbot Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-Agent: * Disallow: /

最新的 robots.txt 文件(2024-05-27):

User-agent: Baiduspider-news Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider-render Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Baiduspider-image Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /search-special Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-agent: Sogou web spider Disallow: /appview/ Disallow: /login Disallow: /logout Disallow: /resetpassword Disallow: /terms Disallow: /search Allow: /tardis/sogou/ Disallow: /notifications Disallow: /settings Disallow: /inbox Disallow: /admin_inbox Disallow: /*?guide* User-Agent: * Disallow: /

感谢网友 颜黎明 投递的消息



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有