Reddit计划封杀谷歌/必应等搜索引擎 防止这些搜索引擎拿数据训练AI
2023-10-23 13:43:13 Author: www.landiannews.com(查看原文) 阅读量:7 收藏

据华盛顿邮报发布的消息,为了防止自己平台的内容被其他公司白嫖,知名网络社区 Reddit 计划在后续封杀谷歌和必应等搜索引擎的爬虫,同时为了防止 OPENAI 等获取 Reddit 论坛的内容,Reddit 还计划要求用户必须登录账号才可以浏览内容。

最近一年因为 AI 问题 Reddit 似乎有些魔怔了,例如之前 Reddit 要求 AI 公司必须与该公司签订协议支付费用才能获取数据进行训练。

Reddit计划封杀谷歌/必应等搜索引擎 防止这些搜索引擎拿数据训练AI

那么怎么防止这些 AI 公司未经授权抓爬数据呢?Reddit 直接调整了 API 接口,结果这也导致大量第三方 Reddit 客户端凉凉,这引起了巨大争议,但 Reddit 最终也没有松口。

现在封杀搜索引擎对 Reddit 来说其实是个大事件,因为 Reddit 很多流量是靠着搜索引擎导流而来的,如果封杀谷歌和必应等搜索引擎,未来 Reddit 上的新内容将无法在网上搜到,那这肯定会导致流量下跌。

针对华盛顿邮报的报道 Reddit 澄清表示没有任何变动,同时向华盛顿邮报发邮件要求他们进行更正。

随后华盛顿邮报也确实添加了更正信息,不过新增信息只变更了要求用户登录才能阅读帖子的部分,但 Reddit 并未否认可能会封杀谷歌和必应等搜索引擎的传闻。

也有匿名人士告诉华盛顿邮报称,Reddit 高管认为即便封杀搜索引擎,Reddit 也可以继续撑下来。言外之意就是流量肯定会下跌,但 Reddit 也决意这么做。

对 Reddit 来说,可能现在靠着 AI 大潮卖数据才是最好的买卖,所以现在不惜毁掉第三方客户端和封杀搜索引擎,冒着流量大跌的风险也要牢牢守住自己的数据。

PS:我觉得 Reddit 可能已经在某些帖子里埋上特定的标识符,后续等各种 AI 产品更新后可以通过测试标识符来判断这些模型是否使用了 Reddit 的数据,如果被判定使用了数据但不是签订 API 合同的客户,那 Reddit 就可以起诉了。(类似做法在国内已经比较流行,主要就是防止竞争对手抓爬数据的。)

版权声明:感谢您的阅读,除非文中已注明来源网站名称或链接,否则均为蓝点网原创内容。转载时请务必注明:来源于蓝点网、标注作者及本文完整链接,谢谢理解。


文章来源: https://www.landiannews.com/archives/100760.html
如有侵权请联系:admin#unsafe.sh