Reddit 将屏蔽互联网档案馆抓取其内容
Reddit与Google等公司合作出售用户生成内容用于AI训练,并限制其他AI公司抓取其内容。发现部分公司通过互联网档案馆的Wayback Machine绕过限制后,Reddit决定屏蔽该机构的爬虫索引功能,仅允许访问其主页。 2025-8-12 07:17:45 Author: www.solidot.org(查看原文) 阅读量:0 收藏

solidot新版网站常见问题,请点击这里查看。

Reddit 将屏蔽互联网档案馆抓取其内容

人工智能

Edwards (42866)发表于 2025年08月12日 15时17分 星期二

来自流星追逐记

Reddit 与 Google 等公司签署了协议,将其用户生成的内容出售给 Google 等公司训练 AI,它限制了其它 AI 公司抓取其内容。但现在 Reddit 发现部分 AI 公司改从互联网馆的 Wayback Machine 抓取 Reddit 的内容,它宣布将阻止互联网档案馆的爬虫索引 Reddit 的大部分内容,Wayback Machine 将只能索引 Reddit.com 主页,无法再获得详细的帖子内容、用户评论等。

tech.slashdot.org/story/25/08/11/1724231/reddit-will-block-the-internet-archive




文章来源: https://www.solidot.org/story?sid=82021
如有侵权请联系:admin#unsafe.sh