网络论坛REDDIT宣布起诉AI公司Perplexity等未经授权抓取数据训练人工智能模型

#人工智能网络论坛 Reddit 宣布起诉 AI 公司 Perplexity 等未经授权抓取数据训练人工智能模型，还有三家被起诉的是专门抓取数据卖给 AI 公司的数据提供商。有趣的是 Perplexity 一方面表示没有使用 Reddit 数据，另一方面其机器人还在继续引用来自 Reddit 的内容，所以数据哪来的呢？查看全文：https://ourl.co/110983

知名互联网论坛 Reddit 日前宣布对 Perplexity、SerApi、OxyLabs、AWMProxy 等公司提起法律诉讼，指控这些公司未经允许抓取 Reddit 论坛上的数据并进行非法使用。

此前 Reddit 已经起诉 Claude AI 模型开发商 Anthropic 指控后者未经授权抓取数据训练 AI 模型，对 Reddit 来说现在其海量帖子和用户数据就是最宝贵的财富，这可以出售给 AI 公司用来训练模型。

Perplexity 抓取数据主要是为了训练自己的人工智能模型，其他三家公司则侧重于抓取数据出售给其他 AI 公司，这也算是另类互联网掮客，通过各种技术手段突破网站限制非法抓取数据，然后再将其出售给 AI 公司。

另外 Perplexity 还被发现不遵守 robots.txt 协议，也就是即便网站在文件中明确说明禁止其爬虫抓取，也会被 Perplexity 的爬虫忽略并继续抓取数据，robots.txt 属于君子协定。

目前 Reddit 已经向 Perplexity 发出停止令，要求后者停止未经授权抓取 Reddit 论坛中的任意内容，不过 Perplexity 称并未使用 Reddit 数据，但测试显示 Perplexity 的聊天机器人回答中仍然会继续引用 Reddit 的内容，显然 Perplexity 在说谎。

不过 Perplexity 也给出自己的回应：Perplexity 尚未收到诉讼通知，但我们将始终积极争取用户自由、公平获取公共知识的权利。我们始终秉承原则和负责任的态度，利用精准的人工智能提供事实回答，绝不容忍任何威胁开放性和公共利益的行为。

山外的鸭子哥

蓝点网站长，如果发现本文存在错误或错别字，欢迎在评论区留言，收到消息后我将及时修改。其他事宜请点击本站任意页面底部的「与我们联系」获取邮箱。

2.44W785.37M1.65W10.42M￥30