逾五分之一的 CS 论文可能含有 AI 内容
一项研究发现,《Nature Human Behaviour》期刊上的数据显示,约22%的计算机科学论文可能包含AI生成内容。研究人员分析了2020至2024年间逾百万篇论文和预印本,重点关注摘要和引言部分,并识别出常见于AI生成文本的高频词汇。结果显示,在计算机科学领域中,大模型修改文本的现象更为普遍。 2025-8-4 14:18:55 Author: www.solidot.org(查看原文) 阅读量:8 收藏

根据发表在《Nature Human Behaviour》期刊上的一项研究,22% 的 CS 论文可能含有 AI 生成内容。研究分析了 2020-2024 年之间发表的逾百万篇论文和预印本,主要集中在摘要和引言上,寻找常见于 AI 生成文本的高频词汇如“regenerate response”或“my knowledge cutoff”,以及 pivotal、intricate 和 showcase 等 AI 更可能使用而人类不太可能用的单词。研究人员称,在 CS 等领域,大模型修改文本的痕迹更为普遍。分析显示,在 2022 年 11 月 ChatGPT 发布后仅几个月时间,大模型修改内容的数量就急剧上升。最接近 AI 的领域,大模型使用的比例越高。到 2024 年 9 月,22.5% 的 CS 论文摘要存在大模型修改的证据,电气系统和工程学论文紧随其后,而数学论文摘要使用大模型修改的比例只有 7.7%。生物医学和物理学等的比例也相对较小。研究人员认为实际比例可能更高,因为论文作者可能会有意删除大模型的高频词汇,比如 delve 在 ChatGPT 诞生之后使用频率大幅提升,但在它成为 AI 生成文本的公认标志之后,使用率又逐渐下降。

www.science.org/content/article/one-fifth-computer-science-papers-may-include-ai-content


文章来源: https://www.solidot.org/story?sid=81962
如有侵权请联系:admin#unsafe.sh