根据《自然》杂志去年对全球1600名研究人员的调查,68%的受访者认为生成式人工智能工具将使抄袭变得更容易且更难检测。
文章指出,生成式人工智能工具如ChatGPT基于大语言模型,通过学习大量已发表的文本生成新内容。这种方式可能导致类似抄袭的情况,例如研究人员将生成式人工智能工具生成的文本当作自己的作品,或者生成的文本与某人的作品非常相似却未注明来源。
文章提出一个核心问题:使用完全由机器(而不是人类)编写的未注明来源的内容是否算抄袭。
一些研究机构将未经授权使用生成式人工智能工具定义为“未经授权内容生成”,而非传统意义上的抄袭。德国柏林应用科技大学的德博拉·韦伯-伍尔夫教授认为,传统意义上的抄袭通常指可归因于另一个具体作者的内容。
也有一些人认为,生成式人工智能工具侵犯了版权。抄袭和侵犯版权都是对他人作品的不当使用,而抄袭违反了学术道德,未经授权使用受版权保护的作品则可能违反法律。“毕竟,这些人工智能系统是建立在数百万甚至数亿人的工作之上的。”美国密歇根大学计算机专家拉达·米哈尔恰说。
文章还指出,尽管存在争议,生成式人工智能工具在学术写作中的使用量仍在增加。一项研究显示,2024年上半年,至少10%的生物医学论文摘要使用了大语言模型。人工智能工具不仅简化了写作过程,还能帮助非英语母语的研究人员克服语言障碍。
专家呼吁制定更明确的政策和指导,以规范人工智能工具在学术写作中的使用,确保学术诚信。