广东某医院用AI配图论文被撤稿，作者：无力支付高昂费用

发布于 2024-07-25 · 浏览 4.5 万 · IP 日本日本

事件回顾

7月12日,由广东省水电医院研究人员撰写的一篇论文” Assessment of the efficacy of alkaline water in conjunction with conventional medication for the treatment of chronic gouty arthritis: A randomized controlled study”在社交媒体上引起关注后被撤稿。该论文发表在《Medicine》杂志上,宣称碱性水可以减轻慢性痛风性关节炎的疼痛和症状。然而,有人对论文数据的完整性和一个不准确的图表提出质疑,导致该文最终被撤稿。

这一事件让人联想到之前另一篇论文因包含AI生成的大阴茎老鼠图像而被撤稿。在这篇关于痛风的论文中,同样出现了解剖结构不正确的图表。作者承认使用ChatGPT制作了该图表。

研究员Morgan Pfiffner在度假时首先注意到这项研究,并在社交媒体上发布了有关文章中错误图表的信息。Pfiffner表示,他本打算回来后再通知期刊,但那张图实在太荒谬了,忍不住在社交媒体上分享。另一位网友发现,论文的引言100%是由AI生成的。

Elisabeth Bik和Thomas Kesteman等人在PubPeer上回应了Pfiffner的担忧。Bik指出,图4中下肢和上肢的骨头数量错误,并且有一些无意义的标签。她还指出数据存在不一致,以及看似不切实际的方法。Kesteman强调了其他问题:文章中的一些参考文献在PubMed或Google Scholar中找不到,作者使用的是非机构电子邮件地址。此外,一些统计分析的结果"几乎不可能",表格中有关疼痛评分的数据"呈现出现实生活中不可能找到的模式"。

论文通讯作者Yong Wu告诉Retraction Watch,英语不是研究团队的第一语言,翻译成本高得令人望而却步。因此,他们求助于AI进行文本翻译和润色。同样,科学插图的费用也超出了他们的承受范围,这使他们不得不使用ChatGPT生成研究图表。Yong Wu为此可能引起的任何争议道歉。

Pfiffner认为,AI生成的图表只是这项研究中存在的学术不端行为的冰山一角。

讨论与启发

之前也跟各位就AI写作话题展开过讨论：用ChatGPT写了16篇论文，成功发了5篇！如何看待？

此事件中除了AI配图，也包含了很多其他甚至更严重的问题：AI生成引言；论文前后数据不一致；实验方法不切实际；参考文献不存在；统计结果明显异常, 部分数据完全不可能出现。

先说AI配图，通常用于解释机制原理需要配示意图，笔者之前用ChatGPT也尝试过生成图片，因为生成的图片足够荒唐（不仅缺乏准确性，而且会附带有无法直接抹除的文字标签），所以从没有考虑过将其放入论文中使用。目前ChatGPT并不能直接生成满意的插图。

虽然这篇撤稿的文章使用了AI配图，但笔者认为这并不代表凡是AI参与生成的图片都不能使用。要想使用AI配图，首先得确认图片的合理性与准确性，在此基础上，用图片编辑软件删除无意义标签。最后，在图注里最好补一段声明（例如：Illustrations were generated by ChatGPT 4.0; https://chat.openai.com/），大方承认在图片制作过程中使用了某AI并附上链接。那位发表16篇论文的博士也是首先承认自己使用了AI，这也成了主编同意发表的一个重要因素。

AI生成引言。笔者认为AI可以基于某个现有的初稿进行润色改善，但是无中生有还是欠缺能力的。正所谓“巧妇难为无米之炊”。AI虽然博学，但并不精通。对于某些细分领域，如果全部交给AI，会发现他能一本正经的胡说八道。论文的Introduction部分还是需要专业人士基于自己专业见解查询参考文献脚踏实地的完成。如果对自己的英文语言不自信，这个时候只要意思表达到位，借助AI工具完成翻译或者润色是完全没问题的。

详细教程可参考：

初探Claude与GPT4.0的对比：润色与中译英

一个指令，让chatGPT给你润色英文段落结构和句子逻辑！

【做科研的大师兄】写不出英文SCI？一个指令，让chatGPT给你中译英到发表水平！

论文前后数据不一致。除了作者，处理编辑和审稿人都没发现这问题只有两种可能。()(1) 杂志的同行评审受到无脑操纵；(2) 杂志的编辑和审稿人都不仔细。

实验方法不切实际。这不用多说，AI是容易对于未知的专业细分领域进行“胡说八道”。

参考文献不存在。这个问题之前也曾深度讨论过（初探Claude与GPT4.0的对比：查找高匹配参考文献）。ChatGPT需要配合插件才能生成真实存在的参考文献，Claude Pro虽然其学术性专业性强，但也会生成编造的文献。即使采取一些限制措施后（关于claude pro在检索高匹配参考文献上的误区与使用更新），使用者也需要再三核查文献的真实性。

统计结果明显异常。这个问题其实与AI关联不大，原始数据合理编造后再计算统计结果尚且不太可能被发现明显异常。这类二次计算结果，如果直接信手编造，非专业人士都能一眼假。

作者声明翻译成本和制作图表价格令人望而却步，据笔者认知，可能这两样加起来不足版面费的一半？

论文投稿写作-偶尔话题系列

最后编辑于 2024-07-25 · 浏览 4.5 万

46 50 36

广东某医院用AI配图论文被撤稿，作者：无力支付高昂费用

全部讨论（0）