万方查重新动向:AI生成图片也能查了

2026-05-30 09:29:05   来源:cnwanfangdata.com   阅读时间:约6分钟

近期,万方数据在学术诚信上有了技术上的进步,其最新发布的检测报告里,“多模态AIGC检测”成了行业关注的焦点。以前只对文本内容查重,可现在这一新现象,就指出了学术论文里一个常被忽略的“灰色地带”,也就是AI生成的图片和数据图表。

7b0fdad3-cf5b-45ee-98f3-89f731d2868b.png

       医学、理工科和社会科学领域研究者,这可真是个非常重要的信号,医学、理工科和社会科学领域的研究者,这可是个非常重要的信号。以前,很多作者会借助Midjourney、Stable Diffusion这类工具来生成论文配图,或者用AI代码对数据做可视化处理,觉得只要文字过关,图片的来源就不需要考虑了。不过,这次万方的技术,这表明检测范围从“文字语义”扩展到“视觉指纹”以及“数据结构”。换句话说,靠文本降重技巧,很难达到当前合规要求,所以,想用AI生成虚假实验数据图或者未经处理的AI绘图来蒙混过关的行为,都可能在“多模态检测”下被暴露无遗。

一、AI绘图的“隐形陷阱”

       AI生成的图片会成为新的风险点,这是视觉上的,AI生成的图片是真实的,人类视觉上也是真实的,所以AI生成的图片会成为新的风险点。AI绘图工具运行时,其工作原理就是生成图像,所以AI绘图工具的工作原理就形成了。不管是扩散模型还是GAN网络,它们生成的图像,一般都会有“数字指纹”或者“统计特征”,这是图像生成模型里很常见的一种现象。人眼不太清楚,可检测算法要是有大量训练数据,这些特征就会“身份证”,是独一无二的。

       在学术投稿里,很多案例都存在,作者在文字部分被精心修改,可最终,评审专家会质疑数据的真实性,这可能是由于示意图太完美,或者明显是AI风格,所以被质疑。万方的多模态检测,其目的是解决这一漏洞,可识别图像生成方式,还能判断其是否符合学术研究原始数据规范。

二、实用避坑与合规建议

       日常生活中,有些避坑的陷阱,也有合规的建议,这些都是实用的避坑与合规建议。

       研究者得先搞清楚趋势的特征,之后再依着这些特征来应对新趋势。首先,这点是核心,不能靠AI伪造实验数据,也不能生成虚假实验结果图。这可就是学术造假的底线,不管技术怎么伪装,一旦被多模态检测识别,后果就和文本一样严重。

       另外,若是有绘图场景,像机制示意图、概念模型图之类的,那就可以采取以下措施

       在深度后期处理的时候,不能简单地把AI生成的原图直接用上,这会违反AI生成原图的使用规范,所以深度后期处理时不能直接使用AI生成的原图。导出成矢量格式之后,再在专业绘图软件里手动对节点加以调整,修改配色方案,增加手绘风格的细节,如此一来就能打破AI生成的“机械感”和“完美对称性”。

       在图注里,标注来源得由AI辅助生成,所以在图注里,得明确说明,像“图示模型由AI辅助绘制,核心逻辑经人工校对”这样的例子。

       在数据可视化图表里,要是底层数据是真实的、可追溯的,那数据的验证就相当重要。AI可被视作绘图工具使用,不能当作数据来源使用。

三、拥抱技术,坚守底线

       这次推动多模态AIGC检测,不是想“刁难”作者,而是想引导学术界更健康地运用AI技术。AI是个多能的辅助工具,它能高效地处理数据,还能直观地呈现研究成果,不过,AI的核心得建立在真实、可信的基础上。

       科研人员和学生把焦虑点放在“能否查出来”上,这就是把精力放在如何利用AI来提高研究质量上。举个例子,用AI来筛选文献、清洗数据、润色语言,这些都是合规且高效的用法。关键就是搞清楚“辅助”和“替代”的界限,使最终的学术成果里,人的思考和判断一直是主导因素。

万方论文查重:https://www.cnwanfangdata.com

关键字:  万方查重    学术合规    AI图片检测    多模态检测   
本文【万方查重新动向:AI生成图片也能查了】链接地址为: https://www.cnwanfangdata.com/news/264.html

本网站部分文章转载自互联网以及作者的分享,如本网站所引用的文章涉及著作权问题, 请您及时通知本站,我们将及时妥善处理。