欢迎光临散文网 会员登陆 & 注册

Journalism Guided Adversarially Robust Detection of AI-generated

2023-10-13 20:36 作者:三月phanta  | 我要投稿
  • Title: J-Guard: Journalism Guided Adversarially Robust Detection of AI-generated News (J-Guard: 新闻引导的对抗鲁棒性检测AI生成新闻)

  • Keywords: AI-generated news, adversarial robustness, journalism, detection, stylistic cues (AI生成新闻, 对抗鲁棒性, 新闻, 检测, 文体线索)


论文简要 :

  • 本研究提出了一种名为J-Guard的框架,通过引入新闻领域的文体线索,增强了现有的AI文本检测器对AI生成新闻的检测能力,并提高了对对抗攻击的鲁棒性,实验结果表明,在面对对抗攻击时,J-Guard的性能下降平均仅为7%。

背景信息:

  • 论文背景: 近年来,基于转换器的生成模型的快速发展极大地提升了先进对话型AI的自然语言生成能力,其中包括ChatGPT和BARD等。然而,这些AI工具的公开使用存在潜在的滥用风险,恶意行为者可以利用这些模型传播虚假信息,特别是生成虚假新闻文章,对信息生态系统造成严重破坏。

  • 过去方案: 过去的研究已经在检测AI生成文本方面取得了一些进展,但大多数方法并没有专门针对AI生成新闻进行研究。现有的通用AI文本检测器在检测AI生成新闻方面存在一些挑战,因为新闻文章具有独特的写作风格和特点,应用通用的AI文本检测方法可能会产生误报,损害新闻机构的声誉。

  • 论文的Motivation: 鉴于AI生成新闻的潜在威胁和现有方法的局限性,本研究旨在开发一种能够检测AI生成新闻并提高对对抗攻击鲁棒性的框架。通过结合新闻领域的文体线索,我们可以有效区分真实的新闻和AI生成的新闻文章。实验结果表明,J-Guard在面对各种AI模型生成的新闻文章时具有良好的检测能力,并在面对对抗攻击时仍然保持较高的鲁棒性。


方法:

  • a. 理论背景:

    • 本文介绍了一个由跨学科团队开发的框架J-Guard,用于检测AI生成的新闻文章并增强对抗性鲁棒性。J-Guard结合了受新闻属性启发的文体线索,以区分真实世界的新闻报道和AI生成的新闻。实验结果表明,J-Guard在检测AI生成的新闻时具有很高的效果,并且在面对对抗性攻击时性能下降很小。

  • b. 技术路线:

    • J-Guard框架由两个主要组件组成:基础AI文本检测器和新闻指导组件。基础AI文本检测器是一个预训练的变压器编码器堆栈,用于学习输入新闻文章的语义表示。新闻指导组件将辅助新闻线索注入到检测流程中,将基础检测器转变为AI生成的新闻检测器。最终的隐藏向量表示特殊标记[CLS]被用作检测AI生成的新闻的特征向量。

结果:

  • a. 详细的实验设置:

    • 实验使用了一个名为TuringBench的数据集进行验证,该数据集包含了人工撰写的新闻文章和来自各种PLM的AI生成的新闻。使用逻辑回归和词袋模型以及Word2Vec特征的基线分类器来评估新闻特征的质量。将J-Guard框架与基于最先进的PLM的AI生成文本检测方法进行了比较。

  • b. 详细的实验结果:

    • 实验结果旨在回答两个研究问题:确定新闻特征是否增强了对AI生成新闻的检测,以及它们是否增强了对AI生成新闻检测的对抗性鲁棒性。实验结果表明,J-Guard框架在检测AI生成的新闻方面具有很高的准确性,并且在面对对抗性攻击时具有较好的鲁棒性。

Note:


Journalism Guided Adversarially Robust Detection of AI-generated的评论 (共 条)

分享到微博请遵守国家法律