【花师小哲】当代炼金术（神经网络）前沿（15）——检测文本是否来源于GPT

2023-02-23 14:37 作者:花师小哲-中二 0人读过 | 我要投稿

这篇专栏我们来看这篇论文：

这篇也被很多文章介绍过了，这是检测一段文本是否是大语言模型生成的模型。为什么现在才讲这一篇呢？主要是这种论文我一般都是直接过滤掉的（后面会讲为什么），然而机缘巧合下稍微了解了一下内容，感觉挺有意思的，于是打算讲一下。

1.为什么会过滤掉这类论文

我们发现，不管是之前的Diffusion还是当今的ChatGPT，在它们火爆后很快就会有一些检测程序出现。

如果让我做一个简单的检测程序，我会怎么做呢？其实做法非常简单，我只要写一个二分类神经网络或随便调用个别的什么分类器就可以了，然后收集一些模型生成的内容和一些真实的内容，训练一下程序就搞完了。整个过程也不需要大模型和大训练，能保证基本有用就行了。这样的做法非常简单，还能蹭到热度，做这类东西的人当然会多。

所以这类文章往往非常没意思。

当然，既然讲这一篇，那就说明这一篇它并不是这样做的，他甚至不需要额外训练模型，除了一些数学运算之外，需要做的事情只有一件——用魔法打败魔法！

2.用魔法打败魔法

其实用魔法打败魔法也算是传统艺能了。

例如有一个模型是set transformer。transformer一般是需要位置编码的，而set transformer想做一个位置无关的transformer，它是怎么做的呢？答案就是使用魔法，没错，set transformer把transformer们以某种方式拼起来就做出set transformer了（具体不多透露）。

这篇文章的思想也是这样，直接用大模型来检测大模型，甚至都不需要微调和prompt，直接用zero-shot（简单来说就是开箱即用，不需要任何额外调教）

3.唬人的概念

这篇文章最唬人的一句话应该就是这句了：LLM tends to occupy negative curvature regions of the model's log probability function（大模型倾向于占据模型的对数概率函数的负曲率区域），虽然有配图，但一上来确实不太好理解：