面向未来的智能对话新体验—Claude2
Anthropic 公司是由OpenAI前研究副总裁带领10名OpenAI前员工于2021年成立的。这里面既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei,可以说是带走了相当一批核心人才。出走成立新公司的原因之一,自然是对OpenAI现状并不满意。 从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。当然,还有一部分原因是这群人想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。Claude目标是成为一个安全、接近人类价值观且合乎道德规范的AI系统。目前(2023年4月)Anthropic目前团队大约80人,融资额超过13亿美元,估值达到41亿美元。Claude是在Anthropic自主研发的大型语言模型Create基础上设计打造而成。Create使用Anthropic自行收集的巨大多样化训练集进行训练,并采用了原创性的自监督学习方法。相较于ChatGPT背后的GPT模型采用的监督学习方式,这种方法更能促进模型对各种场景的泛化理解,强化常识推理能力,更好地学会人类交互模式。经过持续迭代优化,Claude助手已经发布了多版本,当前最新版本集成了Create的最新能力,可以提供流畅、知识丰富、上下文关联的英文语音交互体验。模型方面,Anthropic宣称其规模已经超过175亿参数,相当于GPT-3的1.5倍。
Claude功能更新
体验网址:https://claude.ai/
- 一次记忆10万token,相当于75000个单词
- Claude 的训练数据主要是英语,但 Claude 2 的训练数据中非英语数据比例已经明显增加。经测试发现claude对中文的理解能力相对于chatgpt要好很多。
- Claude 2 的训练数据包括 2022 年和 2023 年初更新的数据。这意味着它在互联网新闻等方面了解的更多。
在标准基准上评估测试了 Claude 2、Claude Instant 1.1 和 Claude 1.3,包括用于 python 函数合成的 Codex HumanEval、用于解决小学数学问题的 GSM8k、用于多学科问答的 MMLU、针对长故事问答的 QuALITY、用于科学问题的 ARC-Challenge、用于阅读理解的 TriviaQA 和用于中学水平阅读理解与推理的 RACE-H,具体的评估结果如下表所示:
综上,我们可以看出,在人工智能领域,Claude 2凭借其卓越的自然语言理解能力、丰富知识问答以及友好交互,已成为一个不可忽视的强力新竞争者,在许多方面领先于当前最热门的ChatGPT。Claude 2的出现给人机交互带来新的思考和可能。相信未来随着其能力的不断提升,它必将给我们带来更加智能、更加人性化的语音交互体验。面向未来的智能对话新体验—Claude2