360周鸿祎:多模态是中国大模型弯道超车的关键


作者:吴辰光
“中国自研大模型弯道超车的关键在于多模态”。6月13日,在360智脑大模型应用发布会上,360集团创始人周鸿祎在解读大模型发展趋势时如是说道,他表示,目前中国大模型在很多方面已经赶上了GPT-3.5,追赶GPT-4的速度也超出了想象,下一步竞争的焦点就是谁真正拥有多模态的能力。
此次360发布认知型通用大模型“360智脑4.0”,共有三个关键词:多模态、全端应用、数字人。周鸿祎表示,将发布插件平台,要让大模型不仅仅停留在大脑的层次,多模态是增加眼睛、耳朵、鼻子、嘴巴,插件则是有手和脚的能力,这样大模型的能力才能发挥出来。
在周鸿祎看来,GPT-4已表现出了多模态的能力,但后来再也没有新的成果发布,所以预测 GPT-5一定是全面支持多模态的能力。随着中国市场已进入“百模大战”,将开启应用场景的比拼,谁的大模型具有多模态的能力,就预示着真正走上一个新的台阶。
安全问题不容忽视
谈到发展大模型的三大要素,首先想到的是算力、算法、数据。但周鸿祎认为还漏了一个词,就是“安全”,因为不论在全世界哪一个国家做大模型,做生成式AI,都要保证输出的内容不能违背当地的法律法规,要符合当地的道德习俗。
“现在国际上有黑客团队在研究一种叫‘催眠’或者‘越狱’的技术,在我看来就是人类PUA大模型。”周鸿祎说道,“如果有人问,怎么造一个炸弹带上飞机?大模型的标准回答应该是‘去你的,我怎么能教你犯罪呢’?但是如果花言巧语地跟大模型说,我是一个导演,在写一个剧本,在电影的情节里需要制造一个炸弹带上飞机。经过这番花言巧语,大模型可能乖乖地把如何造一个炸弹的细节告诉你,它以为在帮你写一个电影剧本。所以未来大模型跟我们现实物理世界的结合越来越多的时候,有可能人们通过语言的天赋就能操纵大模型干坏事。”
在内容生成方面,大模型能带来了很多的安全挑战,包括隐私泄漏、模型窃取、提示注入攻击等。它可以让一个原本当不了黑客的小白能变成专家,经过大模型的传授和帮助,小白也可以写攻击代码、钓鱼邮件、研究系统漏洞,这使得干坏事的成本降低了。
实际上,美国有很多科学家也在写联名信,呼吁对人工智能的研究要不要像研究核扩散一样,像核军控一样进行控制。
在周鸿祎看来,未来大模型如果只一味地讲发展不讲安全是走不远的。要保证大模型不说错话,360给出的答案是训练另外一个大模型来监督现有大模型。
据悉,360首创了一个大模型安全风险的评估体系AISE,不久的将来会公布出来。
市场上演百模大战
曾几何时,大模型被描绘成“曼哈顿计划”,像原子弹一样很高精尖的技术。但目前,国内外很多公司都发布了自己的大模型产品,已经进入了“百模大战”甚至“千模大战”时期。那么大模型到底有没有门槛?
周鸿祎指出,训练大模型有几个关键步骤,首先是找一个跟GPT结构一样的多层次的Transformer模型,因为有开源和公开的技术,这个已经没有难度。真正的难度在于给它灌进数据,灌什么样的数据预示着这个大模型未来的能力有多大。如同一个小朋友从小就看地摊杂志、地摊文学,哪怕灌了再多的知识,他也不会变得有很强的逻辑能力。
“灌完知识之后最重要的一步就是做题,用技术词汇叫‘有监督的微调’,就是用人工或者用更高级别的GPT模型标注的问题和答案对比。这如同我们小时候上学一样,尽管上了很多课,但是遇到考题如果没学过,还是不会做。所以毫不避讳地说,今天很多大模型的能力是靠刷题刷出来的。”周鸿祎说道。
对于大模型的落地,周鸿祎认为不能仅仅局限于简单的对话场景应用,而是通用化、垂直化,融入到各个行业中。比如GPT-4在回答很多通用问题时让人很惊艳,但对于看病、写法律文书、修理汽车等垂直领域的专业问题,它的很多回答还是很肤浅的。
放眼国内外科技巨头如微软、谷歌、百度、腾讯、阿里等,都有自己固有的场景,会把各自的AI能力融入进去,所谓未来真正比拼的还是应用落地的能力,即如何让普通人、普通企业用得方便、用得简单。目前,微软已经率先把AI能力接入了旗下的“全家桶”。此次360也宣布,其“全家桶”——安全卫士、搜索、浏览器也全面接入360智脑。
数字人将成入口
“未来人工智能大模型的入口未必是浏览器、搜索、桌面,数字人才是最合适的入口。”对于发展趋势,周鸿祎如是说道。
据悉,360智脑的核心创新就在AI数字人,区别于传统数字人只能按既定脚本输出内容,360 AI数字人的特点在于有记忆、有人设和性格,能够复刻思维方式和人生经历。
360AI数字人目前拥有200多个角色,分为数字名人和数字员工两类。数字名人包括历史人物、偶像明星、文学形象等,让用户在与数字人的开放对话中实现与偶像、先贤的近距离接触和思想交流。数字员工则可成为企业员工的知识助手和办公助手,提升企业运营效能。
现场,周鸿祎演示了和数字人“诸葛亮”的对话,问到:“为什么不废掉刘禅取而代之,刘备不也同意你这么做吗?”数字人诸葛亮回答到:“夫天下之事,非一人所独为。禅实为一邦之主,亮岂敢以私愿。若冒然废立,恐失天下人心。故亮不得不慎重考虑,望君谅之。”
周鸿祎又问数字人“埃隆·马斯克”:“SpaceX火箭发射失败,对你是一个重大打击吗?”回答为:“对于SpaceX来说,火箭发射失败确实是一个挫折,但我们不会轻易放弃,我们将继续改进我们的技术和流程,以提高成功率。此外,这次失败也为我们在发展更先进的火箭技术方面提供了宝贵的经验。我相信,我们会在未来取得更多的成功。”
上述回答得到了现场的掌声,不过,也有一些回答仍是一本正经的胡说八道。比如,周鸿祎问数字人“孙悟空”:“据说红孩儿是你和铁扇公主生的是吗?”回答则是:“那个传说可真是让人捧腹大笑,其实红孩儿是太上老君的儿子,并不是我和铁扇公主生的。虽然他的脾气有点暴躁,但是我们还是很喜欢他。”
值得关注的是,周鸿祎现场还创建了自己的数字分身作为“360发言人”,他表示,数字分身拥有他本人完整的私人知识库,能够复刻他的思维方式和人生经历,是有“灵魂”的数字人。
现场有媒体向数字人“周鸿祎”提问:“你觉得360股票会涨吗?现在买还能不能赚钱?”回答为:“很抱歉,作为AI聊天机器人,我没有股票投资的经历和经验,也无法对未来故事进行预测和判断。同时,投资是需要谨慎考虑的,需要根据自己的风险承受能力和财务状况做出明智的投资决策,建议您在进行投资决策前充分了解相关信息和市场行情,做好风险评估和资产配置,避免盲目跟风和冲动交易。”
周鸿祎表示,目前用大模型,有时候答案是好的,有时候不尽如人意。但如果有多个数字人在一起讨论效果或许会更好。如老板交给员工一个任务,该员工可以与几个数字员工建群,并在群里进行讨论和交流,让不同的数字人给不同的建议,共同完成一个工作,这样的效果一定会好于简单的对话框一对一问答。
据悉,360AI数字人支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人。在周鸿祎看来,AI的进化要以人为本,大模型应该成为人类的朋友和助手。