新AI热词预测:Stable Diffusion 3.0、ChatGPT Hacker、Digital Twins
SD 3.0将在两周后开始训练。不希望自己作品的特征被SD生成的艺术家,现在可以在"Have I been trained"网站上搜索自己名字,或进行搜图,查看LAION 5B这个目前最大的公开图片训练集中是否有自己的作品,并提交申请要求剔除。据说已有数千名艺术家的名字被剔除。SD目前使用的训练集是LAION 5B的子集,5B 本身包含有约60亿张图片,而实际被训练的图片子集包含2亿张图片。Stability AI方面表示实际只用1千万张图片就可以达到效果,所以剔除一部分图片不会产生问题。
除了剔除外,该网站以后也会加入供艺术家提供授权的选项,为未来的商业化应用铺路。有人认为让艺术家自己提交剔除申请,这种行为本身就证明了Stable Diffufusion有侵权的行为。不过LAION 系列公开训练集中的图片并非SD所收集,如果SD方面只是以研究、学习目的对该训练集进行训练,坚持开源和非商业化原则,然后利用有授权的图片单独开发商业化应用,未尝不是一种合作思路。
实际上,现阶段这种“剔除”只是可以免除大型语言模型训练中对相关图片的使用,仅仅只能保证训练生成的SD 3.0的原始模型中没有这些被“剔除”的特征,使用者应该还是可以用Dreambooth等衍生工具进行添加训练和生成有这些特征的图片,只是效果可能和2.0版本有所不同。

ChatGPT 预计将在2024年为 Open.AI 带来10亿美金的收入 ,而2023年的预计仅为2亿美金。有人认为这个数字过于乐观了。Open AI这家公司背后也有微软、领英等公司高管的影子, 马斯克也是它的创始人之一。原本以非盈利性质创立的Open AI从2019年开始就准备将AI技术成果逐渐变现。创始人之一Altman发推表示ChatGPT的计算成本过于高昂,只能通过变现来维持。
对Chatbot的现状,有人评价是只能在有限的领域表现不错,但它的危险在于过于的自信,以至于很容易误导使用者。一些负面的应用范例也将层出不穷。
已经有研究者发现可以用当前版本的ChatGPT生成黑客工具,在完全不需要任何编程知识的条件下,对目标实施网络攻击。
让不懂计算机语言的人直接用自然语言生成软件、游戏,这个未来已经不远了。
程序员也并非不可替代哦。

NVIDIA给出的2023年AI发展预期中,出现得比较多的两个词就是LLM和Digital Twins,前者就是chatgpt、stable diffuison等大型语言模型,可能会先在一些比较简单的工业流程中开始应用,比如AI客服系统。另外由于LLM加持下无监督学习的崛起,互联网时代积累的大量未整理和标注的未结构化留存数据都将被激活。
后者,数码孪生体,将开启工业元宇宙时代,它指的其实就是在虚拟现实空间对现实中的实验进行完全拟真的模拟。这对自动驾驶、天气预测、气候变化等受限于现实空间的研究具有深远的意义。在元宇宙中训练自动驾驶等机器人技术的消息肯定会在2023年出现。在医药、商业定制等领域都预期会有新的应用展现。
2023年的热词,很可能就是Digital Twins。