AI前沿速报0508:Hinton警告、讯飞星火大模型
大家好,本期AI前沿速报为大家带来了多个最新的人工智能技术和应用。其中,加拿大AI大神Geoffrey Hinton发出了警告,讯飞的星火大模型超越了ChatGPT,阿里巴巴的mPLUG-Owl也在追赶GPT-4的能力。这些新闻都将对未来的AI发展产生深远的影响,我们应该关注、点赞、转发,让更多的人了解AI的日新月异变化。
1. 【AI大佬Geoffrey Hinton发出警报,白宫紧急召开AI危险会议】
Hinton辞去Google职位,以便自由发表有关AI风险的言论;AI能够生成人类级别的内容,引发对于错误信息和虚假信息的担忧;Hinton认为AGI可能在20年内实现;白宫召开紧急会议,与AI领袖商讨AI危险问题;Google、微软和IBM的CEO参加了会议;美国国家科学基金会宣布投资1.4亿美元,建立七个新的AI研究中心。
2. 【讯飞推出星火大语言模型,宣城部分功能超越ChatGPT】
中国人工智能公司讯飞推出了星火大语言模型,宣称其部分功能是ChatGPT的三倍。该模型可以生成表格、图表和PowerPoint演示文稿。讯飞还向开发者和合作伙伴开放了该模型的功能。此外,公司还推出了比OpenAI的GPT-3更先进的星火模型。
3. 【AI突破:读取大脑信号预测未来图像】
瑞士研究人员开发出CEBRA算法,能从大脑信号中提取视频图像,预测老鼠将看到的图像准确率超过95%。该算法引发了隐私和潜在滥用的担忧。研究人员希望将CEBRA应用于人类大脑。同时,赫尔辛基大学的研究人员发布了一段视频,声称AI系统能读取人的思维,引发了有关思维阅读技术伦理的争议。
4. 【蚂蚁集团天机实验室利用AI机器人测试智能手机的生物识别安全性】
据报道,位于北京的天机实验室利用带有摄像头和AI算法的机器人测试智能手机的生物识别安全性。该实验室采用了3D深度视觉、强化学习和目标检测等先进技术,获得了谷歌的授权,可以测试Android生物识别安全性。中国公司在生物识别技术方面处于领先地位,未来还有在汽车、虚拟现实和脑机接口等领域的应用前景。
5. 【中国矿业行业的自动驾驶技术】
中国的自动驾驶公司如TagoIO、Boree和Huituo正在矿山进行测试或运营。政府计划到2025年实现开放式煤矿的智能连续作业和无人运输。实施自动化采矿卡车的挑战和潜在好处。潜在市场空间超过1000亿元。自动驾驶技术的应用将带来更高的安全性、效率和成本降低。
6. 【卡内基梅隆大学研究人员开发Unlimiformer:预训练编码器-解码器中无限长度输入的AI方法】
卡内基梅隆大学的研究人员开发了Unlimiformer,该方法扩展了预训练语言模型的输入长度容差。该策略通过外部数据存储库补充预训练的编码器-解码器转换器。该方法已在长文档和多文档摘要任务中进行了测试,并在GitHub上提供了代码和模型。
7. 【ZipIt:一种合并同一架构的两个任意模型的通用方法】
美国乔治亚理工学院的研究人员开发了ZipIt方法,可以合并同一架构的两个任意模型,相比其他方法,可以将准确度提高多达20%。该方法还允许将训练在各种任务上的任意数量的模型进行压缩。该研究的代码和数据集已在GitHub上公开。
8. 【IBM开发SELF-ALIGN方法将语言模型转化为ChatGPT风格模型】
IBM开发了SELF-ALIGN方法,使得AI助手能够与人类定义的原则相一致。基于LLaMA-65b的Dromedary模型在某些任务上超越了GPT-4。SELF-ALIGN方法仅需要300行人工注释数据。研究人员希望能够使AI助手的开发更加简单和便宜。
9. 【Introducing StarCoder: 最大的开源代码语言模型】
Hugging Face和ServiceNow合作开发了BigCode,创建了大型编程语言模型StarCoder和StarCoderBase,使用GitHub的开放许可数据。StarCoderBase的性能与OpenAI的闭源模型如code-Cushman-001相当甚至更好。StarCoder模型采用开放负责任的AI模型许可证发布。
10. 【AI模型的未来:数据源耗尽】
据预测,高质量的AI模型数据将在2026年之前耗尽。更大的模型面临着收益递减和差劲的泛化性能。解决数据稀缺的替代方法包括多样化的训练数据集、JEPA、数据增强和迁移学习。长期来看,需要有效的方法来克服数据稀缺问题。
11. 【MosaicML和Together发布开源AI模型MPT和RedPajama】
MosaicML和Together发布了商业使用的MPT和RedPajama模型,表现类似于LLaMA模型。这些模型都是在同一个5TB的开源数据集上训练的。该发布预计将扩大开源社区并降低神经网络训练成本。
12. 【Midjourney发布V5.1,提高AI图像生成质量】
Midjourney V5.1发布,生成的图像质量更高,更易于使用。该公司正在开发文本到视频工具,用于AI生成的艺术。小米推出Mi Drone 4K,飞行时间27分钟,最远可飞行2公里。
13. 【大型语言模型:演变、应用和指南】
本文概述了过去五年大型语言模型(LLMs)的发展情况,将LLMs分为BERT和GPT两个阵营,并讨论了数据在LLM性能中的重要性。文章分析了三种类型的任务:传统的自然语言理解、生成和知识密集型任务,并提供了在LLM和微调模型之间进行选择的指南。
14. 【GPT 3.5模型选择指南:在五种场景下的表现】
本文对比了三种GPT 3.5模型在五种不同场景下的表现,其中Gpt-3.5-turbo在大多数场景中表现最佳。文章还评估了GPT-3模型在五个应用场景中的表现,并讨论了用于共享和评估机器学习模型的SOTA!模型平台。
15. 【斯坦福研究人员开发新方法压缩NLP模型】
斯坦福大学的研究人员开发了一种名为Gisting的新方法,用于压缩NLP模型。该方法使用语言模型作为预测器,无需额外的训练,并在不同的模型和数据集上进行了测试,表现出强大的泛化能力。它将26个标记压缩成一个,节省存储空间,可以提高NLP模型的效率并降低存储成本。
16. 【FlagAI发布支持18种语言的首个文本到图像模型AltDiffusion-m18】
FlagAI团队发布了AltDiffusion-m18,支持18种语言,结合多语言预训练模型和稳定扩散技术,实现了在英语FID、IS和CLIP得分方面的高性能表现,填补了非英语文本到图像模型的空白。该模型可通过FlagAI开源项目下载和使用。
17. 【Google和OpenAI在开源AI军备竞赛中陷入困境】
谷歌和OpenAI因开源技术而输掉了AI军备竞赛。谷歌的一份内部文件称“我们没有护城河,OpenAI也没有护城河”。谷歌的政策变化延迟了与外界分享内部工作的时间。泄露的文件显示,Meta是真正的赢家。开源社区在语言和图像生成方面创造了创新模型。谷歌需要专注于独特和创新的AI技术,以保持领先地位。
18. 【苹果联合创始人Steve Wozniak批评特斯拉的全自动驾驶系统】
苹果联合创始人Steve Wozniak批评特斯拉的全自动驾驶系统不如广告宣传,并指责埃隆·马斯克受到金钱驱动;特斯拉的汽车经常出现错误和导航不良;从2021年7月到2022年6月,已知有273起涉及特斯拉车辆的碰撞事故;德国法院禁止特斯拉宣传“完全自主驾驶”;沃伦·巴菲特和查理·芒格对马斯克的行为发表评论。
19. 【阿里巴巴达摩院发布mPLUG-Owl:模块化多模态大型模型,追赶GPT-4能力】
阿里巴巴达摩院发布了升级版的多模态大型模型mPLUG-Owl,展示了在多图像相关性、多语言、文本识别和文档理解等方面的能力。该模型经过两个阶段的训练,重点是对齐视觉和语言模态,并使用纯文本和多模态指令数据进行微调。在视觉相关指令响应任务中,mPLUG-Owl的表现优于其他模型,包括OpenFlamingo、BLIP-2、LLaVA和MiniGPT。该模型设计有六种主要能力,包括指令理解、视觉理解、文本理解和推理等。它在所有能力方面都优于MiniGPT4。该模型强调多模态语言模型在机器人和自然语言处理等应用中的重要性,有望改善人机交互和推进智能系统的发展。mPLUG-Owl已在ModelScope和HuggingFace上公开使用。
感谢各位读者对于AI前沿观察的关注和支持。我们将继续为您带来最新、最全面的AI前沿资讯。如果您觉得我们的报道有价值,请不要吝啬您的点赞和转发,让更多人了解AI的魅力。明天的速报,敬请期待!