【AI创新周刊】9月4号-9月11号

2023-09-11 21:45 作者:AILink-未来联动 0人读过 | 我要投稿

前沿动态
AI Agent (自动化智能体)
AGIC艺术与创意
💪 AI健康管理与医疗
AI超级个体（攻略教程）

跟上人工智能这样快速发展的行业是一项艰巨的任务 ⛵️ 我们从信息海洋中精选值得关注的 AI 前沿动态、工具和教程，帮助你更好地工作和生活
💖 希望我们的付出能帮你工作轻松一点，多一点悠闲留给生活

前沿动态

☕️ 腾讯发布混元 LLM

官网申请，或小程序搜索“腾讯混元助手”申请。🔗 官网：https://hunyuan.tencent.com/

💰蚂蚁集团金融大模型：

功能：提供理财、保险领域的行情分析、资产规划、持仓诊断等 🔗 https://twitter.com/Meta360DAO/status/1700339299504259445

💡 AI公司Imbue完成2亿美元B轮融资

专为推理而定制的大型模型，目标创建实用AI代理
在一篇blog中提出让Agent生成并驱动代码查找数据而不是让Agent直接查找数据，这个思路挺好，可能是一个关注方向 🔗 https://twitter.com/Meta360DAO/status/1700338518839505205

⛵️ 阿布扎比技术创新研究院发布了Falcon 180B语言模型，声称模型质量超过了LLaMA 2并且与PaLM 2相当，仅次于GPT-4。

模型是开源的，可以用于商业用途
1800亿参数（GPT 3.5是1750亿参数），由3.5 万亿 Tokens 的语料进行训练，宣称能力接近 GPT-4。但是训练语料中只有5%是代码，代码能力不强，很难说能力接近GPT-4。
在3.5 万亿Token上进行训练，总共花费了约 7,000,000 个 GPU 计算时。🔗 模型官网：https://falconllm.tii.ae/index.html 🔗 在线试用：https://huggingface.co/spaces/tiiuae/falcon-180b-demo 🔗 Huggingface上的介绍文章：https://huggingface.co/blog/zh/falcon-180b 🔗 基础模型：https://huggingface.co/tiiuae/falcon-180B 🔗 Chat模型：https://huggingface.co/tiiuae/falcon-180B-chat

☕️ 百川智能推出 Baichuan 2 LLM

采用 2.6 万亿 Tokens 的高质量语料训练，发布了 7B、13B 的 Base 和 Chat 版本。
依旧开源，申请后可商用。🔗 Github：https://github.com/baichuan-inc/Baichuan2

AI Agent (自动化智能体)

💡 几个AI Agent应用案例

⛵️ 清华发布模拟软件公司的AI Agent智能体，模拟软件公司的多个AI角色（首席执行官、首席技术官、程序员、测试员）可协作完成软件开发，个性化创建自己的软件 🔗 https://github.com/OpenBMB/ChatDev

⛵️ Open Interpreter

OpenAI 代码解释器的开源版本。
我见过的最好的实现它确实有效。
这些工具让我们了解人工智能驱动的个人计算会是什么样子。
🔗 GitHub：https://github.com/KillianLucas/open-interpreter 🎥 Video: https://twitter.com/i/status/1699409632396198393

⛵️ Automat 将视频转变为工作流程自动化

🔗 https://techcrunch.com/2023/09/06/y-combinator-backed-automat-turns-videos-into-workflow-automations/

AGIC艺术与创意

📹 HeyGen视频翻译：

一键将视频语音翻译为其他语言，保持唇型与发音同步，语音克隆功能
不支持输出中文语音，但是支持输入中文语音翻译成其他语言的语音。🔗体验：http://labs.heygen.com/video-translate 🎥 效果演示：https://twitter.com/Meta360DAO/status/1700374844188070364

🎵Suno音乐生成：

文字生成音乐AI模型Suno发布重大更新：Chirp v1
功能：支持50多种语言、增强音频质量、选择音乐风格、标签控制歌曲结构、更快生成速度 🔗 https://twitter.com/xiaohuggg/status/1700133814096498922?s=20

🎵StockMusic：

类型：人工智能音乐生成工具
特点：支持50多种流派，最长生成120秒的歌曲 🔗 https://twitter.com/xiaohuggg/status/1699021507304030581?s=20

⛵️ SmashOrPass.ai：AI 版 Tinder

非常简单的一个网站，展示AI绘制的人像，你选择Smash（喜欢）还是Pass（不喜欢），AI根据你的选择，持续优化提示词，从而生成更加符合你喜好的人像。🔗 网址：smashorpass.ai

💡 SmashOrPass.ai：AI 版 Tinder

非常简单的一个网站，展示AI绘制的人像，你选择Smash（喜欢）还是Pass（不喜欢），AI根据你的选择，持续优化提示词，从而生成更加符合你喜好的人像。⛵️ 网址：smashorpass.ai

🎵 Coqui + Bark 语音克隆更新✨

1.您现在可以录制自己的声音
2.新角色库让您可以使用精心挑选的声音 ⛵️ https://twitter.com/Meta360DAO/status/1699031032501018660 ⛵️ https://huggingface.co/spaces/fffiloni/instant-TTS-Bark-cloning

🎨 一个用苹果 emoji 训练的 SDXL 模型，可以把想要的内容变成 emoji 风格。

试着生成了一下川普、拜登、奥巴马三人组，还挺像的就是成功率有点低。
这个模型不能下载，有想法的可以自己训练一下，感觉有些商机。🔗 https://replicate.com/fofr/sdxl-emoji

🎬 TokenFlow：TokenFlow: 通过固定文本到图像扩散实现一致视频生成和风格化

功能：文本到图像扩散模型进行文本驱动的视频编辑
特点：根据文本提示生成新视频，可以替换背景或人物 ⛵️ 网页：http://diffusion-tokenflow.github.io ⛵️ 演示：https://huggingface.co/spaces/weizmannscience/tokenflow/ ⛵️ 代码：https://github.com/omerbt/TokenFlow ⛵️ colab：https://github.com/camenduru/TokenFlow-colab 🎥 demo: https://twitter.com/i/status/1698759688827847025 🆔 作者: https://twitter.com/omerbartal

💪 AI健康管理与医疗

☕️ 医疗保健人工智能行业的硬核成果。微软刚刚宣布与 Paige @paige_ai 合作，构建最大的基于图像的癌症检测人工智能模型。

该模型正在对前所未有的数据量进行训练，消化数十亿张图像以识别常见和罕见的癌症。
Paige 最初是纪念斯隆凯特琳癌症中心的衍生公司，已经拥有一个人工智能，可以帮助病理学家检测乳腺癌、结肠癌和前列腺癌。
Paige强调，它是医生的工具，而不是替代品。旨在提高超负荷医务人员的速度和准确性。人工智能可能会彻底改变全球每年数百万与癌症作斗争的人的检测和护理。🔗 https://twitter.com/Meta360DAO/status/1700340042336469353

⛵️ PMC-LLaMA：

描述：开源医学领域语言模型
特点：基于大约480万篇生物医学学术论文微调 🔗 https://docs.agi360.xyz/web/#/12/11249

⛵️ V7 Labs：一个AI训练数据平台，该平台能够自动化视频和图像标注，提供前所未有的速度和效率，从而训练更好的模型。

他们有一个医学影像AI训练数据平台，广泛应用于CT和MRI扫描分析、牙科图像分析、皮肤科图像分析、乳腺X光分析、超声波分析等多个医疗用例。-V7 Labs的 "Workflows" 功能会引导你完成从准备数据到最终得到一个可用的 AI 模型的整个过程，而且速度非常快，只需要几小时即可完成。
该平台的优势包括：1、安全性：符合GDPR、ISO 27001、SOC2、FDA Part 11和HIPAA等多项安全标准。2、自定义工作流程：V7的工作流程可以帮助您结构化您的ML管道，从上传数据、标注和审查，到几小时内训练准确的AI模型。3、多种标注类型：包括对象检测、实例分割、全景分割、图像分类等。网站：https://v7labs.com/industry/healthcare 🎥 https://twitter.com/i/status/1698528079369617529

AI超级个体（攻略教程）

🎓 哈佛大学发布AI指南：

指南内容：如何在教学中安全、合法、合规地使用生成式AI工具
提醒：不得将学生作业输入到AI系统内 🔗 (https://twitter.com/xiaohuggg/status/1698938035482865773?s=20)

🎓 AI 图像修复大全：

描述：整合了一系列图像修复工具和模型
适用人群：对图像修复感兴趣的用户 🔗 (https://twitter.com/xiaohuggg/status/1698981381022581104?s=20)
🎓 AGI360.xyz 专题攻略-提示语工程

⛵️ https://agi360.xyz

支持人类反馈的 GPT-3.5 微调一套 GPT-3.5 的微调教程，支持人类反馈数据：https://docs.argilla.io/en/latest/guides/llms/examples/fine-tuning-openai-rag-feedback.html
教程：如何训练SDXL Lora 详见推文：https://twitter.com/fofrAI/status/1691108135749156864 中文版视频教程：https://www.youtube.com/watch?v=s0XJOGfUxkE
Awesome-LLMOps：https://github.com/tensorchord/Awesome-LLMOps
小而美创新工具包：定位模版