【AI创新周刊】9月11号-9月14号

Weekly 一周热点
开源AI应用
开源 Agent
开源 AIGC艺术创意
开源数据和工具
开源安全工具
开发工具

跟上人工智能这样快速发展的行业是一项艰巨的任务 ⛵️ 我们从信息海洋中精选值得关注的 AI 前沿动态、工具和教程,帮助你更好地工作和生活
💖 希望我们的付出能帮你工作轻松一点,多一点悠闲留给生活
Weekly 一周热点
⛵️ AIdea:集成了主流的大语言模型和绘图模型。
支持GPT-3.5/4问答聊天,国产模型(百度和阿里)
支持图像生成功能如文生图、图生图、超分辨率和黑白图片上色 🔗 V2EX原帖:https://v2ex.com/t/969458 🔗 Github:https://github.com/mylxsw/aidea
⛵️ SEC Insights:帮你解读上市公司公告
基于SEC 10K和10Q文件(上市公司公告)进行对话
1)输出了完整的中间步骤;2)标明了答案的来源;3)流式输出;4)最多支持跨10个文档进行问答。🔗 官网:https://www.secinsights.ai/ 🔗 Github:https://github.com/run-llama/sec-insights

⛵️ Open Interpreter
OpenAI 代码解释器的开源版本。
我见过的最好的实现它确实有效。
这些工具让我们了解人工智能驱动的个人计算会是什么样子。
🔗 GitHub:https://github.com/KillianLucas/open-interpreter 🎥 Video: https://twitter.com/i/status/1699409632396198393
开源AI应用
🧩 开源:Dialoqbase Dialoqbase 使用个性化知识库创建自定义聊天机器人。利用 PostgreSQL 关系数据库来实现向量搜索操作和存储知识库。⛵️ https://twitter.com/Meta360DAO/status/1699033480238080458 ⛵️ https://github.com/n4ze3m/dialoqbase
⛵️khoj An AI copilot for your second brain. Search and chat with your personal knowledge base, online or offline 人工智能副驾驶,作为你的第二大脑搜索并与您的个人知识库聊天 🔗 https://github.com/khoj-ai/khoj
🐣 GodMode - the smol AI Chat Browser 🔗 https://github.com/smol-ai/GodMode

开源 Agent
⛵️ AgentGPT 🤖 在浏览器中组装、配置和部署自主 AI 代理。🔗 https://github.com/reworkd/AgentGPT
⛵️ chartbrew| 开源数据可视化 Web 应用 🔗 https://github.com/chartbrew/chartbrew
开源 AIGC艺术创意
⛵️ EasyPhoto :一个类似妙鸭相机的开源产品。现在你可以直接在本地电脑上处理真人写真和证件照了!
一款基于SD Webui UI插件,你只需要上传5到20张自己的半身照,它就可以学习你的面部特征,并生成一个你的AI人像分身。
支持多人生成:不仅可以生成一个人的电子人像,还可以同时生成多个人的。🔗 地址 https://github.com/aigc-apps/sd-webui-EasyPhoto


⛵️ PhotoShot 开源 AI 头像生成器 Web 应用程序,包含了完整的网站、AI的API调用、支付等功能,即使你不做同类应用,如果你想做类似的收费AI项目,可以帮你节约很多前期开发工作。🔗 代码 https://github.com/shinework/photoshot 🎥 https://user-images.githubusercontent.com/1102595/206658000-d349ef06-e4f2-4626-9deb-6c8a246f7553.mp4
⛵️ DiffBIR:修复模糊图片
一种基于生成扩散的高质量图像修复技术,可以从非常低质量的原图生成高清修复图。🔗 论文:https://arxiv.org/abs/2308.15070 🔗Github:https://github.com/xpixelgroup/diffbir 🔗 项目页面:https://0x3f3f3f3fun.github.io/projects/diffbir/ 🔗 Colab:https://github.com/camenduru/DiffBIR-colab 🔗 在线colab:https://colab.research.google.com/github/camenduru/DiffBIR-colab/blob/main/DiffBIR_colab.ipynb 🔗 OpenXLab在线使用:https://openxlab.org.cn/apps/detail/camenduru/DiffBIR

⛵️ IP Adapter 支持 SDXL IP Adapter 是腾讯AI实验室推出的 AI 绘图模型,效果类似 ControlNet,可以控制图片生成的效果。🔗 项目地址:https://ip-adapter.github.io/ 🔗 Github:https://github.com/tencent-ailab/IP-Adapter

⛵️ IP Adapter 支持 SDXL IP Adapter 是腾讯AI实验室推出的 AI 绘图模型,效果类似 ControlNet,可以控制图片生成的效果。🔗 项目地址:https://ip-adapter.github.io/ 🔗 Github:https://github.com/tencent-ailab/IP-Adapter

🔗 blog: https://hf.co/blog/t2i-sdxl-adapters 🎮 在线测试:https://huggingface.co/spaces/TencentARC/T2I-Adapter-SDXL

⛵️ Laughing Matters::能够根据人的静态照片生成包含笑声的笑脸视频 该模型能够将静态人脸图像和笑声音频合成为一个动态的笑脸视频。为了实现这一目标,研究者采用了U-Net架构,这是一种在图像处理领域广泛应用的深度学习模型。他们对这个架构进行了一系列的优化,以适应笑声生成的特殊需求。结果显示模型的性能不仅在传统的图像和视频质量指标上表现优异,还在专为笑声生成设计的新评估指标上表现出色。这应该是目前第一个:从单个参考帧和原始音频剪辑生成自然笑声视频模型!🔗 项目及演示:https://sites.google.com/view/laughing-matters 🔗 论文:https://arxiv.org/abs/2305.08854 🔗 GitHub:https://github.com/antonibigata/Laughing-Matters 🎥 https://twitter.com/i/status/1698507610045944070
⛵️ Emoji XL v2.0 现在我们可以与稳定扩散 WebUI 一起使用 🔗 模型:https://civitai.com/models/140968/emoji-xl 🔗 colab:请尝试一下 https://github.com/camenduru/ios-emoji-xl-model-colab

⛵️ Laughing Matters::能够根据人的静态照片生成包含笑声的笑脸视频 该模型能够将静态人脸图像和笑声音频合成为一个动态的笑脸视频。为了实现这一目标,研究者采用了U-Net架构,这是一种在图像处理领域广泛应用的深度学习模型。他们对这个架构进行了一系列的优化,以适应笑声生成的特殊需求。结果显示模型的性能不仅在传统的图像和视频质量指标上表现优异,还在专为笑声生成设计的新评估指标上表现出色。这应该是目前第一个:从单个参考帧和原始音频剪辑生成自然笑声视频模型!🔗 项目及演示:https://sites.google.com/view/laughing-matters 🔗 论文:https://arxiv.org/abs/2305.08854 🔗 GitHub:https://github.com/antonibigata/Laughing-Matters 🎥 https://twitter.com/i/status/1698507610045944070
⛵️ Emoji XL v2.0 现在我们可以与稳定扩散 WebUI 一起使用 🔗 模型:https://civitai.com/models/140968/emoji-xl 🔗 colab:请尝试一下 https://github.com/camenduru/ios-emoji-xl-model-colab

开源安全工具
⛵️ jackson: 设计为 OAuth 2.0 流程的企业 SAML 单点登录服务。只需几行代码即可集成 SAML 和 OIDC SSO。🔗 https://github.com/boxyhq/jackson
⛵️ 用于安全文档共享的开源 DocSend 替代方案 Papermark 是开源 DocSend 替代方案。安全地共享您的宣传资料、销售资料和任何文档。自行托管,或由我们托管。功能包括自定义域和实时分析。🔗 https://www.producthunt.com/posts/papermark-3
开发工具
⛵️ LangChain Hub: 发布、发现和尝试提示的地方 🔗 https://smith.langchain.com/hub 🎥 https://twitter.com/i/status/1699095883512778823
⛵️ LangChain Hub Playground 您可以检查提示并测试输入和输出 🎥 https://twitter.com/i/status/1699437549020704899
⛵️ Flowise 零代码AI开发工具,无需编程就可以开发AI应用 🔗 https://github.com/FlowiseAI/Flowise
⛵️ Ddosify|开源可观测性项目 🔗 https://github.com/ddosify/alaz
⛵️ RecipeUI: API工具,Postman 开源替代品。
YC项目
Discover, test, and share APIs in seconds 🔗 https://github.com/RecipeUI/RecipeUI
⛵️ Baresip 是一个模块化的 SIP(Session Initiation Protocol)用户代理,可以用来进行音频和视频通话。它支持很多高级功能,比如自动接听电话、录音、视频通话等。🔗 GitHub:https://github.com/baresip/baresip 该项目提供了丰富的功能,包括无限数量的 SIP 账户和呼叫、自动应答、呼叫保持和恢复、麦克风静音、呼叫等待、呼叫录音、点对点呼叫、视频呼叫、即时消息等。此外,它还支持多种安全机制,如信令加密(TLS)、音频和视频加密(Secure RTP)等。Baresip使用 CMake 进行构建,支持多个平台,包括 Android、macOS、iOS、Linux、OpenBSD 和 Windows。
⛵️ Flagsmith 可以轻松地跨 Web、移动和服务器端应用程序创建和管理功能标志。只需用标志包装一段代码,然后使用 Flagsmith 为不同的环境、用户或用户段打开或关闭该功能。🔗 https://github.com/Flagsmith/flagsmith

⛵️ Novel:一个开源的 Notion 风格的所见即所得编辑器,使用斜杠弹出更多命令,从交互到样式,都和 notion 非常类似,同时还有很高的扩展性,还添加了 AI 自动补全, 可以自动按照你的话题帮你继续写内容,很有趣的功能。如果你在项目中想要一个类似 Notion这样的编辑器,使用这个库是非常好的选择。Stars: 7.5K ⛵️ https://novel.sh

⛵️ Continue ⏩ the open-source autopilot for software development—bring the power of ChatGPT to VS Code 🔗 https://github.com/continuedev/continue