欢迎光临散文网会员登陆 & 注册

针对影视行业的AI应用入门分享

2023-03-22 23:13 作者:otkdl 0人读过 | 我要投稿

给内部的人做的AI分享内容，内容是我初步的理解，口述的偏多,实际聊了1个多小时，回过头只能稍微整理下文字描述了。中间穿插很多实际操作画面没法放在这里了都请见谅。

应用基础，主要是stablediffusion和GPT类应用不涉及底层，算是找一种应用思路方便和大众解释怎么理解这个玩意，怎么更好的用好它，不惧怕它。

分享内容的技术点可能会随AI进步发生变化/落后。

大众看AI的一种感受，就像是你站在火车站台上，看一辆会不在本站停的火车。火车远远的驶来，会觉得火车很小，并看不清什么，速度也很慢。随着逐渐靠近站台，“呼”的一声就开过去了，你还没反应过来时它已经过去了，大家对AI从调侃变成了赞叹，然后是惊叹，再往后就是无法理解了（忘记看到哪个人的视频里提到的描述了）

Midjourney基于GAN生成模型 StableDiffusion基于扩散过程生成模型，22年8月论文发表，10月开源语言生成目前比较火的都是基于OpenAI的技术语音这块百度，google，网易，腾讯都有对应的产品，微软的语音生成是非常自然的。音乐生成和图像一样，MusicLM是google出的，类似SD的功能国内算法浙大清华还是比较强的，和迪士尼，华为，百度，腾讯都有合作，实际算法转换成应用的案例还有很多，不在这里展开了。整合应用类主要是一些把算法变成工具整合在软件，流程中的应用/工具类

短期内就看看Midjourney，StableDiffusion足以了，甚至大部分人只要用StableDiffusion就够了。

短期内就看看Midjourney，StableDiffusion足以了，甚至大部分人只要用StableDiffusion就够了。

描述下生成序列的可能性展示下内部的算法结果（没法展示内部的内容。。见谅）

无法复刻别人的图的原因，很多时候是因为缺少了相同的条件，后面会提到

模型：主模型子模型（大小模型）主模型，通过几十亿的图像素材训练而来，方向是通用性，可以针对比较全面的生成方向。子模型，主要是针对性功能和方向去优化训练而来的，目的是优化主模型的生成结果往你所期望的具体方向靠近。关键词：输入源，正向和反向描述来决定生成图的内容和质量，要什么不要什么参数：控制生成的过程和时间，不只是生成参数，系统参数也很重要。

功能很多写作、改写、总结、修正、提问、翻译其实new bing都可以做到，首推new bing，可以体验相对新的GPT模型，同时联网。目前底层已经是GPT4，在应用层目前微软是领先的。

你可以通过和它描述特定内容，突破一些限制，从而实现一种解放官方限制的作用。甚至可以通过规则让它去学习规则，从而形成一种不那么智能的“人格"表现。

就像SP，quxel的出现，颠覆了PS绘制贴图的流程，手绘贴图

标签：分享心得 GPT stablediffusion CG 影视 AI

针对影视行业的AI应用入门分享的评论 (共条)