欢迎光临散文网 会员登陆 & 注册

针对影视行业的AI应用入门分享

2023-03-22 23:13 作者:otkdl  | 我要投稿

给内部的人做的AI分享内容,内容是我初步的理解,口述的偏多,实际聊了1个多小时,回过头只能稍微整理下文字描述了。中间穿插很多实际操作画面没法放在这里了都请见谅。

应用基础,主要是stablediffusion和GPT类应用不涉及底层,算是找一种应用思路方便和大众解释怎么理解这个玩意,怎么更好的用好它,不惧怕它。

分享内容的技术点可能会随AI进步发生变化/落后。


大众看AI的一种感受,就像是你站在火车站台上,看一辆会不在本站停的火车。火车远远的驶来,会觉得火车很小,并看不清什么,速度也很慢。随着逐渐靠近站台,“呼”的一声就开过去了,你还没反应过来时它已经过去了,大家对AI从调侃变成了赞叹,然后是惊叹,再往后就是无法理解了(忘记看到哪个人的视频里提到的描述了)
Midjourney基于GAN生成模型 StableDiffusion基于扩散过程生成模型,22年8月论文发表,10月开源 语言生成目前比较火的都是基于OpenAI的技术 语音这块百度,google,网易,腾讯都有对应的产品,微软的语音生成是非常自然的。 音乐生成和图像一样,MusicLM是google出的,类似SD的功能 国内算法浙大清华还是比较强的,和迪士尼,华为,百度,腾讯都有合作 ,实际算法转换成应用的案例还有很多,不在这里展开了。整合应用类主要是一些把算法变成工具整合在软件,流程中的应用/工具类
短期内就看看Midjourney,StableDiffusion足以了,甚至大部分人只要用StableDiffusion就够了。
短期内就看看Midjourney,StableDiffusion足以了,甚至大部分人只要用StableDiffusion就够了。
描述下生成序列的可能性 展示下内部的算法结果 (没法展示内部的内容。。见谅)
无法复刻别人的图的原因,很多时候是因为缺少了相同的条件,后面会提到
模型: 主模型子模型(大小模型) 主模型,通过几十亿的图像素材训练而来,方向是通用性,可以针对比较全面的生成方向。 子模型,主要是针对性功能和方向去优化训练而来的,目的是优化主模型的生成结果往你所期望的具体方向靠近。 关键词: 输入源,正向和反向描述来决定生成图的内容和质量,要什么不要什么 参数: 控制生成的过程和时间,不只是生成参数,系统参数也很重要。
功能很多写作、改写、总结、修正、提问、翻译其实new bing都可以做到,首推new bing,可以体验相对新的GPT模型,同时联网 。目前底层已经是GPT4,在应用层目前微软是领先的。
你可以通过和它描述特定内容,突破一些限制,从而实现一种解放官方限制的作用。甚至可以通过规则让它去学习规则,从而形成一种不那么智能的“人格"表现。

就像SP,quxel的出现,颠覆了PS绘制贴图的流程,手绘贴图



针对影视行业的AI应用入门分享的评论 (共 条)

分享到微博请遵守国家法律