欢迎光临散文网 会员登陆 & 注册

AI信息大汇总:一生一次的机会![内部分享]

2023-04-26 13:41 作者:西门嘉庆  | 我要投稿

大家好我是省流君,以下是该视频的文字稿:

大家好,今天我就将以这样一种特殊的,我也是首次尝试的方式和大家分享一下。嗯,我所看到的 AI 未来的机会,我认为这个机会是非常特殊的,是绝大多数人一生都只会出现过一次的机会,我相信你屏幕前的你绝对不能错过。那这个分享将分为 5 个部分,首先是我会先简单介绍一下国内国外这个 a i 行业的一个现状,然后最重点的会介绍最近几个月的一些变化,然后是 a i 的特点,然后也分两个部分,一个是 a i 这个作为产品的特点,另外一个是 a i 的商业化模式上出现的一些特点,这两个特点会最终决定 a i 对我们的一些影响。这个我在这个部分也会概括。


第三是我会具体的分享一下在各个岗位、各个角色上可以用的一些产品,包括最主要的是一个是编程,一个是设计,还有一些内容生产方面的产品。那这个部分我会讲的可能更多,用视频的方式给大家做演示,因为直接讲比较生硬,通用,通过用视频的方式可能可以更好的知道 AI 的一些特点和优点。


第四部分我会对大家的具体要做的,未来要做的事情给出一些建议,我认为这个是,嗯,可能我们马上就要动起来,而不能够再去等待的需要马上去做的一些事情。第五就是对我所有所分享的东西做个简单的总结。首先就是国内的现状,那国内其实在 3 月份的时候,百度就开了发布会,发布了自己的产品文心一言。除了文心一言之外,其实百度还有一款产品叫做文心一格,主要针对的是图像生成,所以其实百度在图像、文字、视频等各个领域都是有一些积累的,它的发布的声量在国内也是最大的。然后跟他找他合作的厂商也是最多的,因为百度毕竟做 AI 时间比较久,然后 AI 跟搜索的关联也比较强。然后阿里最近也在内测同意千问,已经有一些人拿到了同意千问的内测资格,网上也有一些同意千问的这个测试的视频。总体来看跟文心一言差不多,各有优劣。


通信新闻可能在编程上稍微好一点,然后在一些跟文字相关的方面更差一点,腾讯现在还没有任何产品留出的信息,然后其实它是有一个混元助手正在开发的,但是还没有对外发布任何信息。然后华为也有一个类似的产品,叫做盘古正在开发,但是因为华为的业务其实面向消费者的比较少,最主要的就是手机,然后互联网的业务比较少,所以它的这个大模型主要是面向商用的,面向它众多的合作厂商的,所以这个外部的信息更少。但是一些二线的厂牌,比如说商汤、旷视这两家就是长期做机器学习的,他们也立刻发布了他们的产品。然后 360 也在不久前开了发布会,现场演示了他们产品。还有科大讯飞这个也是长期做机器学习的,也同样发布了他们大模型,所以我们可以看到,可以说国内所有的厂商都参与到了这一场 AI 的进组当中,这是可以可能说我们之前所有的这种趋势当中都没有见到过的,而且几乎所有的二线厂商也参与到了这个大的趋势和潮流当中。包括很多我之前也分享过,已经退休的非常优秀的创业者和创始人也都重新融资,开始参与到这一场 battle 当中。


我所知道就有两个人非常著名的人,一个是做搜狗的这个创始人叫王川,还有一个是王小川,还有一个是做美团的联合创始人,这上次我也分享过,所以其实是基本上互联,国内互联网能看到的人都在这一个盘子里面了,国外的趋势跟国内又有不同,国内的趋势主要是直接在模型层,大模型层所有的大公司都参与进来了。


国外大公司没有完全部参与进来,但是小公司非常多,参与的小公司非常多。首先就是像 GPT 4 的发布,在 3 月份发布之后,是对业界有个很大的震惊,因为它的这个理解能力和它的一个逻辑能力上升到了一个新的层次。我在底下分享了链接,叫 paper read code,这个链接主要是登载一些有代码实现的论文,其实在机器学习领域,包括计算机领域里面大部分的论文比较重要和精彩的论文都在这个网站上能找到。然后你去这个网站上查,你就会发现目前首页上最流行的前 20 篇论文全部都是跟这个语音大语言大模型有关的,而且微软在上本周在这个网站上登载了一篇论文,这篇论文叫做 a g i,就是通用人工智能的火花对 GPT 4 的测评,这个论文也立刻成为了最流行的一篇论文,它里面详细的 GPT 4 的能力进行了测评,发现它在许多方面已经达到了我们定义的所谓一般的通用人工智能的标准,也就是说它部分的具有了人的能力。


另外一个趋势就是在嗯,这个大模型领域,它不断向更大的领域去扩散,比如说这个生成视频,比如说这个 firefly 是Adobe,就是做这个 Photoshop 的公司开发的一个在线是图片编辑的一个平台,比如说自动驾驶,再比如说微软发布的 36 Copilot,这个是在办公领域的一个新的 AI 的一个平台。


所以基本上所有主要的领域都被 AI 渗透,而且更重要的是 a i 工具有供众多小公司推动,是可以说在许许多多非常多的细分领域全面开花。比如说语音领域,比如说文本,比如说广告文案的撰写,脚本的撰写,比如说 logo 的生成、设计图设计稿的生成等等。所有的细分领域,只要是跟内容生成有关的,基本上都有这个小的 AI 公司的这种参与。


为什么在国内和国外的情况不一样,这主要就是因为国内在使用这个工具的时候是比较不方便,因为要翻墙社交达成合作也比较困难,然后国外天然的就没有翻墙的这个问题,然后小公司也非常容易能拿到这叉 GPT 的资源,所以小公司就非常容易继续叉GPT。4,在上面再搭建一层自己的应用,那在国内相对而言这种这样做的做法就第一是困难很多,第二风险高很多,因为你很难拿到这个服务,且你拿到的服务是不稳定的。但总的来说,国内我国外都呈现出一种非常火热的局面。这个视频主要介绍的就是微软的 365 Copilot,如果大家对这个办公领域的自动化感兴趣的话,可以看一下这个视频。他介绍了微软的怎么样通过 a i 来提升办公的效率,实际上是非常的指数级的,它可以把所有之前的任务,非常可能几个小时的繁琐任务都变成一句话,比如说生成 p p t,你用一个文件生成一个 p p t,比如说在会议当中直接总结会议的重点,比如说对 Excel 的操作,之前那个不是还有一个,还有一些比较玩笑的搞笑的这种语音操作表格的这种视频就是当时老罗做的。但是在微软的加上 AI 的加持之后,它可以真的实现完全语音识别的操作,而且是智能级别的。就是我比如说一句,嗯,按照这个销量排序,或者把销量大于 100 的条目筛选出来,然后表格就可以真的实现这种极具逻辑性和复杂性的操作。然后这个视频如果大家不方便翻翻抢的话,可以在 b 站上搜索 365 Copilot 就能看到。


这里我再强调一下,可能有些同学怀疑就是 a i 是不是这么强,或者 a i 对自己的工作的领域有没有那么大的影响?那么我只是想告诉你,第一,全球所有的顶级的公司都参与了。第二,全球所有顶级的资金都投钱了。第三,全球所有的顶级的科研机构都在关注这个风口,是前所未见的风口。跟我们之前说区块链或者元宇宙或者直播电商之类的风口是完全不在一个级别的,不是之前就是让我们觉得好像说又是一个新的风口而已这么简单,因为之前任何一个风口都没有。第一,没有这么快的落地的应用,第二,没有这么大的影响力让所有公司参与。第三,它对于这个社会所有的方面的渗透没有这么全面。可以说我认为 a i 的这个风口,或者说 a i 的这个变革的重要性比之前所有的变革都要重要十倍以上,甚至可以简单的概括就是这是 21 世纪最重要的一场革命。那么 AI 这个产品有什么特点?然后根据我过去这几个月使用的一个心得,我觉得,嗯,包括我看到的一些信息,我觉得概括起来 AI 有两个非常大的特点,第一个特点就是它可以完成理解到信息到整合的这个信息链条,所以它是对搜索一个彻底的颠覆。首先最我们之前使用搜索引擎最大的痛点就是我们很难很好的把我们的意思表达给机器,或者反过来说,准确的说机器是没有办法理解人的意思的。实际上所有的搜索方法,所有的搜索引擎都没有理解人,所有的搜索引擎只是把你提供的关键词和互联网网站上的关键词去做匹配度最高且质量最好的网页给呈现给你,从来没有让产品是真的理解人的意思的,那么 a i 做到了, a i 真的可以能理解人的意思,哪怕你的意思是非常复杂的、曲折的,甚至是隐含的。


因为现在 a i 都可以去理解人的所谓的这个网络迷因,或者说我们叫梗,比如说你现在发一张梗图给 a i,问这个 a i 这个梗想要表达什么,或者想要暗示什么, a i 甚至都能够理解,所以在理解以后,它可以把互联网上所有的相关信息整合起来,经过梳理分析,最后以一种非常容易理解的方式呈现给你。


这对于人类获取信息的效率是在搜索引擎出现后的第二次革命。搜索引擎出现之后,我们获取信息变得无比的容易,所有的信息都能拿到。但是这个搜索的过程本身是有成本的,但是 AI 出现之后把这个成本消灭了。基本上我们以后获得任何信息,我们对于任何信息或者甚至是任何专业信息的获取,都能够真正做到0。成本就是你想知道一件事,什么事情到底拿到这件事,什么事情,这个结果可能都不需要 10 秒,这就是未来的。


嗯,我们在信息获取领域的一个结果和特点,一个更恐怖的事情是,在理解的基础上, AI 还可以根据你的描述去进行建模和执行,这非常明显的体现在编程上,因为编程是一项非常复杂的建模工作。但是当你仅仅是用文字说清楚你想干嘛之后, AI 就真的能理解且帮你变成一系列它内在的模型,且甚至能够帮你执行。


比如说我们刚刚演示的这个微软的Copilot,你直接去说,比如说你说我要生成一个脚本,这个脚本里面有这个 a 和b, a 和 b 吵架,最后他们和好了,它就可以根据你提供这些信息去构建 a 和 b 的关系,去构建 a 和 b 的角色的和性格和变化,最终把这个脚本写出来。然后包括说你可以像我刚刚说的这个会议录制,你可以说,诶,我要把这个会议的重点录录,会议的重点总结出来,它就会真的理解你想要干什么,且真的以一种代码的方式去把这个会议当中的关键词提出来,然后再梳理成几个要点。所以这两个产品特点其实对于人的生产力,准确的说是输入和输出都是有指数级的提升的。


那么 a i 有了这样的特点中能干嘛呢?首先就是它能够成为一个超级老师,所以当你真的去体验过 a i 之后,你就会发现就是他对于学习的变革是绝对革命性的,因为他是一个嗯无所不知的老师,而且他极度耐心,而且他甚至可以手把手的教你,就甚至可以帮助你执行,所以你会形成一种新的依赖,就是嗯什么问题你都会想问他。


任何一个小问题你都会想找到确认,但是反过来它会带来一种体验,就是学习从未如此轻松,因为你能想到任何问题你都可以通过它来回答。比如说我随便举个例子,我当时最开始用 a i 的时候,比如说我想要了解时间管理,那么我就问 a i 说最流行的 5 本时间管理的书是什么?然后他一瞬间就把时间管理的 5 本书全部列出来,最流行的 5 本,然后第一本书我也懒得看,我就直接问他说,你能不能总结一下第一本书的内容主要有什么?然后他就叭叭叭就把第一本书的主要内容列出了四五条告诉我,然后我就说,嗯,比如说我要做到这本书的第一条,我需要什么工具,它又告诉我这些工具要是什么。然后我再继续问我说这个工具应该如何使用,它又告诉我了这个工具的这个下载方法和使用方法,就所有的问题它都可以直接回答你,且都是准确率极高,极具这个有效性的。


所以它使得学习变成一种一件非常愉悦的过程,因为你可以以 0 成本零时差的方式获得信息,之后学习就会变成一件非常愉悦的事情,就大大的降低了学习的痛苦的程度和学习的门槛,使得我认为一个人未来要掌握一项技能的曲线是完全改变了,我们也再也不需要去做一些重复的枯燥的事情。


比如说一个典型的场景,就是在编程的时候每个人都会,其实比如说你如果编久了,你每个人都会建立自己的一个代码库,你会把一些常用的代码扔到代码库里面去,这个叫做,有些人叫做外脑,或者叫笔记,或者叫任何东西。从此以后这些动作都没有意义了,因为你要实现的任何一个小功能,比如说你要实现一个特定的函数,你要实现一种特定的功能,你要实现个特定API,你就要问它怎么实现,它立刻就能把它实现出来,它立刻就能告诉你怎么实现。如果你,你要他把代码写出来,他立刻一瞬间就把代码帮你写出来。


所以以前的传统的一些这个笔记或者外脑,或者这种额外的工具在他面前全部都消融了,然后他把这个学习一件事情的成本变得低到可能我认为 5- 10 倍。所以而且最关键的是它让学习的感受改变了,就是你原来觉得很痛苦的学习过程,会在这样一个过程当中变得非常轻松,尤其是在垂直领域,因为在通用领域它可能对于一些问题依然还不够专业。比如说你如果它一些营销的问题要怎么样能够做好营销?但是这个问这些问题都可以解决。


为什么?因为每一个垂直领域都可以专门被训练,比如说我们可以基于营销上的知识专门训练一个营销知识的老师,那么你去问这样一个老师,这样一个机器学习,它就AI,它就可以很准确地回答你在营销方面的知识是什么,然后怎么样做是对的。他甚至可以把全世界所有的营销案例全部学习一遍,当你需要任何一种场景下的营销案例的时候,他都可以在一分钟内给你 100 个最经典、最有效的案例。然后你又可以问他结合你的场景要怎么去修改,或者怎么选择案例,它又可以针对你的问题给出答案。所以我认为 AI 的第一个特点就是信息的这种无极获取,首先就会改变人类的学习曲线,甚至会改变人类这种学习的习惯和学习的状态,甚至是对未来的整个教育体系,包括说基础教育的市场、中等教育的市场都会有影响。那么基于第二项能力,一个非常重要的事情就是它会重构你的工作流,因为在 AI 时代,它可以真的理解你以后一切具有重复性质的工作都可以被 AI 重构。比如说我随便想想,比如说我们的财务,在比如发工资或者做统计的这些流程当中,有非常多重复的过程,都可以通过我刚刚介绍的 36 Copilot 给取代。


然后比如说我们设计当中有很多重复的步骤,编程当中有很多重复的步骤,或者我们制作内容过程当中有很多重复的步骤,所有一切你只要认为是重复的步骤,包括我们的这个人力资源管理上有很多重复的步骤,不管是在公司的管理上还是外部的招聘上,一切重复的事情都会快速的被 AI 取代,使得一个人的生产力可能可以有 5- 10 倍的提升。


我认为每个人都应该重新构建自己的工作流,构建自己的工作的一个框架,然后包括你生活当中和工作当中常用的工,这个 a i 工具组合成一个工具流,然后不同的 a i 之间的工具的配合,使得可以使得你的不管是工作和生活状态,我认为会全部都迎来一个从这个全新的面貌。


所以对于 a i 的工具的一种收集、适用和不断的调整,我觉得会是每一个人都应该主动去做的一件非常重要的事情,但是不好的事情会发生就是失业。在这波浪潮当中,肯定有许多人会因此而失业。当中我接触到比较焦虑的可能是设计师朋友们可能会对 AI 比较抗拒,觉得 a i 第一侵犯了版权,第二这个 a i 的设计没有创意等等,但是 a i 对于人的替代是不可阻挡的。这个右边的左边的这个表就是,嗯,知乎上的一位大神,数据大神统计的 AI 最有可能被替代的职业和最可能最难被替代的职业的都 25 名。


我们可以看到最有可能被替代就是翻译,再往下美工、美术编辑、文学作家,不管是搞文字的还是搞图片的,文字编辑、网络编辑等等,还有剪辑师,还有搞视频的,被替代的概率都在 75% 以上。 70% 几, 80% 以上包括程序员,最后一行计算机程序设计员被替代的概率都的比例都达到75%。可以看到这是一个所有互联网从业者都会面临的一个挑战。然后我特别想跟大家分享两个很有意思的细节。第一个细节是在做,大家知道这个表怎么统计出来的吗?这个表你如果点开那个点,我查看绝望的这个链接,就会知道,最开始的统计是把每个职业拆分成任务,把任务拆分成工作,然后去分别由人来标注这项工作有多大的比例能被 AI 替代。然后把这个统计的结果再反向汇总回来,因为一个一个每一个,比如翻译,他可能有几项工作,比如他要学习掌握某些语言,他要做润色,然后做实际的翻译工作等等。那么每一项工作会被 a i。


替代的比例以一个权重平均之后,就得到它被它这个职业被替代的一个比例。那么最开始这个标注工作,第一批还是由人来标注的,第二批就通过第一批的数据给 a i,让 a i 来学习,然后第二批数据开始就由 a i 自己来标注, a i 自己来判断每一项能力被 a i。替代的比例有多少。然后这个标 a i 的标注在通过作者的检查之后,发现准确率是很高的,跟人的标注结果相差无几,所以它之后所有的标注全部都由 a i 完成了,也就是说统计 a i 有多大可能性被把人给替代掉?这项工作本身的人的工作的部分就已经被 a i 给取代了。


他原本作者预计这项工作如果由人来做,要花费1万块钱以上,但是全部由 AI 完成之后,他只用了几分钟,只花了 2 可能不到。我记得是不到 3 美元,也就是不到 20 块钱人民币就全部完成了。所以这一点本身就是极具讽刺意味的。然后第二个细节就是统计结果发现,薪水越高的岗位,或者薪资成长速度越高的岗位,越有可能被 AI 替代。和大家想可能想象的相反,越是基础的工作,反而越不容易被替代。这意味着什么呢?是意味着从根本上来说,人类学习和掌握一些模型的能力,比如说会计能力,比如说这个视觉设计能力,比如说编程能力,这些我们原本以为非常复杂的能力,其实在 a i 面前反而是最容易被替代的。


对这两个细节跟大家分享一下所有的细节,如果想要去查看的话,可以点开链接去查看这个文档的详情。但是 a i 我同时也要给大家一点信心, a i 对大家的替代,对人的替代是不可能直接进行的,那目前至少在目前为止, AI 是不能够直接替代人去工作的,它的 AI 的抽象和综合能力还没有达到那个级别。那么最可能发生的事情是什么呢?最可能发生的事情就是被 AI 武装的个人将以 5- 10 倍的生产力大幅的淘汰没有学习的同行,没有学习 AI 的同行,这是第一个可能性,第二个可能性是所有的内容或者是跟 a i 生成有关的这种产品的,因为它的成本极度的下降,会导致这些内容极度的泛滥,并且产生很多新的商业模式。


所以总结起来,我们将迎来一个超人时代,这个时代当中每一个人的学习能力会急速的提升,而每个人的工作效率也会急速的提升,这就意味着一个充分利用 AI 进行学习和工作的人,他将有可能超过 100 甚 10 到 100 个人的团队。那么这样一个人的能力通过 AI 技术放大的时代,其实是一个人与人之间的能力真正快速的拉开差距的时代,这就是我说的一生一次的机会,你要比一个人,比你的这个同龄人,比你同级别的这个同事或者同级别的竞争对手要强 100 倍,不可能做到的。但是在这个 a i 时代,突然之间有可能了,如果你比他早一年学 a i,早一年通过 AI 学习,早一年通过 AI 工作,在一年以后你有可能产生他 100 倍的产出,这就是 AI 时代带给我们每个人的机会,我称之为超人时代。


那么 AI 在商业上有什么特点? AI 在商业模式上有两个非常显著的特点,第一就是它提供的能力是如此的通用,所以几乎我几乎实在想象不到有一个行业是可以完全不受 AI 影响的,哪怕你是,哪怕你是一家扫地公司,对吧?你可以,那你也可以通过 AI 快速的去统计你扫地员工的同这个同事的工作效率,快速的帮助他们发工资,做社保,快速的帮助他们规划工作路线。


所以我实在很难想象到一家公司是无法通过 a i 提升的,然后市面上所有的产品也可以通过 a i 提升效率。比如说现在就已经嵌入了,比如说我刚刚举的例子,这个 363365 原来是经典的 office 套件,但是加上 AI 之后,它带来的价值有了真正质的提升,我相信使用它的工作效率绝对有可能提升 10 倍。那么其他的工具是不是也有可能动物 AI 提升,我觉得可以,大家可以展开去想,但是理论上是全部都可以的。


因为所有的产品当中一定都含有人建立的模型,比如说会计,比如说我们出财报,比如我们做营销,所有事情当中有没有一些模型或者模式存在,那这些模型和模式就可以通过案例被 AI 学习,被 AI 以极低的成本、极快的效率复现。所以 a i 没有一个领域可以逃过 a i 的惩罚。


那同时另一个在商业上的特点就是 a i 的服务是相对来说昂贵的,因为所有的 i 都需要天然的,需要大算力,这就使得目前所有的几乎所有的 a f 5 都直接向用户收费,且用户会觉得付费是合理的,因为他要支付这个算力的成本。且同时另一方面,因为使用 AI 之后,几乎必然会带来生产力的提升。用户对于付费的接受程度高,且付费意愿强且满意度高。因为你哎,用了之后你就生产力极大提升,然后对你而言,续费变成一件非常划算的事情。我在 b 站上看到一个程序员,他感叹说他的薪水每个小时都超过 250 元了,但是他购买叉 GPT 四只需要一个月 150 元。然后购买之后,它编程的效率从此以后天翻地覆。它几乎再也不直接写代码,而是用就直接用语文的方式,语言的方式写代码,它的效率极大提升。之后,他甚至就像他自己说,他甚至愿意付出 10 倍的价格,哪怕 AI 的价格贵 10 倍,他都愿意支付。


所以 AI 的商业模式,不管是从应用端还是从商业模式付费端,都非常容易建立,这就使得 AI 的快速的推广和落地。就像我说那样,无数的小商业,无数的小创业公司,这个从行业当中涌现出来,变得可能现实且有意义。那么 AI 在商业上怎么落地?最常见的模式就是Copilot,就是我刚刚反复在提的微软推出 36 Colight Copilot,且 GitHub 也推出了 GitHub Copilot。其实这就对我们有一定的提示作用,因为我们前面也分析过 AI 产品的特点,它非常,它能极速获取信息,它能够模仿人类建立模型且进行非常好的执行,这其实就相当于一个老师加一个助手的角色合在一起,实际上他就是一个领航员,他可以在你的旁边非常好的做好一个辅助的角色。那么,嗯,其实我在各样各种各样的平台上,不管是小红书还是 b 站上,经常都会去看一些用户使用 a i 后的反馈。


我发现越来越多的人都把 a i 当做老师,他们甚至把这个像 GPT 叫做 c 老师,发现这个西老师的对于这个学习的提升是无限巨大的,因为就像我前面说的一样,他无所不知,无限耐心且大概率准确。这就使得很多原本你问不出口的问题你都好意思问,然后你就会依赖到说哪很简单的问题你都愿意问,去问AI,使得你的学习循环彻底被改变,而且它不但可解释,甚至可执行,所以他从又从老师的角色延伸到了一个助手,可以实际的帮助你完成很多工作的执行。而且 AI 的商业模式还有很大的特点,就是我在底下写的双双重飞轮,一方面在工作侧,在产品侧你可以思考怎么样去引入AI。比如说我们做社交就可以思考 AI 可不可以做成一个恋爱助手。但是在工作侧,你同时又可以通过 AI 辅助自己的设计。比如说你甚至可以直接问 AI 说,我现在想要利用 a i 去开发一款社交软件,我应该怎么做?所以你等于是利用 a i 辅助自己设计,利用 a i 辅助别人的产品,这实际上就是个双重飞轮,因为在这两个使用 a i 的地方, a i 的能力都在以惊人的速度提升。


同时再往后你通过 a i 设计完产品之后,你的编程也是可以通过 a i 的,然后你的设计也是可以通过 a i 的,甚至你的营销也是可以通过 a i 的。全链路 a i 都在帮你提效,最终你生产出的是一个帮助别人提效的产品。所以这样一种双重的飞轮,在 AI 提升的时候,这两个飞轮的效率都会提升,使得有可能出现一些小公司在商业上的这种扩张,达到一个前所未有的程度。


可能还是有些同学觉得 a i 很弱,或者在我的行业里面还没有普及,或者对于我所在的行业没什么太大作用。那么我不得不提醒你,这股 a i 风潮的原点 ChatGPT 的上限只不过是在去年的 12 月,到现在还没有满半年。在这半年的时间里面, a i 就以一种惊人的裂变的,甚至是爆炸式的方式在扩散到所有的领域行业,扩散到几乎所有的公司。


现在的 AI 的潮水才刚刚开始,这个潮水才没到你的脚踝,你的鞋子才刚湿。我给你的真诚的建议是,不要等到潮水淹没了你的脖子,才开始学习游泳。这是一个很有趣的案例,是 YouTube 上的一个视频, 7 分钟的非常风格化的动画。这个动画讲的是两个王子争夺老死去的老国王留下的王国的故事。特殊的地方在于这个动画全部是通过 a i 生成的,然后这个动画的导演和编剧他们穿上了华丽的衣服,自己表演了一遍,然后把他们自己表演的视频录下来,之后转换成了非常具有风格化的动画。


第一排第二个右边的这个视频是实际录制的视频和他们的动画的对比。那么第二排的第一个视频是他们的制作过程的一个教程,其实他们使用的基础也并不复杂,叫做 stable diffusion,这个是个开源的图片生成图片的一个软件,也是目前最主流的图生图软件之一。然后面也会简,我也会简单介绍,所以整个动画行业包括相关内容,相关的游戏行业或者图片行业,其实都有可能被 AI 重新构建,然后内容生产的成本会降低到一个不可思议的程度,未来完全有可能真正实现人人都做导演。


以前人人都拍照,甚以前人人都拍视频是不可时宜的事情,那么未来不单是拍视频的权利下放到每个人,甚至是拍非常精美的视频,以至于电影的拍电影的能力都可能下放到每一个人,这个视频就更加震撼,更加厉害了。这个就是我前面提到的 j two,是一个可以通过视频生成视频,甚至是文字生成视频的平台,这个平台还在快速的迭代,这些产品还在刚刚开始研发出来,甚至还在发论文的阶段,但是他们产品的效果已经是非常惊人了,可以把一段非常普通的视频风格化为特定的视频。


比如说你在路上走,它把你风格化为你在月球上行走,或者是你比如跳了一段舞,它可以把你风格化,所谓在火山口跳舞,它甚至可以用一段简单的文字描述来生成视频,比如说你可以说一个人和另外一个人在那里聊天,或者在喝咖啡,我们还是可以生成视频这一项技术。就像我是刚刚说的一样,可能就可以把视频制作精美的视频制作的能力下放到每一个人。更重要的是你可以通过这项能力去生成那些拍摄成本极高,甚至是根原本根本就不可能存在的视频。比如说一个人在太空中跳舞,一朵赛博朋克鲜花在深海绽放等等原本极难想象的东西,都可能在这种 AI 技术的加持底下变得非常轻松,推荐大家看一下。


接下来就到了重头戏了,我跟大家分享一下目前我认为已经可用的一些产品。首先就是 AI 导航,在这两个网站当中分别会列出国外现在已经出现的一些 AI 产品和国内现在出现的一些 AI 产品。那国内很多产品都是偏向于玩票性质或者教程性质的,国外的产品可用性会高得多,有很多实实在在小公司真的在围绕 AI 进行创业。那么在通用领域,首先就是像 GPT 就不用说了,那我推荐大家使用这个 v type link,点 link 的一个 Chrome 插件,这个插件里面就有这个 chart GPT 功能,就实际上它收集了很多 chart GPT 的这个国内的一些网站,因为国内这个东西不好用,所以国内有很多网站就是通过接入API,然后提供一个前端的接口,使得大家可以不用翻墙简单的使用这个产品。然后最终我还是推荐大家可以自己去购买,就是购买 XPP 4,直接一线的去体验最先进的这种 a i 的技术。


第二个是 new bin, new bin 实际上使用比较麻烦的地方在于它跟加 GPT 一样,也需要硬方硬翻墙,全局翻墙才能够访问。然后我给大家推荐一个简单的方法,就是你可以通过在 Skype 上去跟一个叫做 new bin 的这些人聊天,他有官方的机器人来比较简单的使用这个功能,但是你依然需要注册、申账号和申请内测。第三就是文心一言百度这个产品我简单试用过,能力比国外的产品还是要差一些的,但是可能对于一些比较简单的应用还是可以胜任的。然后在编程方面最著名的就是Copilot,但是这个产品实际上需要付费一个月 10 美金,所以相对来说比较贵。那么我还给大家推荐两个产品,一个就是 VS code 插件,叫cocodem,这个 codium 是目前我看到唯一一个完全免费的产品,而且它功能也非常强大。然后下面是 curse 的点soul,这个是实际上是一个 v s code 的,因为 VS code 是开源的,实际上是 VS code 一个专门的版本,实际上是这个公司把这个 VS code 改了一下,融入了 AI 功能。那么好处就是这个 AI 会读取你的代码库,所以你可以有针对性的针对你的代码库去生成。比如说你问某个函数是什么意思,那么你就不需要提供上下代码,它会自动去扫描你的代码库里代码来解答你某一个特定的函数是什么意思的一个问题。所以它的这个针对性更强,但是它也有一定的这个每个月的使用限制,如果超过的话会需要付费。总的来说这两个最推荐。


还有一个我刚刚写的这个插件叫做P4,这个插件是我自己使用下来我感觉不太好用的,虽然说现在相对比较流行,但是它是需要连接到 ChatGPT 的,所以在国内使用的时候,不是在国内使用,就整体使用的时候都会有一定卡顿的问题,有时候经常会响应比较慢。


那么在设计方面最常见的是两个平台,一个就是 me journey,这个是大家可能相对来说有听说过,我们上一次分享也讲到过的,它可以直接通过文字来生成图片,也可以通过图片生成图片,实际上它是入驻在 discord 这个类似国内 YY 的这个产品上的一个非常简单的一个平台,所以使用上最简单的但是需要翻墙和需要购买目它目前它免费的部分已经去掉了。


然后第二个是一个开源的产品技术,前面说到的使用它来制作那个动画的 stable diffusion,这个产品功能非常强大,你可以使用它可以更加定制的,更加细节的去控制你。图片生成,你可以通过一个线框来生成一个非常好看的图片,你可以把这个,比如说有一张照片的一张脸的部分部门,你可以把脸的部分遮起来,然后让他重新按照你的要求重新生成一张脸。你可以用它去画一个线框,然后自己生成内容,你甚至可以用它做一个非常高级的功能,叫做图片语义理解,它就可以把图片当中的每个部分识别出来,比如说绿色的森林识识,识别出森林、识别出水,识别出路。然后你可以通过反过来,通过语义的编辑来直接编辑这些内容,比如说你想要在一片沙漠中增加失能 0 怎么办?你先把它转换成语义图,也就是一片黄色和一片绿色的这个非常简单的这个两色的图,然后你在黄色的部分里面去增加更多的绿色,只要用绿色的画笔直接往上涂,涂完之后因为它这个绿色的语义就是森林,你再通过这个这张语义图转回来,绿色被你涂成绿色的部分就自动会生成非常自然的生森林。


这 stable diffusion 现在是一个在设计领域非常可以说最重要的一个开源的产品,但是它的唯一的一个困难在于它是需要使用你自己的电脑生成去训练去生成的,所以它对于机器的这个要求和开销都比较高,所以一个补充的一个这个折中的方案,就是可以使用云服务去购买云端的显卡来训练和这个生成相应的图片。


相对来说, stable diffusion 使用的门槛要高得多,所以需要在 b 站上查看比较多的教程。我也这个留了个链接, stable 大家可以看到,可以点击之后可以大概的了解它的一些功能。OK,我先这里补充一句啊,整个产品,整个所有的这个文件我都已经分享出来了,所以大家只要点左边那个 AI 工具那个链接就可以进去看到,可以评论,也可以写一下你认为比较好用的一些工具,大家就力量一起汇总,把这个文件更完善了,大家一起去互相交流分享常用的 AI 工具。


OK,说到这个几个比较大的领域之后,剩下一些领域相对来说就是我刚刚说的小众领域,比如PPT、文案,然后LOGO、视频这些领域其实都是我刚刚说的一些一堆小公司在做的,然后目前的产品我认为也比较好用。目前我在跟你分享的这个 PPT 就使用其中的 p pitch . com 生成的,其中大部分产品我都用过,只有文案的脚,文案脚本那三个产品我都没用过,因为在国内的网络好像访问起来非常的困难,我不知道为什么,但是其他几个产品我基本上都用过。然后视频领域 GEN two 还不能用,但是 GEN one 可以用了,你可以用一代的视频上的视频的功能,但是每个人只有大概 35 秒的这个额度,免费额度,然后同时每一个视频只能帮你生成前三秒,所以能看到内容比较有限,但是你大概可以去体验到这个产品,要使用的话直接 Google GEN two 就可以找到它的官网。OK,那接下来我会简单的给大家演示一下其中几款主要产品的使用。


最后和大家分享一下我认为未来的趋势。我认为第一是内容爆炸,这个其实我刚刚也跟大家分享过了,图片视频领域包括游戏的数量都会暴涨,因为像游戏的成本也急剧的下降,在游戏当中制作内容不管是图片还是 3D 模型都会变得便宜很多,所以未来一定是内容爆炸的时代,而且制作内容的能力会进一步下放到每一个人,每个人都可以去做一个非常优质的内容,甚至有每个人都可能具可以有具备做自己的游戏的能力。


第二个我认为一个很大的趋势是软件会吞噬一切,这原因其实也是一样的,因为软件的成本紧急的下降,以前不可能的事情也会变得可能。比如说软件其实是很难定制化,那么未来有没有可能定制到个人的级别?个人定制软件为什么不能?比如说每个人都可以有自己的时间管理习惯,每个人都可以有自己的健身计划,都可以用一些可能更适合自己的使用的软件的方式去整合,至少到公司这个级别,首先就有可能哪怕个人的级别到不了,那么在公司级别,那原本的最大的问题在于成本,但是有了 AI 之后完全有可能使得开发这样一款公司管理的软件店的成本足够低,成本降低到原先的 10% 到20%,有一个同学就可以很短的时间内开发出来,那么这个软件就可以高度的根据我们公司的需要克制化。那这是有可能的,因为软件的权利,应该说一切内容的或者数字的权利都在下放,都在变得更低,更廉价,都在变得更泛滥,都在变得无处不在。


AI信息大汇总:一生一次的机会![内部分享]的评论 (共 条)

分享到微博请遵守国家法律