AIGC创业者访谈:4大赛道的机遇与挑战

关于视频的分段分点摘要(由ChatGPT生成):
1. 本月樱花园社群的主题是AI技术,邀请了四位在AI领域耕耘多年的创始人。
2. 这四位的项目涵盖了AI中文字、图片、音乐声音等四个主流领域,包括密塔写作猫、六派、七一科技和格子互动。
3. AI技术领域非常火热,但这四位创始人在这个领域里耕耘多年,对该行业有着更深刻的理解。
4. 录制的视频直播涵盖了嘉宾们自我介绍以及介绍各自的产品,旨在为观众带来一些启发。
5. 介绍了一个傻气的狐狸故事以及一个可以生成音乐的AI产品;
6. 音乐节团队致力于做AI音乐,曾将民族音乐改编为电子音乐,现推出了一款生成音乐的工具;
7. 零天格林团队开发了一个实时的流式音色转换模型,可应用于不同场景中的语音交互;
8. 音色转换的技术源于剧本杀场景中的需求,声音与场景之间有很强的匹配关系。
9. 该技术可以模仿老板的声音和时间,来进行各种会议和指令。
10. 提供了一个AI写作工具,可以根据不同领域的需求,生成文章和论文的大纲和摘要。
11. 该工具使用中文语料进行训练,更符合中国人的写作习惯。
12. 极大地提高了写作的效率,并且价格也非常实惠。
13. 声明他们正在进行一个文件生成项目,需要生成200个文件,采用机器生成方式,有两个团队在进行准备,其中写作猫的生成效果更好。
14. 创业者在选择创业项目时主要考虑趣味性、实现难度和商业价值,认为一个好玩且容易实现的项目更有吸引力。
15. 他们开发的AI绘画项目在市场上面临泄露和侵权素材等问题,错失了一些机会,但认为市场潜力仍然很大。
16. 现在市场上有很多类似的产品,但门槛较高,真正使用过的用户比较少。
17. CI在圈子里很火爆,但门槛较高,使用人数少。
18. 认为该平台擅长画偏艺术的东西,商业模式偏向于to c。
19. 南瓜模型是符合美学指标的,商业模式正在做调整,加入更多功能及玩法。
20. 目前整个领域都在混战期,谁能抢占用户心智是关键,声音也可能早晚会有类似风险。团队保持稳定而定期自我挑战。
21. 讲述了该公司从无到有,通过找到独特的应用场景,在竞争中不断壮大、发展的历程。
22. 分析了目前的竞争态势,即国际化竞争逐渐加剧,但公司依然坚守自己的技术路线,尝试各种新技术,保持积极的态度。
23. 具体介绍了公司的产品——变声器,包括它现有的功能和正在进行的新技术研究。
24. 表示公司的商业前景广泛,与服务的场景有关,它正在与游戏公司等进行合作,寻找新的应用场景。
25. 字幕翻译是通过大模型decode猜测能力来实现的,可以快速、准确地翻译,并保留音色、口音特征。
26. 在人工智能领域的进程中,音乐行业的数据量和标注不足,所以主要是在建立和标注音乐数据方面进行探索和实践。
27. 音乐自动编曲、制作、混音等方面是AI音乐的主要应用方向,但目前业内AI音乐效果较差,需要先做好数据化建模,才能解决良好商业化价值的问题。
28. AI音乐的商业化模式需要与创作者进行共同合作,提供技术支持、免费制作和发行等服务,并通过分润进行共赢。
29. 公司通过数据采集和标注帮助创作者进行音乐制作并提供分润;
30. 公司正在从数据化到智能化转型,注重创作方面的延伸,具有商业价值;
31. 公司计划在下半年做音视频结合,为视频创作者提供发行级别的音乐;
32. 音乐制作与发行赛道具有多个壁垒,包括音乐数据化门槛高、版权问题和人际渠道等,需要综合解决。
33. 生成语音有两种驱动方式,一种是按文本合成语音,一种是声音转声音,主要服务于有中间人驱动的虚拟场景。
34. 声音转声音的技术可以用于做个人IP的人,也可以用于一些游戏公司的虚拟人物形象。
35. 研发中的技术可以将明星的声音应用于自己的歌唱中,但存在版权问题需要考虑。
36. 训练一个人的声音的成本约为1万块钱,而音乐领域的声音训练成本非常高,需要采用更传统的数据驱动方法。同时,声纹识别技术难以检测生成的语音是否真实。
37. 要辨别生物指标和其他指标,需要从硬件上突破;
38. 人工智能背锅也可以成为商业模式,探讨人与机器边界和价值,解决特定场景中的背锅问题;
39. 人工智能的发展需要走更可控的神经网络模型,更可控的模型对交互更为简便,能更容易反对哪里出了问题;
40. 未来可能有一个超级巨大的模型,可以识别图片、声音等不同模态。
41. 模型能力不断提升,如音频合成模型已经能够识别图片。
42. AI开源将会是未来的趋势,通过开源来解决一些问题,并进行训练。
43. 符号派和连接派各有其优势,应分场景选择适合的AI方法来解决问题。
44. 介绍了新型的文本生成模型rw kv,以及有人认为gt p4已经到达顶峰,后续会有新的发展。
45. 个量变引起的质变,可能GB4是AI发展的一个顶峰;
46. 使用清华大学开源的文本大模型Chat GOM 可以训练数字克隆人,足以实现人机对话;
47. 讨论了在商业化过程中解决问题的方式,不应只将问题归因于技术不够好;
48. 对Gb4的抵制会带来两个世界的分裂,创业者有机会解决特定领域的问题,积累数据作为壁垒。
49. 创业者在AI领域创业时应该解决需求,提升效率,并创造价值来获得成功。
50. 老炮和年轻创业者各有优劣,老炮更清楚需求本质,年轻创业者没有束缚,更容易了解变化。
51. 创业者进入AI领域应该认真思考,不要为了套壳或者追求概念标签,应该真心投入并理解带来的价值。
52. 在使用AI技术时,需要注重合法合规,应该避免恶意竞争和互相举报,同时需要与监管机关进行交流与合作。
53. TVTFOUR网站通过举报机制进行监管,而该机制也是一种竞争手段;
54. 对于使用AI进行服务的机构,需要被识别出来进行监管,以保障使用范畴的合法性;
55. 云厂商提供的GPU价格在刊例价格上有很大的下探空间,而具体折扣会根据谈判情况和用量有所不同;
56. 掌握体能和多语言能力是不可替代的基础技能,而编程能力、写Prompt等技能不一定是适应AI时代的关键技能。
57. 很多人对人工智能的了解只停留在听说阶段,少有真正使用的人。
58. 学习体验人工智能对提升认知和写作能力重要。
59. 人工智能会改变未来就业形势,需要多学习和玩耍来提升自己的生命体验。
60. 在某些领域,如餐饮等,人工智能无法取代人类的核心竞争力。
61. AI的发展对于某些职业的取代带来很大挑战,但在一些偏重手工技术的行业,人类仍然是不可替代的。
62. 对于AI产品的用户数量和影响力,由于数据来源和统计方法的影响,真实情况可能比宣传的数据更为复杂和有限。
63. 人工智能会改变很多行业,但仍有很多个人兴趣和乐趣能够在这个过程中保存和发挥,因为人类特有的“魅力”和吸引力是AI不能取代的。
64. 在这个行业中,人们需要经常交流和思考,来更新自己的认知和获取更多的机会。
65. 作者认为应该有一个固定的交流群体,能够互相启发和讨论想法,因为每个人都接触到的信息和想法都有所偏差。
66. 中国的创业者和公司在国内被嘲笑,在国外被领先,需要互相支持和想办法缩小差距。
67. 作为从事AI创业的人,有义务向公众传达真正的AI是什么,以便大家了解和正确使用。
68. 作者建议有机会的话可以再次联合直播,共同传达信息和交流想法。