天鼎投顾:AI绘画能不能听懂需求? 离国际水平还有多远?
2023年在AI绘画领域可谓是大事件频出,先是3月17日百度发布文心一言,再是3月18日美国Midjourney公司宣布第五版AI图像生成服务在AI绘画领域再掀波澜。两个系统前后脚发布,就免不了被比较一番。总的来说,文心一言能根据简单的指令生成图片,不过遇到有歧义的词句时,系统就会出现失误。而Midjourney则几乎没有这类问题,给出的形容越准确,生成的图片就越符合要求。
文心一言能理解的文字长度有限,过于精确的描述可能会适得其反,致使其生成不符合要求的图片或是胡乱生成,目前还处于分辨指令语义的初级阶段。而Midjourney则恰恰相反,它不仅能准确理解指令,在绘画细节的处理上已经较为成熟。不过,可以预见的是,2023年将会是AI绘画迎来爆发的一年。
不少业内人士称,文心一言在算法、算力、数据方面都和Midjourney相去甚远。从数据上来看,中文本身就存在着字与字之间没有间距的问题,这就需要庞大的人力来进行分词。在算法上,相关人士估计,文心一言在底层大模型的使用层数上可能与Midjourney存在十倍左右的差距。在算力上,Midjourney和文心一言正处于不同的发展阶段。Midjourney自从2022年3月面世以来已经迭代了五代,而文心一言的AI 做图功能文心一格虽然在2022年8月就已面世,但至今还没有相关升级迭代的消息。
我们距离国际水平,还有多远的距离?相关人士指出,虽然算力的差距短时间内很难迎头赶上,但是在系统上下功夫,还是很有希望的。AI绘画走向更广阔的舞台已经是大势所趋,各大企业也正全力以赴在这条赛道上奔跑,未来成果如何,拭目以待。

文章部分数据及观点来源:深燃(shenrancaijing)
舒晓飞投顾编号:A1150613120001
以上数据、信息均来源市场公开消息,观点仅供参考学习,不构成投资建议,操作风险自担。