GG账号被锁定,无聊只能等解锁,对比了一下new bing和bard对lora相关问题的回答。
虽然new bing是最新的GPT,但是这些天使用bard的感觉就是,在bard开放的范围内,处理专业问题,似乎比bing更加人性,虽然也是车轱辘,但不掩饰自己的各种观点,而整个bing已经变成了一个没有生气的客服。
同样一个问题,bard会给出一个他认为合理的答案,而bing则会不知所以然,甚至把责任推到用户一边,而不是试图去给出了妥协的答案,以便让对话继续,引导出用户的想法。做法与客服无异。
这就叫自断臂膀吧……
作为一个只开放了文字功能的AI,bard胜任日常的语音服务,比如说植入系统减少人工工作,感觉也问题不大了。
当问到lion优化器的时候,bard提到了一些根本性的问题,并且也会容错很多说法上的不严谨,显得很有人情味,而bing只是简单的copy并表示你的问题……。可问题是还要怎么清晰……。
与bard的连续对话,讨论到治理和人性等问题,bard明显可以理清其中的一些逻辑,感觉比刚开放的时候要好些,也或许是错觉。建设美好社会,是优待ZF还是善待善良的人。你翻来覆去的用话术绕其中的因果,他基本上也可以理解。
【显然网页bing要好于skype的。但是他却不承认自己是gpt3😊】
比较有趣的是问他懂日文么,他甚至说了一句,然后输入日文,他又用英文表示自己不支持……
感觉谷歌之前的确是对产品不够上心,以至于一些很初步的功能都没有,但是底蕴多少还是有的。商家竞争对于顾客永远是好的。
以下是bard给出的建议。不保证正确,但是尊重bard,在训练集质量不是很高的情况下,建议使用传统的adam优化器,并且在不能正确反应角色服装的时候适当加大文本学习率,对于动画图片可以使用更小alpha数值。在使用LoHa训练动画人物的时候,你也可以尝试小于1的 conv_alpha值,这可能有助过滤一些不需要的信息。
Bard把network_dim比喻为电脑屏幕,而与之对应的alpha是发现美的眼睛。(实际上是俺比喻为纱窗,他觉得不合适……)这样或许更适合大众理解,不过new_bing面对这个问题,等于弱……
实际使用lion优化器的时候最好要设置weight_decay和betas,虽然常见weight_decay=0.1,betas=(0.9, 0.99)但是实际上俺也不大清楚,有空翻翻文档……总的来说如果不清楚,adam是最省心的,如果使用da一般可能需要更多的步数。但需要注意的是lion貌似拟合较快,需要更低的学习率,为了图省事,俺设置成5e-5。
其实对于动画人物的还原也不需要太大的network_dim和alpha,16左右的network_dim足够还原大多数动画角色,对于一些画风简单的还可以更小,衡量体积和质量俺认为是挺值得的。
如果是LoHa的话,会有conv_dim和conv_alpha的选项,conv_alpha甚至可以小到0.3,默认值已经可以达到很不错的效果。
同样是二次元人物,简单风格的X50的步数或许就有不错的效果,而同样是游戏CG,有的甚至需要X150倍的步数,选择合适的大模型是很有必要的,俺不大推荐使用NAI系列以外的,因为对你来说很多变得不可预测,泛用性可能会很差,除非你有特殊需求,比如:

很多东西也没有一个绝对数值,只能说二次元的大概也就是X100步左右就差不多了,假设学习率在默认基础上变动的不是很离谱。
alpha越小学习就越慢,dim越大复杂度就越高,这是一个平衡的问题。比如你可以设置一个很低的alpha然后将默认学习率从1e-4增加到5e-4。






图片说明中的数字代表network_dim ,network_alpha, conv_dim ,conv_alpha。
如果想生产一个高质量的LoRA,高质量的训练集是第一步,且一定要保证数量,一般来说50张左右,当然多一些更好,如果有可能可以使用画风接近的正则图片就更好了,当然图片最好裁切一致。
但是对于一般来说,我们要平衡效费比,AI肯定是越来越强,这些纯体力劳动最终也会便的毫无必要。毕竟LoRA的改进版出现的很快。
对于LoRA训练,不大建议去裁切图片,懒惰才是进步,只要别扫描画册人扔进去,因为留白也是会被学进去的,对于细长的人物全身像,直接交给webui的图片分割,AI可以识别这种被裁切的图片为一个整体,只要保证重叠率。很多工作软件会做,即便可能当下做的不好,咱们偷懒即可。
-------------------------------------------------------------------------
一般来说,我们通过两种方式来标记我们要训练的人物:
一种是在tag最前边打标:角色名,服饰名,然后删除需要被前者吸收的一些TAG,
一种方法就是指定class,比如1girl,自定义 1girl,shiki 1dog这种,这时候也就不需要你手动删除这些需要复现的tag,要保证足够的文本学习率,由于你指定了1girl,那么1girl是不应该出现在你caption文件里的。当然不同的衣服最好分文件夹。我比较推荐使用后者。
AI可以识别画面中每一个你可以识别的人,你需要做的是如何通过关键词去把这些要素呼出来,如何告诉AI你标记的单词,对应哪个人物,是黄颜色头发坐着的,还是黑颜色头发正在吃饭的。就如同你指定1girl给程序。
像四季这样的角色,本来素材就少,经不起裁切取舍了。不过好在有大量的替身正则图可用。

非专业人士,如有不严谨,莫喷,玻璃心。等账号解封无聊而已😊

