浅谈一些Lora训练和使用问题 您所在的位置:网站首页 很可爱的画风跑图的游戏叫什么 浅谈一些Lora训练和使用问题

浅谈一些Lora训练和使用问题

2024-07-10 05:09| 来源: 网络整理| 查看: 265

前言

我的c站页面(https://civitai.com/user/rerorerorero/models)

以下内容均基于秋叶大佬训练脚本和官模底模,不涉及真人训练。

污染

简单来说就是不想要的玩意啦。用动画游戏截图炼丹可能会导致画风/背景污染。一些漏掉的姿势tag会导致动作污染,等等等等。

一眼游戏截图练的,绷不住了

SD生成的AI图尽量别用,你就当它的循环次数是人工图的十倍甚至九倍,且细节差。

使用NAI也就是官模作为底模时,尽量不要采用真人图片。

要避免画风污染,尽量别选择同一作者同一来源的素材。

素材数量和循环(repeats)

一般来说以秋叶训练脚本的默认参数(dim32,batch size1,epoch10)而言,一个角色/一整套衣服在800步基本就学得差不多了,不过我还是追求达到1200步以上,毕竟稍微过拟降权可用,欠拟就没法用了。

在这个默认参数下一张图8repeats已经是很高了,10repeats基本可以认为要崩了或者已经崩了。

当你素材很多时,只需要比较少的repeats即可达到高步数了,比方说有40张高质量图,repeats设为4甚至3,这种情况下,即使某一张图有漏标错标情况(比如奇怪的背景和错误的细节),由于repeats较低,实际上对这一张图学的很少。

而当素材较少时,你难免需要对这少数的几张图进行更多的学习,那么这时打标甚至正则就非常重要了。你知道吗,不同发色头发的容许长度也是衣服的一部分。

分文件夹

分文件夹只是让不同文件夹能有不同的循环次数,实际训练还是一起炖的,文件夹名也不是触发词。何为触发词会在后面提到。

我只是希望少学点穿外套的错标漏标

tagger相比deepdanbooru有了很大改进,但即便如此漏标错标还是不能完全避免。一些漏标错标会带来相当大强度的污染。下面提一下一些常见的或者高危的问题,都是各种血泪经验。

“小臂上搁着的东西”,包括但不限于脱肩外套、脱肩和服、披肩、绑在胳膊上的袖子(detached sleeves,特别是透明的)、毛巾。污染极强,甚至你标上了,然后加个bare arms也不一定有用,这些玩意本身在一些大模型中可能权重都很高。如果素材够多我甚至会尽量避开,因为只要一张就足以让AI意识到“哇手臂上可以搁点东西!”。

双马尾一系,除了各种twintails外还有“two side up”,有时AI会给twintails打上two side up,但two side up无法吸收twintails,一旦发生错漏就会很容易让你出图的人物始终顶着双马尾(如果你本来练的就是人物lora那倒也无所谓了)。如果你也分不清twintails和two side up那建议都打上(

兽耳和头饰:包括animal ear fluff也是强污染,应避免遗漏。比较折磨人的一例是,脑后大蝴蝶结,即烧钱的托卡列夫舞娘,我试过hair bow, big bow等等,但AI还是会在不输入bow时污染成兽耳,没办法只能p掉了。

强行出现的兽耳

手势,其实打标器认不出很多手势,而danbooru的打标者也经常漏手势标,而人类画的手势也是各种各样(虽然一些在现实中即使能做出来也会发现如同招财猫)。常漏且污染严重的标包括但不限于:hand in own hair, adjusting hair, arm under breasts, holding arms, holding bottle……需要注意的是arm under breasts即胳膊在胸下,这个即使是打了标也会有大概率污染,胸越大污染越厉害,尤其huge breasts相比其他尺寸就有各种奇怪的污染。

视角,其实主要就侧后上下四个特殊视角,from side, from behind, from above, from below。建议重点关注。还有一种视角是侧后方,建议都打上。

构图和浦西,构图的tag其实是相当匮乏的,常用的无非upper body, cowboy shot, close-up,full body等等,有时则要用部位辅助。你也许见过一些巧妙地截掉了张腿露浦西的图,如果你没有别的张开腿的图,那么大概率spread legs这个tag的构图会被影响,导致使用这个lora出图时,spread legs显示的往往是上半身,此外这些图可能仍会被打上浦西甚至佩妮斯,然而画面上并没有浦西,这将有可能造成“写了浦西却看不到浦西”的情况,实际上打标器模型采用了一种取巧的方法——“猜标”,打标器有时会识别出“这是什么”,然后再根据“这是什么”反推出“它应该会有什么”然后加上去,即使画面上没有,这就会造成错标。举例来说,天狼星的泳装,在头上总是戴着一个爱心墨镜,如果你把一张泳装天狼星的头用色块遮住再放进去,你会发现tagger仍能打出墨镜的tag。

无中生有

删改标与触发词

lora一定要触发词吗?触发词怎么设?标都要删掉吗?

在回答这些问题之前,可以举一个栗子,或者说思想实验。

首先你没有lora,这时你输入white shirt, apple会出现什么?白衬衫和苹果。但这二者并没有什么关联。

苹果在左边角落

但是你希望有一件带着苹果图案的衬衫,于是你准备一堆“画有苹果图案的白衬衫”的图,并放进了打标器里。这时tagger就会打上apple, white shirt。你一个标没有删,启动了炉子,得到一个lora。

这时你练出的lora有以下几种结果:

可能一些图片的苹果画的不太标准,可能你没有在训练集里放一些纯白衬衫,抑或是练的有点过拟,你写了white shirt就能看到一个接近苹果的图案。

苹果和衬衫分离得比较好,你只有同时写上apple和white shirt时才能得到一个画有苹果的白衬衫。

欠拟了,什么也没发生。

这时,对于“绘有苹果的白衬衫”这个概念而言,触发词就是white shirt和apple

可能遇到两个问题:

写了apple, white shirt,但苹果除了出现在衬衫上还会出现在其他位置,毕竟训练时并不提供位置信息。

你寻思同时输入apple和white shirt太麻烦了!

于是你就把apple这个tag删了。于是触发词就成了white shirt。

现在你不用再输入apple,只需white shirt就能得到苹果衬衫。但请以AI的角度“思考”,它面对着这一张张训练图片时,从未得知衬衫上画的是个苹果,只知道是个红色的圆的带梗的图案。如果拟合度较高,或者这个大模型是擅长画苹果的,这个苹果图案还能画的很好,可如果降低权重,或是将lora移用到一个与训练底模差别很大时,得到的就未必是一个标准的苹果图案了。

如果你见过一些c站动漫风格角色lora下的真人返图,会发现头发是黑的。可通常训练角色lora时,我们通常会删掉发色和瞳色tag。这就是一个同类案例,相当多的真人模型在发色和脸型上都是过拟的,在没有发色tag的指导下直接将角色的发色盖掉了。可一些返图的就直接往自己的真人模型一套,感觉不是很尊重角色。

左:变成黑发的三森

简单理解,lora训练就是图像与语义建立联系的过程。在训练时多次出现的tag则更有可能“吸收”那些图像特征。使用“触发词”就是用这些tag对训练集中的图像特征进行调用。lora是赋予了一些tag特殊性,让裙子成为特殊的裙子,让头饰变成特定的头饰,你甚至可以将画风视为多个不同的概念的组合即“这样的眼睛这样的手臂”等等,但这不意味着为了出图必须使用或是记忆全部的“触发词”,人是活的lora是死的。

比如一个角色是红围巾犬耳白丝JK(雾),如果作者没删所有的特征标也没闲着搞正则化,所谓的触发词里肯定有个red scarf, white thighhighs。

删标

哪些tag可以删呢?

如果你练的是角色or服装,可以考虑先打标,然后看看哪些tag出现的比较多。

比如这是碧蓝航线的吸血鬼(誓约婚纱)。

可惜这图给C站下了

对于这衣服打标器会给出dress, wedding dress, black dress等等

因为我希望能换衣服,且感觉wedding dress一般都是白的,作为触发词效果可能不好,最后我选择了black dress,至于dress,太宽泛了,于是我把所有的dress, wedding dress, black dress统一为black dress。(如果你的角色/服装有角和翅膀也是如此,建议将宽泛的horns和wings替换为更具体的demon horns, cow horns, feathered wings等等)

以及打标器常常会把长手套认成detached sleeves或是别的什么sleeves,建议改为elbow glovs。

此外由于我练的是角色lora,不管怎么换衣服,咱吸血鬼总是白发红瞳的,所以发色和瞳色可以删掉。

不建议删除的包括:

衣服的交叉绑带,即halterneck的下级criss-cross halter;

特殊固定图案,如渔网、条纹、和菱形格;

比较小或特殊的头饰或角,比如樫野的小牛角,泥岩的尖角,呆毛尤其是爱心呆毛;

奶盖和r贴;

手套,长手套,袜子和靴子;

翅膀和尾巴 ;

某些发型,比如双麻花(删了有概率出图时跑到头顶上),普通的散发可以删;

项链耳环,特别是有特殊款式的,比如十字。

另外你可能会为角色设一个自造词,且不管这个自造词有没有用,一定要检查这个自造词能不能被读出别的含义,我曾经练过夕立(圣诞节),自造词用的是poixmas,这就导致画面总是有圣诞节的光晕和星星,嘛不过既然本来就是圣诞节皮肤那无所谓了

多合一和手动正则

多合一,可以看看 空城大佬的多合一教程,虽然他说已经过时了但还是可以参考一下。

你也许还看过我在c站写的简易cosplay服装训练法(https://civitai.com/articles/726/an-easy-way-to-make-a-cosplay-lora-cosplay-lora),或是娱乐的那个少图流训练角色。

这篇专栏里我想补充的是:

全果图对服装的影响基本可以视为完全没有(废话),以此类推,可以拿“基本不相关”的图去“污染”,去手动正则。比如说无人风景图可以用于人物/服装训练以减少画风和背景污染。

不要有人

如果你曾经试过练多合一角色lora接着发现某套衣服完全出不来——对的,较少的概念会被那些占比更多的覆盖,同时你已经在“素材数量和循环”这一部分知道,循环次数较少基本是吐不出原图的,所以有一个比较激进的手动正则法,你也可以叫它垃圾正则法(这名字不是我取的)。

即收集各种各样的高质量图片,打上全标,设为1循环,第1个tag是1girl,图片数不要超过你要练的角色的素材数x循环数。并且最好是跟你的角色衣服没啥相似度,如果你的角色素材够不多步数也堪忧,比如角色穿泳装,就别拿别的泳装一起练了。

这样能有效提高换衣服的能力,实际上你可以将之视为训练一个特殊的多合一lora,概念A是混沌多变的1girl,概念B则是有着固定特征的那个角色。

不过,即便如此,当你的素材真的很少,甚至来源也单一时,画风就很有可能绑定在衣服和人物上了。

目前就想到这么多。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有