前几天抱着新显卡想试出一套稳定出图的流程,翻遍社群教程依旧摸不透如何使用midjourney,随手敲的画面描述生成的图要么人物五官扭曲,要么背景元素杂乱堆叠,原本想要的国风山水建筑,最后跑出来满屏割裂的杂物。当时没想着调整指令参数,只反复更换画面描述词汇,连续八次出图全部达不到预期,屏幕弹出的画面细节越改越离谱,索性关掉网页发呆了半刻。
后来才反应过来,绝大多数新手都会忽略指令里的权重符号,我最开始输入关键词的时候,只会平铺所有想要的画面元素,完全没有区分主次,AI识别的时候会均匀分配画面占比,小众的国风建筑直接被大面积云雾掩盖,人物轮廓也跟着模糊。同行工作室的朋友前段时间和我聊起过这个操作逻辑,他习惯给核心画面词汇加上括号,弱化的辅助描述直接放在语句末尾,不用额外添加复杂后缀,出图的贴合度直接往上提了一大截。
一张完整的出图指令不能完整的出图指令不能只堆砌画面风格,分辨率参数的调整也藏着不少容易忽略的细节。最开始随便输入画质参数,生成的图片线条发虚,放大之后满是色块断层,原本计划用来做文创素材的图,导出之后根本没办法商用。试过把原始比例参数替换成通用的横向画幅参数,画布比例适配之后,画面留白不会过度挤压主体,人物和场景的构图平衡感肉眼可见变好。
生成图片之后的垫图操作我也走了弯路,最早上传参考图的时候直接丢进对话框,没有添加对应的参考强度指令,AI完全照搬参考图的色彩,原本构思的水墨色调直接变成厚重油画质感,反复重绘三次都没法扭转画面底色。折腾好久才搞明白,垫图链接后面跟上对应的数值,就能控制AI参考原图的幅度,数值调低会保留原创构思,数值拉高就能复刻原图的光影和配色。
不会调整种子参数的话,同一段描述词跑出来的画面差距会特别大。有一回想要复刻上一张满意的古风仕女图,直接复制整段关键词重新生成,人物衣纹、山水背景全部大变样,画面的氛围感直接丢失。调取上一张图的种子代码粘贴到指令末尾,AI会锁定基础画面结构,只在细节处做出小幅改动,想要微调画面不用重新打磨整段描述词,节省不少等待出图的时间。
我曾固执认为关键词写得越详细,生成的画面就会越贴合想法,连续半天打磨两百字的长描述,生成的画面反而元素冲突严重,古建筑的飞檐和林间仙鹤错位重叠,整体画面看着拥挤压抑。精简描述词汇之后,只保留核心主体、画风、光影三类内容,多余的装饰短句全部删掉,AI生成的画面逻辑清晰,主体突出,没有杂乱的多余元素抢占视觉重心。
关掉绘图页面的时候,指尖还停留在对话框输入栏,心里还在惋惜前一天耗费两个小时生成的废图,要是最开始就弄懂关键词权重的基础用法,根本不用反复重置绘图指令。