我最早做 baoyu-skills 也是这个思路,就是整一堆 styles(风格),然后选一个,但是这个的问题在于你很难穷举所有的风格。
后来我换了个思路:不去穷举风格,而是把"风格"拆解成多个独立维度。以我的 baoyu-cover-image 为例,我把封面图的风格拆成了 6 个维度:
1. 构图类型
2. 色彩方案
3. 渲染风格
4. 文字层级
5. 情绪强度
6. 字体风格
每个维度各有几个可选值,互不干扰。
这样做的好处是,总共只需要维护 32 个选项,但排列组合能产生 15,552 种风格变体。如果用穷举的方式,你得手工定义上万种 style,根本不现实。
同时为了降低使用门槛,我做了三层设计:
第一层是自动推荐,根据文章内容在每个维度上自动选值,用户什么都不用管;
第二层是 Style Presets,一个关键词同时设定多个维度,比如 --style blueprint 一步到位;
第三层是持久偏好文件,把你常用的默认值存下来,每次自动加载。
就是用组合替代枚举,用正交分解替代穷举。这个思路不只适用于封面图,任何需要个性化定制的 AI 应用都可以借鉴。
点击图片查看原图