视觉技能

视觉技能用于帮助您处理与图片、视频和品牌视觉相关的工作。您可以通过会话完成商品图编辑、图片生成视频、虚拟试穿、Logo 设计以及多语言视觉适配等任务。

适用场景

想快速生成营销主图、横幅或多场景商品图
想把静态图片转成短视频或演示视频
想为品牌生成 Logo 或补齐基础视觉素材
想将带文字的图片做本地化翻译与重绘

如何调用

直接输入自然语言指令，例如：
- 帮我把这张产品图扩展成首页横幅
- 根据这张图生成一段 5 秒短视频
- 帮我设计一个品牌 Logo
- 把这张海报翻译成日文并保留原来的版式

常见用法

图片转视频

基于现有产品图生成适合社媒或详情页使用的短视频
可继续补充风格、时长、节奏和展示重点

虚拟试穿与图像编辑

上传服饰图或模特图，生成试穿效果
支持抠图、扩图、替换背景、局部修改等常见处理

产品套图与营销素材

从一张商品图延展出多场景、多角度素材
帮您统一视觉风格，便于用于详情页、广告或社媒发布

Logo 与品牌视觉

根据品牌名称、行业和风格偏好生成 Logo 方案
可继续补充颜色、元素、字形或气质方向

多语言视觉适配

识别图片中的文字内容
翻译为目标语言后，尽量按原版式回填到图片中

输出结果

视觉技能通常会输出以下一种或多种结果：

编辑后的图片
视频草稿或成片
Logo 方案
多场景视觉素材
翻译并重绘后的图片版本

使用建议

上传原图时尽量保证主体清晰、分辨率足够
如果有品牌风格或参考方向，建议在指令里一并说明
如果结果要用于特定渠道，也可以直接说明用途，例如首页横幅、TikTok 视频或详情页主图