视觉技能
视觉技能用于帮助您处理与图片、视频和品牌视觉相关的工作。您可以通过会话完成商品图编辑、图片生成视频、虚拟试穿、Logo 设计以及多语言视觉适配等任务。
适用场景
- 想快速生成营销主图、横幅或多场景商品图
- 想把静态图片转成短视频或演示视频
- 想为品牌生成 Logo 或补齐基础视觉素材
- 想将带文字的图片做本地化翻译与重绘
如何调用
- 直接输入自然语言指令,例如:
帮我把这张产品图扩展成首页横幅根据这张图生成一段 5 秒短视频帮我设计一个品牌 Logo把这张海报翻译成日文并保留原来的版式
常见用法
图片转视频
- 基于现有产品图生成适合社媒或详情页使用的短视频
- 可继续补充风格、时长、节奏和展示重点
虚拟试穿与图像编辑
- 上传服饰图或模特图,生成试穿效果
- 支持抠图、扩图、替换背景、局部修改等常见处理
产品套图与营销素材
- 从一张商品图延展出多场景、多角度素材
- 帮您统一视觉风格,便于用于详情页、广告或社媒发布
Logo 与品牌视觉
- 根据品牌名称、行业和风格偏好生成 Logo 方案
- 可继续补充颜色、元素、字形或气质方向
多语言视觉适配
- 识别图片中的文字内容
- 翻译为目标语言后,尽量按原版式回填到图片中
输出结果
视觉技能通常会输出以下一种或多种结果:
- 编辑后的图片
- 视频草稿或成片
- Logo 方案
- 多场景视觉素材
- 翻译并重绘后的图片版本
使用建议
- 上传原图时尽量保证主体清晰、分辨率足够
- 如果有品牌风格或参考方向,建议在指令里一并说明
- 如果结果要用于特定渠道,也可以直接说明用途,例如首页横幅、TikTok 视频或详情页主图