Skip to content
帮助中心

视觉技能

视觉技能用于帮助您处理与图片、视频和品牌视觉相关的工作。您可以通过会话完成商品图编辑、图片生成视频、虚拟试穿、Logo 设计以及多语言视觉适配等任务。

适用场景

  • 想快速生成营销主图、横幅或多场景商品图
  • 想把静态图片转成短视频或演示视频
  • 想为品牌生成 Logo 或补齐基础视觉素材
  • 想将带文字的图片做本地化翻译与重绘

如何调用

  • 直接输入自然语言指令,例如:
    • 帮我把这张产品图扩展成首页横幅
    • 根据这张图生成一段 5 秒短视频
    • 帮我设计一个品牌 Logo
    • 把这张海报翻译成日文并保留原来的版式

常见用法

图片转视频

  • 基于现有产品图生成适合社媒或详情页使用的短视频
  • 可继续补充风格、时长、节奏和展示重点

虚拟试穿与图像编辑

  • 上传服饰图或模特图,生成试穿效果
  • 支持抠图、扩图、替换背景、局部修改等常见处理

产品套图与营销素材

  • 从一张商品图延展出多场景、多角度素材
  • 帮您统一视觉风格,便于用于详情页、广告或社媒发布

Logo 与品牌视觉

  • 根据品牌名称、行业和风格偏好生成 Logo 方案
  • 可继续补充颜色、元素、字形或气质方向

多语言视觉适配

  • 识别图片中的文字内容
  • 翻译为目标语言后,尽量按原版式回填到图片中

输出结果

视觉技能通常会输出以下一种或多种结果:

  • 编辑后的图片
  • 视频草稿或成片
  • Logo 方案
  • 多场景视觉素材
  • 翻译并重绘后的图片版本

使用建议

  • 上传原图时尽量保证主体清晰、分辨率足够
  • 如果有品牌风格或参考方向,建议在指令里一并说明
  • 如果结果要用于特定渠道,也可以直接说明用途,例如首页横幅、TikTok 视频或详情页主图