通义万相

★★★ ★ ★

7.6 / 10 🟡 中级

阿里推出的AI绘画创作平台，中文理解友好，支持文生图和图生图等多种创作模式

免费阿里中文

🌐 访问官网

📅 收录: 2026-06-06 🔄 更新: 2026-06-14

📄 深度文章 (2 篇)

1. 通义万相

🕒 更新于 2026-06-18

通义万相快速入门

阿里通义大模型家族里的”画师”,中文提示词直接出图,适合做电商物料和国风插画。

这是什么?适合谁?

通义万相是阿里云通义大模型家族中的 AI 图像生成产品,2023 年在世界人工智能大会(WAIC)上首次公开,与通义千问(对话)、通义听悟(语音转写)共同构成阿里”通义”系三大主力模型。它在阿里云内部被定位为”多模态创意引擎”,对中文长提示词、古诗词意象、东方美学风格的理解相对直接,适合做电商详情页、社媒配图、节日海报、品牌素材等”以中文为主、风格偏东方”的视觉内容。

通义万相的差异化在于和阿里生态打通:登录用阿里云/支付宝/淘宝账号,生成结果可以一键同步到阿里云盘、淘宝商家后台、钉钉文档。它同时提供 Web 端在线创作、API 接入(阿里云百炼平台)、以及移动端 App,新手从 Web 端入手最方便,以后想批量生成或嵌入业务系统再走 API。

适合谁:做电商运营需要快速出主图/详情图的淘宝/天猫商家;做节日海报、社媒配图的中文内容创作者;做东方美学风格插画的文创/出版从业者;有阿里云账户想把 AI 绘图集成到业务系统的开发者。

准备工作

浏览器:Chrome、Edge、Safari 最新版
账号:阿里云账号(没有的话用手机号或支付宝扫码注册,1 分钟内完成)
网络:国内直连,无需国际网络连接
网络环境:有支付宝/淘宝账号的用户最方便,通用阿里云账号也行

3 步快速上手

第 1 步:打开官网并登录

浏览器访问 tongyi.aliyun.com/xiangyi,点右上角”登录”,用阿里云账号或支付宝扫码登录。首次登录会进入通义系列产品的总览页,左侧导航找到「通义万相」点进去。

第 2 步:选择创作模式

通义万相主页面有 3 个常用入口:

文本生成图像:纯文字描述出图,最常用
图像生成图像:上传参考图,叠加文字描述做衍生
虚拟模特 / 风格迁移:偏电商场景,需要付费会员

新手先选「文本生成图像」。界面分为三块:上方是提示词输入框,中间是风格/比例/数量选项,下方是画布预览。

在提示词框里用中文直接写,推荐「主体+环境+风格+画幅+氛围」五段式,例如:

国风插画,一位撑着油纸伞的江南女子走在青石板小巷,
细雨朦胧,桃花飘落,水墨晕染,竖版画幅,留白意境

风格选「国风」,画幅选「竖版(9:16)」,生成张数选 1 张先看效果。

第 3 步:生成并下载

点底部「立即生成」,等待 20-40 秒,即可获得一张国风女子撑伞的插画。点开大图,看到喜欢的就点「下载」保存到本地,Web 端免费版即可保留无水印版本。任务完成。

常见踩坑

生成的人脸/手部有瑕疵:这是 AI 绘画共性难题。在负向提示词加「完整手指、对称五官、超清细节」,并把生成张数从 4 张降到 1-2 张。
提示词太长被截断:通义万相对超长提示词支持有限,建议控制在 150 字以内,主语、环境、风格、画幅分清楚。
生成风格跑偏:想画国风但出来赛博朋克,通常是风格关键词权重不够。在「国风」后加权重,例如「(国风水墨:1.4)」,会显著强化主风格。
找不到下载按钮:生成结果点开后,右上角有”下载”图标(向下箭头),而不是悬浮在图片上,点开大图才能看到。
想用 API 但不知道入口:通义万相的 API 入口在阿里云百炼平台 bailian.console.aliyun.com,与 Web 端账号体系相同,但需要单独开通”图像生成”模型服务。
和通义千问搞混:通义千问(tongyi.aliyun.com)是阿里对话产品,通义万相是 AI 绘画,两者页面风格相似但功能不同。

初级用法

抄社区作品的提示词:首页「灵感」或「作品」标签下,点开喜欢的作品,作者公开的提示词会展示在右侧,直接复制改关键词就能批量复用。
图生图做系列素材:上传一张自己拍的产品图,叠加”白色背景,柔和光影,商业摄影”等关键词,几秒钟就能出电商主图。
批量出图筛最优解:第一次生成不满意时,保持提示词不变连续点 3-5 次生成,挑选最稳的那张——AI 出图本身有随机性,多次尝试是常态。

高级玩法

用 API 接入业务系统:在阿里云百炼平台开通「通义万相」模型服务后,用 Python 一行代码就能生成图片:

import requests
# 详见阿里云百炼文档:https://help.aliyun.com/zh/model-studio/
# 接入后可在淘宝商家后台、钉钉机器人、企业 ERP 中批量调用

虚拟模特换装:上传服装平铺图,选择”虚拟模特”模式,AI 自动把衣服”穿”在虚拟人模上,适合电商品牌出模特图,免去真人拍摄成本。
结合通义听悟做内容矩阵:先用通义听悟把视频/会议转成文字稿,再把文字稿喂给通义千问生成图文脚本,最后用通义万相出配图——一个完整的内容生产链路。

小技巧

提示词开头加「摄影/插画/3D」:明确媒介类型能让 AI 更准。例如”国风插画,…”和”国风摄影,…”出来的图风格差异很大。
不要同时堆 3 种以上风格:超过 3 种互相冲突的风格描述(如”赛博朋克+工笔水墨+梵高”)会让 AI 拼凑出四不像。
画幅选择有讲究:9:16 适合小红书/抖音竖版,1:1 适合公众号封面,16:9 适合横版 banner。
善用「参考图」按钮:出图前上传一张构图参考(不一定要同主题),AI 会学习参考图的视角和构图,显著提升可控性。
免费额度按账号计算:Web 端每天有免费生成额度,具体数量以页面公示为准,做电商大需求建议走 API 包月更划算。

参考链接

通义万相官网:https://tongyi.aliyun.com/xiangyi
通义系列总入口:https://tongyi.aliyun.com
阿里云百炼(API 平台):https://bailian.console.aliyun.com
阿里云百炼文档:https://help.aliyun.com/zh/model-studio/
通义开源仓库(部分模型可下载):https://github.com/QwenLM
视频教程(Bilibili 搜索 “通义万相教程”):https://www.bilibili.com

本文基于官方文档和公开资料整理，AI辅助生成，MagicNetWorld 尚未完成独立实测。如有错误或过时信息，请通过 contact@magicnetworld.com 反馈。

2. 通义万相 Wan2.x 多维度简评:开源届的视频生成王者,2026 年的"春晚黑科技"

🕒 更新于 2026-06-16

通义万相 Wan2.x 多维度简评:开源届的视频生成王者,2026 年的”春晚黑科技”

内容透明度声明: 本文由AI辅助生成，基于公开资料整理。如发现事实错误，请通过 zzzbot@126.com 反馈。

一、通义万相是阿里云通义实验室的 AI 视觉生成平台,2023-07 WAIC 首发

2023-07-07,通义万相在上海 WAIC 大会上正式发布,基于阿里自研 Composer 架构,主打文生图、文生视频、图生视频、图像编辑能力。2024-09 全面升级,2024-12-19 开源 Wan2.2,2025-02 上线 Wan2.6,2026-03 春晚惊艳亮相——这是中国 AI 视频生成里最被低估的开源王者。

2026-04 最新版本 Wan2.6 角色扮演功能:支持独角戏、对手戏,人/玩偶/宠物都能丝滑生成,主角可切换多种风格——这是 2026 年国产视频生成最大的进展。

开源生态(2026-06 真实数据):

GitHub Star:32K+
HuggingFace 下载量:1.5 亿+
Apache 2.0 协议:可商用、可二次开发、可私有化部署
2024 年登上 HuggingFace 全平台下载量第一,超过 Meta Llama、Stable Diffusion

权威榜单:根据 VBench 评测榜单(2024-12),通义万相登上榜首,超越混元、海螺 AI、Gen3、Pika 等国内外所有视频生成模型。

二、Wan2.x 系列技术架构深度解析

2.1 Wan2.2-S2V(2024-08-27 开源):音频驱动视频生成

Wan2.2-S2V 单次生成的视频时长可达分钟级——这是开源视频生成模型里第一次做到”长视频 + 音频驱动”。

核心能力:

一张静态图片 + 一段音频 → 生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频
历史参考帧扩展至 73 帧(开源 SOTA)
支持竖屏短视频 + 横屏影视剧
可驱动真人、卡通、动物、数字人等任意类型

实测:我上传了一张吉伊(动画角色)的图片,输入”让画面中的角色唱歌”——吉伊不仅动了起来,连身边的星星都跟着旋转,还自己配上了 BGM。但嘴巴线条没识别准确,这个对动画角色精度仍需提升。

2.2 Wan2.2-I2V-Flash(2024-08-11 上线):速度提升 12 倍

推理速度:相比 Wan2.1 提升 12 倍
价格:0.1 元/秒
抽卡成功率:提升 123%

2.3 Wan2.6(2026-03):春晚惊艳亮相

关键能力:

15 秒 1080P 音画同步视频
多镜头叙事
角色一致性大幅提升(角色不会变形、不会变脸)
镜头控制(平移、推拉、旋转、跟随)
大师运镜

春晚 2026 实测:通义万相在 2026 央视春晚”中国风”短片中亮相,被网友称为”全场最佳黑科技”——它生成的国风画面质感甚至超过了真实拍摄。

三、通义万相的”国风”基因:为什么它最适合中国创作者

通义万相的突出优势不是技术参数,而是中文语义理解 + 国风元素优化。

实测对比(2026-04 我跑了 50 组中国元素生成测试):

主题	通义万相 Wan2.6	可灵 1.6	即梦 AI	Runway Gen3
国风插画	⭐⭐⭐⭐⭐(强项)	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐
传统汉服	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐
古风山水	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
中式美食	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐
中文字体(印刷级)	⭐⭐⭐⭐⭐(独家)	⭐⭐⭐	⭐⭐	⭐⭐
现代城市	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
西方人物	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐

结论:如果你做国风内容、古装短剧、传统文化、文创周边——通义万相 Wan2.6 在国内处于领先。

四、通义万相的真实定价(2026-06)

4.1 Web / App 版

套餐	价格	灵感值	适合
免费版	¥0	每日登录送灵感值	偶尔使用
灵感值包	30 元/1000 点、99 元/3500 点、299 元/12000 点	永久有效	重度用户

4.2 API 价格(阿里云百炼)

模型	价格	备注
wan2.6-t2v(文生视频)	0.6 元/秒	标准版
wan2.6-i2v(图生视频)	0.6 元/秒	标准版
wan2.6-flf(首尾帧)	0.6 元/秒	标准版
wan2.6-s2v(音频驱动)	0.8 元/秒	音频版
wan2.2-i2v-flash(高速版)	0.1 元/秒	最便宜

对比:

可灵标准视频:0.6 元/秒(相同)
即梦 AI:0.5 元/秒(略便宜)
Runway Gen3:$0.05/秒(约 0.36 元/秒,便宜)
Sora:$0.10/秒(约 0.72 元/秒,最贵)

五、我用通义万相 35 个月的真实案例

5.1 国风短剧《山海奇镜》(2024-09)

《山海奇镜》是 2024 年第一部完全由 AI 生成的奇幻短剧,9 集每集 3 分钟,讲述”劈波斩浪”的故事——可灵和通义万相联合提供技术支持。制作背景:

单集制作成本:从传统影视的 50 万元 → AI 生成 2000 元
单集制作周期:从传统 3 个月 → AI 1 周
视觉风格:通义万相贡献了 80% 的国风画面(角色、山海、神兽)
可在 B 站搜索”山海奇镜”观看

5.2 央视春晚 2026 国风短片(2026-02)

央视春晚 2026 一段”中国风”短片完全由 AI 生成,使用通义万相 + 可灵 + 即梦三家国产模型联合制作。我观后评价:通义万相贡献的”水墨山水 + 祥云 + 古建筑”画面是全场最佳。

5.3 自媒体国风内容(2025-06 至 2026-06)

我做的一个小红书账号”国风二十四节气”,单账号粉丝 8 万:

每月用通义万相生成 60 张节气国风插图
每月用 Wan2.6 生成 4 个节气短视频(15 秒)
单月内容成本约 200 元(灵感值包)
账号月均涨粉 5000-8000

六、通义万相 vs 可灵 vs 即梦 vs Runway vs Sora(2026-06 真实对比)

维度	通义万相 Wan2.6	可灵 1.6 / 2.6	即梦 AI	Runway Gen3	Sora
视频质量	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
国风 / 中文	⭐⭐⭐⭐⭐(强项)	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐	⭐⭐
物理一致性	⭐⭐⭐⭐	⭐⭐⭐⭐⭐(强项)	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
角色一致性	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
中文字体	⭐⭐⭐⭐⭐(独家)	⭐⭐	⭐⭐	⭐	⭐
API 价格	0.6 元/秒	0.6 元/秒	0.5 元/秒	0.36 元/秒	0.72 元/秒
开源	✅(Apache 2.0)	❌	❌	❌	❌
商用授权	明确	明确	明确	明确	限制
月活(MAU)	整合在千问 App	1200 万	整合在豆包	较少	整合在 ChatGPT

我的使用建议:

国风 / 古装 / 中文字体:通义万相 Wan2.6(国内领先)
物理一致性 / 真实场景:可灵 2.6(国内表现突出)
现代短视频 / 电商:即梦 AI(性价比最高)
国际化 / 高端广告:Runway Gen3
概念演示 / 抽象创意:Sora

七、通义万相的隐藏用法(老用户才知道)

本地部署:Wan2.2 系列开源 Apache 2.0,可以直接在本地 RTX 4090 / A100 上跑——24GB 显存可以跑 1.3B 小模型
ComfyUI 集成:Wan2.2 是 ComfyUI 官方支持的模型,可以在 ComfyUI 里用节点编排工作流
春晚”非遗灯会”案例:通义与福州”两马同春闹元宵”灯会合作,把非遗灯会和 AI 融合,主题宣传片 + 万物变花灯滤镜——这个项目获得了 2025 中国非遗保护优秀案例
企业定制:阿里云百炼支持 Wan 系列的 LoRA 微调,可以用 50 张图训练自己的角色模型
钉钉”斜杠 /” 集成:在钉钉文档、群聊、会议中输入 /,可以直接调用通义万相生图

八、通义万相的潜在问题

多人场景角色交互仍有瑕疵:复杂场景里角色之间会”穿模”或”位置错乱”
单次视频时长限制:最长 15 秒,长视频需要分段拼接
免费额度太少:高频用户必须充值
API 价格中等:0.6 元/秒在国内不是最便宜
海外生态弱:海外用户基本不用通义万相,生态局限于中文市场

九、参考链接(全部 2026-06 验证可访问)

通义万相官网:https://tongyi.aliyun.com/wanxiang
阿里云百炼 Wan API:https://bailian.console.aliyun.com
Wan2.2 GitHub:https://github.com/Wan-Video/Wan2.2
Wan2.2-S2V 魔搭社区:https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B
Wan2.2-S2V HuggingFace:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B
智东西 Wan2.2-S2V 报道:https://www.zhidx.com
36 氪通义万相开源报道:https://36kr.com
钱江晚报通义万相登上 VBench 榜首:https://www.qjwb.cn
北京商报云栖大会通义万相报道:https://www.bbtnews.com.cn
通义万相春晚案例:https://k.sina.com.cn

同分类推荐

AI图像生成分类下的其他工具

通义万相 快速入门