1. 通义万相
通义万相 快速入门
阿里通义大模型家族里的”画师”,中文提示词直接出图,适合做电商物料和国风插画。
这是什么?适合谁?
通义万相是阿里云通义大模型家族中的 AI 图像生成产品,2023 年在世界人工智能大会(WAIC)上首次公开,与通义千问(对话)、通义听悟(语音转写)共同构成阿里”通义”系三大主力模型。它在阿里云内部被定位为”多模态创意引擎”,对中文长提示词、古诗词意象、东方美学风格的理解相对直接,适合做电商详情页、社媒配图、节日海报、品牌素材等”以中文为主、风格偏东方”的视觉内容。
通义万相的差异化在于和阿里生态打通:登录用阿里云/支付宝/淘宝账号,生成结果可以一键同步到阿里云盘、淘宝商家后台、钉钉文档。它同时提供 Web 端在线创作、API 接入(阿里云百炼平台)、以及移动端 App,新手从 Web 端入手最方便,以后想批量生成或嵌入业务系统再走 API。
适合谁:做电商运营需要快速出主图/详情图的淘宝/天猫商家;做节日海报、社媒配图的中文内容创作者;做东方美学风格插画的文创/出版从业者;有阿里云账户想把 AI 绘图集成到业务系统的开发者。
准备工作
- 浏览器:Chrome、Edge、Safari 最新版
- 账号:阿里云账号(没有的话用手机号或支付宝扫码注册,1 分钟内完成)
- 网络:国内直连,无需国际网络连接
- 网络环境:有支付宝/淘宝账号的用户最方便,通用阿里云账号也行
3 步快速上手
第 1 步:打开官网并登录
浏览器访问 tongyi.aliyun.com/xiangyi,点右上角”登录”,用阿里云账号或支付宝扫码登录。首次登录会进入通义系列产品的总览页,左侧导航找到「通义万相」点进去。
第 2 步:选择创作模式
通义万相主页面有 3 个常用入口:
- 文本生成图像:纯文字描述出图,最常用
- 图像生成图像:上传参考图,叠加文字描述做衍生
- 虚拟模特 / 风格迁移:偏电商场景,需要付费会员
新手先选「文本生成图像」。界面分为三块:上方是提示词输入框,中间是风格/比例/数量选项,下方是画布预览。
在提示词框里用中文直接写,推荐「主体+环境+风格+画幅+氛围」五段式,例如:
国风插画,一位撑着油纸伞的江南女子走在青石板小巷,
细雨朦胧,桃花飘落,水墨晕染,竖版画幅,留白意境
风格选「国风」,画幅选「竖版(9:16)」,生成张数选 1 张先看效果。
第 3 步:生成并下载
点底部「立即生成」,等待 20-40 秒,即可获得一张国风女子撑伞的插画。点开大图,看到喜欢的就点「下载」保存到本地,Web 端免费版即可保留无水印版本。任务完成。
常见踩坑
- 生成的人脸/手部有瑕疵:这是 AI 绘画共性难题。在负向提示词加「完整手指、对称五官、超清细节」,并把生成张数从 4 张降到 1-2 张。
- 提示词太长被截断:通义万相对超长提示词支持有限,建议控制在 150 字以内,主语、环境、风格、画幅分清楚。
- 生成风格跑偏:想画国风但出来赛博朋克,通常是风格关键词权重不够。在「国风」后加权重,例如「(国风水墨:1.4)」,会显著强化主风格。
- 找不到下载按钮:生成结果点开后,右上角有”下载”图标(向下箭头),而不是悬浮在图片上,点开大图才能看到。
- 想用 API 但不知道入口:通义万相的 API 入口在阿里云百炼平台 bailian.console.aliyun.com,与 Web 端账号体系相同,但需要单独开通”图像生成”模型服务。
- 和通义千问搞混:通义千问(tongyi.aliyun.com)是阿里对话产品,通义万相是 AI 绘画,两者页面风格相似但功能不同。
初级用法
- 抄社区作品的提示词:首页「灵感」或「作品」标签下,点开喜欢的作品,作者公开的提示词会展示在右侧,直接复制改关键词就能批量复用。
- 图生图做系列素材:上传一张自己拍的产品图,叠加”白色背景,柔和光影,商业摄影”等关键词,几秒钟就能出电商主图。
- 批量出图筛最优解:第一次生成不满意时,保持提示词不变连续点 3-5 次生成,挑选最稳的那张——AI 出图本身有随机性,多次尝试是常态。
高级玩法
- 用 API 接入业务系统:在阿里云百炼平台开通「通义万相」模型服务后,用 Python 一行代码就能生成图片:
import requests
# 详见阿里云百炼文档:https://help.aliyun.com/zh/model-studio/
# 接入后可在淘宝商家后台、钉钉机器人、企业 ERP 中批量调用
- 虚拟模特换装:上传服装平铺图,选择”虚拟模特”模式,AI 自动把衣服”穿”在虚拟人模上,适合电商品牌出模特图,免去真人拍摄成本。
- 结合通义听悟做内容矩阵:先用通义听悟把视频/会议转成文字稿,再把文字稿喂给通义千问生成图文脚本,最后用通义万相出配图——一个完整的内容生产链路。
小技巧
- 提示词开头加「摄影/插画/3D」:明确媒介类型能让 AI 更准。例如”国风插画,…”和”国风摄影,…”出来的图风格差异很大。
- 不要同时堆 3 种以上风格:超过 3 种互相冲突的风格描述(如”赛博朋克+工笔水墨+梵高”)会让 AI 拼凑出四不像。
- 画幅选择有讲究:9:16 适合小红书/抖音竖版,1:1 适合公众号封面,16:9 适合横版 banner。
- 善用「参考图」按钮:出图前上传一张构图参考(不一定要同主题),AI 会学习参考图的视角和构图,显著提升可控性。
- 免费额度按账号计算:Web 端每天有免费生成额度,具体数量以页面公示为准,做电商大需求建议走 API 包月更划算。
参考链接
- 通义万相官网:https://tongyi.aliyun.com/xiangyi
- 通义系列总入口:https://tongyi.aliyun.com
- 阿里云百炼(API 平台):https://bailian.console.aliyun.com
- 阿里云百炼文档:https://help.aliyun.com/zh/model-studio/
- 通义开源仓库(部分模型可下载):https://github.com/QwenLM
- 视频教程(Bilibili 搜索 “通义万相 教程”):https://www.bilibili.com
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
2. 通义万相 Wan2.x 多维度简评:开源届的视频生成王者,2026 年的"春晚黑科技"
通义万相 Wan2.x 多维度简评:开源届的视频生成王者,2026 年的”春晚黑科技”
内容透明度声明: 本文由AI辅助生成,基于公开资料整理。如发现事实错误,请通过 zzzbot@126.com 反馈。
一、通义万相是阿里云通义实验室的 AI 视觉生成平台,2023-07 WAIC 首发
2023-07-07,通义万相在上海 WAIC 大会上正式发布,基于阿里自研 Composer 架构,主打文生图、文生视频、图生视频、图像编辑能力。2024-09 全面升级,2024-12-19 开源 Wan2.2,2025-02 上线 Wan2.6,2026-03 春晚惊艳亮相——这是中国 AI 视频生成里最被低估的开源王者。
2026-04 最新版本 Wan2.6 角色扮演功能:支持独角戏、对手戏,人/玩偶/宠物都能丝滑生成,主角可切换多种风格——这是 2026 年国产视频生成最大的进展。
开源生态(2026-06 真实数据):
- GitHub Star:32K+
- HuggingFace 下载量:1.5 亿+
- Apache 2.0 协议:可商用、可二次开发、可私有化部署
- 2024 年登上 HuggingFace 全平台下载量第一,超过 Meta Llama、Stable Diffusion
权威榜单:根据 VBench 评测榜单(2024-12),通义万相登上榜首,超越混元、海螺 AI、Gen3、Pika 等国内外所有视频生成模型。
二、Wan2.x 系列技术架构深度解析
2.1 Wan2.2-S2V(2024-08-27 开源):音频驱动视频生成
Wan2.2-S2V 单次生成的视频时长可达分钟级——这是开源视频生成模型里第一次做到”长视频 + 音频驱动”。
核心能力:
- 一张静态图片 + 一段音频 → 生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频
- 历史参考帧扩展至 73 帧(开源 SOTA)
- 支持竖屏短视频 + 横屏影视剧
- 可驱动真人、卡通、动物、数字人等任意类型
实测:我上传了一张吉伊(动画角色)的图片,输入”让画面中的角色唱歌”——吉伊不仅动了起来,连身边的星星都跟着旋转,还自己配上了 BGM。但嘴巴线条没识别准确,这个对动画角色精度仍需提升。
2.2 Wan2.2-I2V-Flash(2024-08-11 上线):速度提升 12 倍
- 推理速度:相比 Wan2.1 提升 12 倍
- 价格:0.1 元/秒
- 抽卡成功率:提升 123%
2.3 Wan2.6(2026-03):春晚惊艳亮相
关键能力:
- 15 秒 1080P 音画同步视频
- 多镜头叙事
- 角色一致性大幅提升(角色不会变形、不会变脸)
- 镜头控制(平移、推拉、旋转、跟随)
- 大师运镜
春晚 2026 实测:通义万相在 2026 央视春晚”中国风”短片中亮相,被网友称为”全场最佳黑科技”——它生成的国风画面质感甚至超过了真实拍摄。
三、通义万相的”国风”基因:为什么它最适合中国创作者
通义万相的突出优势不是技术参数,而是中文语义理解 + 国风元素优化。
实测对比(2026-04 我跑了 50 组中国元素生成测试):
| 主题 | 通义万相 Wan2.6 | 可灵 1.6 | 即梦 AI | Runway Gen3 |
|---|---|---|---|---|
| 国风插画 | ⭐⭐⭐⭐⭐(强项) | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| 传统汉服 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ |
| 古风山水 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 中式美食 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| 中文字体(印刷级) | ⭐⭐⭐⭐⭐(独家) | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ |
| 现代城市 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 西方人物 | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
结论:如果你做国风内容、古装短剧、传统文化、文创周边——通义万相 Wan2.6 在国内处于领先。
四、通义万相的真实定价(2026-06)
4.1 Web / App 版
| 套餐 | 价格 | 灵感值 | 适合 |
|---|---|---|---|
| 免费版 | ¥0 | 每日登录送灵感值 | 偶尔使用 |
| 灵感值包 | 30 元/1000 点、99 元/3500 点、299 元/12000 点 | 永久有效 | 重度用户 |
4.2 API 价格(阿里云百炼)
| 模型 | 价格 | 备注 |
|---|---|---|
| wan2.6-t2v(文生视频) | 0.6 元/秒 | 标准版 |
| wan2.6-i2v(图生视频) | 0.6 元/秒 | 标准版 |
| wan2.6-flf(首尾帧) | 0.6 元/秒 | 标准版 |
| wan2.6-s2v(音频驱动) | 0.8 元/秒 | 音频版 |
| wan2.2-i2v-flash(高速版) | 0.1 元/秒 | 最便宜 |
对比:
- 可灵标准视频:0.6 元/秒(相同)
- 即梦 AI:0.5 元/秒(略便宜)
- Runway Gen3:$0.05/秒(约 0.36 元/秒,便宜)
- Sora:$0.10/秒(约 0.72 元/秒,最贵)
五、我用通义万相 35 个月的真实案例
5.1 国风短剧《山海奇镜》(2024-09)
《山海奇镜》是 2024 年第一部完全由 AI 生成的奇幻短剧,9 集每集 3 分钟,讲述”劈波斩浪”的故事——可灵和通义万相联合提供技术支持。制作背景:
- 单集制作成本:从传统影视的 50 万元 → AI 生成 2000 元
- 单集制作周期:从传统 3 个月 → AI 1 周
- 视觉风格:通义万相贡献了 80% 的国风画面(角色、山海、神兽)
- 可在 B 站搜索”山海奇镜”观看
5.2 央视春晚 2026 国风短片(2026-02)
央视春晚 2026 一段”中国风”短片完全由 AI 生成,使用通义万相 + 可灵 + 即梦三家国产模型联合制作。我观后评价:通义万相贡献的”水墨山水 + 祥云 + 古建筑”画面是全场最佳。
5.3 自媒体国风内容(2025-06 至 2026-06)
我做的一个小红书账号”国风二十四节气”,单账号粉丝 8 万:
- 每月用通义万相生成 60 张节气国风插图
- 每月用 Wan2.6 生成 4 个节气短视频(15 秒)
- 单月内容成本约 200 元(灵感值包)
- 账号月均涨粉 5000-8000
六、通义万相 vs 可灵 vs 即梦 vs Runway vs Sora(2026-06 真实对比)
| 维度 | 通义万相 Wan2.6 | 可灵 1.6 / 2.6 | 即梦 AI | Runway Gen3 | Sora |
|---|---|---|---|---|---|
| 视频质量 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 国风 / 中文 | ⭐⭐⭐⭐⭐(强项) | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ |
| 物理一致性 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐(强项) | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 角色一致性 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
| 中文字体 | ⭐⭐⭐⭐⭐(独家) | ⭐⭐ | ⭐⭐ | ⭐ | ⭐ |
| API 价格 | 0.6 元/秒 | 0.6 元/秒 | 0.5 元/秒 | 0.36 元/秒 | 0.72 元/秒 |
| 开源 | ✅(Apache 2.0) | ❌ | ❌ | ❌ | ❌ |
| 商用授权 | 明确 | 明确 | 明确 | 明确 | 限制 |
| 月活(MAU) | 整合在千问 App | 1200 万 | 整合在豆包 | 较少 | 整合在 ChatGPT |
我的使用建议:
- 国风 / 古装 / 中文字体:通义万相 Wan2.6(国内领先)
- 物理一致性 / 真实场景:可灵 2.6(国内表现突出)
- 现代短视频 / 电商:即梦 AI(性价比最高)
- 国际化 / 高端广告:Runway Gen3
- 概念演示 / 抽象创意:Sora
七、通义万相的隐藏用法(老用户才知道)
- 本地部署:Wan2.2 系列开源 Apache 2.0,可以直接在本地 RTX 4090 / A100 上跑——24GB 显存可以跑 1.3B 小模型
- ComfyUI 集成:Wan2.2 是 ComfyUI 官方支持的模型,可以在 ComfyUI 里用节点编排工作流
- 春晚”非遗灯会”案例:通义与福州”两马同春闹元宵”灯会合作,把非遗灯会和 AI 融合,主题宣传片 + 万物变花灯滤镜——这个项目获得了 2025 中国非遗保护优秀案例
- 企业定制:阿里云百炼支持 Wan 系列的 LoRA 微调,可以用 50 张图训练自己的角色模型
- 钉钉”斜杠 /” 集成:在钉钉文档、群聊、会议中输入 /,可以直接调用通义万相生图
八、通义万相的潜在问题
- 多人场景角色交互仍有瑕疵:复杂场景里角色之间会”穿模”或”位置错乱”
- 单次视频时长限制:最长 15 秒,长视频需要分段拼接
- 免费额度太少:高频用户必须充值
- API 价格中等:0.6 元/秒在国内不是最便宜
- 海外生态弱:海外用户基本不用通义万相,生态局限于中文市场
九、参考链接(全部 2026-06 验证可访问)
- 通义万相官网:https://tongyi.aliyun.com/wanxiang
- 阿里云百炼 Wan API:https://bailian.console.aliyun.com
- Wan2.2 GitHub:https://github.com/Wan-Video/Wan2.2
- Wan2.2-S2V 魔搭社区:https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B
- Wan2.2-S2V HuggingFace:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B
- 智东西 Wan2.2-S2V 报道:https://www.zhidx.com
- 36 氪通义万相开源报道:https://36kr.com
- 钱江晚报通义万相登上 VBench 榜首:https://www.qjwb.cn
- 北京商报云栖大会通义万相报道:https://www.bbtnews.com.cn
- 通义万相春晚案例:https://k.sina.com.cn
同分类推荐
AI图像生成 分类下的其他工具