1. Midjourney
Midjourney 快速入门
AI 绘画的”天花板”,艺术风格最惊艳的设计师首选,2026 年已经有网页版正式开放。
这是什么?适合谁?
Midjourney 是 2022 年 3 月由 David Holz 创立的 AI 图像生成工具,2026 年 6 月主推 V8 系列模型。V7/V8 时代 Midjourney 的图像质量继续引领行业,在”艺术性”、“风格化”、“画面美感”上仍然被公认为第一梯队。它是全球用户量最大的 AI 绘图工具之一,Discord 社区曾有 2000 万+ 用户,虽然 2024 年起 Midjourney 推出了独立网页版(告别 Discord 强制),但社区氛围仍然非常活跃。
相比 DALL-E 3、Stable Diffusion,LiblibAI,Adobe Firefly,Midjourney 的差异化是”艺术风格独特性 + 美感上限最高”。它的模型在”画面氛围、构图、光影、细节”上训练得特别细致,生成图经常”第一眼就让人惊叹”。代价是:1)它对 prompt 的”服从度”比 DALL-E 3 弱(更”自由发挥”);2)没有”画文字”能力(Ideogram 强);3)中文 prompt 支持弱,英文效果远好于中文;4)订阅价格较高($10-120/月)。
适合谁?四类人最受益:一是艺术家、概念设计师、插画师,Midjourney 是激发灵感的”效率工具”;二是品牌设计师、广告创意人,需要快速出”视觉惊艳”的概念图;三是游戏/影视从业者,做角色设定、场景概念图;四是对”画面美感”要求高、愿意花时间调 prompt 的创作者。注意:Midjourney 不适合”精确还原描述”(DALL-E 3 强)、“画带文字的图”(Ideogram 强)、“零 prompt 基础”(Firefly 强)。
准备工作
- 设备要求:网页版/Discord 客户端/iOS/Android App
- 账号要求:邮箱或 Google/Discord 账号
- 付费要求:
Basic Plan$10/月(约 200 张图,仅限自己用);Standard Plan$30/月(15 小时快速生成,无限慢速);Pro Plan$60/月(30 小时快速,Stealth 模式);Mega Plan$120/月(60 小时快速) - 网络要求:网页版需要国际网络连接;Discord 客户端需要国际网络连接
- 可选准备:Discord 账号(网页版虽然独立,但 Discord 社区仍然是灵感来源)
3 步快速上手
第 1 步:注册账号
浏览器访问 https://www.midjourney.com,点击 “Sign In”,用 Google 或 Discord 账号登录。第一次登录会引导订阅,选 Basic($10/月)起步即可。
第 2 步:进入 Create 页面
登录后左侧栏点 “Create”,进入图像生成界面。中间是 prompt 输入框,左侧是参数面板(版本、比例、风格化程度、负面 prompt 等)。
第 3 步:跑第一个任务——生成一张艺术风景图
在 prompt 框输入:
A serene Japanese garden in autumn, with red maple trees,
a stone bridge over a koi pond, soft morning mist,
cinematic lighting, photorealistic, 8K --ar 16:9 --v 8 --s 750
参数说明:--ar 16:9 是 16:9 比例;--v 8 是 V8 模型;--s 750 是”风格化程度”(0-1000,越高越有艺术感)。点 “Generate”,等待 30-60 秒。
预期输出:4 张 1024x1024 候选图,带 U1-U4 编号。点击 U1-U4 可以”放大”某张图,点击 V1-V4 可以基于某张图”变体”。
进阶玩法:用 --cref [图片URL] 参数上传参考图,让 Midjourney 基于参考图风格生成新图(角色参考);用 --sref [图片URL] 上传风格参考图。
常见踩坑
踩坑 1:基础订阅不够用
- 症状:用 Basic Plan($10/月)生成了几十张图,提示”GPU minutes exhausted”
- 原因:Basic Plan 每月约 200 张图额度,高清放大(2x Upscale)消耗更快
- 解决:升级到 Standard($30/月);减少 Upscale 次数;用完等次月
踩坑 2:中文 prompt 效果差
- 症状:用中文”画一只猫”,生成的图风格怪怪的
- 原因:Midjourney 训练以英文为主,中文 prompt 理解有限
- 解决:用英文 prompt 效果最好;把中文描述先用 ChatGPT 翻译成专业英文 prompt
踩坑 3:生成的图”听不听话”
- 症状:prompt 里强调”无文字”,生成的图里仍然有乱码文字
- 原因:Midjourney 在”画文字”上能力弱
- 解决:在 prompt 里加 “—no text, no letters, no words”;生成后用 PS 文字工具覆盖;或者用 Ideogram 画带文字的图
踩坑 4:Stealth 模式需要 Pro
- 症状:生成的图想”不公开”,但没找到隐藏选项
- 原因:Midjourney 默认所有图在 Discord/网页”Explore”里公开,只有 Pro($60/月)及以上有 Stealth 模式
- 解决:升级到 Pro;或者用
/private命令(部分版本支持)
踩坑 5:画人脸”像外国人”
- 症状:prompt 说”亚洲女孩”,生成的脸偏向欧美人
- 原因:Midjourney 训练数据以英文/欧美为主
- 解决:在 prompt 里强调 “East Asian features, Chinese woman”;用
--cref上传参考图;用 AI 写真工具替换脸
踩坑 6:API 调用权限问题
- 症状:用 Python 调用 Midjourney API,返回 401
- 原因:Midjourney 没有官方 API,只有 Discord Bot API(非官方)
- 解决:目前主要通过网页版/Discord 客户端;或者用第三方包装 API(类似 GoAPI、Replicate);企业级需求考虑自托管 SD/Firefly
初级用法
1. 文生图 + 参数调节:基础用法,prompt + --ar (比例) + --v (版本) + --s (风格化) + --c (混乱度)。新手建议用社区模板 prompt,自己改改细节。
2. 多图组合 / 图片混合:用 /blend 命令,上传 2-5 张图,Midjourney 会自动混合它们的元素,生成新图。适合”风格融合”、“元素组合”。
3. 用 /describe 反向出 prompt:上传一张图,用 /describe 命令,Midjourney 会给出 4 个”猜测的 prompt”,你可以学习”老手怎么写 prompt”。
高级玩法
1. 用 —cref 做角色一致性:V7/V8 引入的 --cref 参数,上传一张参考图,Midjourney 会在新图里”复刻”角色外观(脸型、发型、服装),适合”生成同一角色在不同场景的图”——漫画、绘本、游戏角色。
2. 用 —sref 做风格一致性:--sref 参数上传风格参考图,Midjourney 提取”风格 DNA”,在新 prompt 里保持相同风格。适合”系列插图、品牌视觉统一”。
3. 用 —sref + —cref + —cw 组合:在 V7 之后可以”角色参考权重”(—cw, 0-100),精细控制”复刻多少”。--cw 100 严格复刻,--cw 0 只参考服装。
4. 用 Permutation Prompts 批量测试:用 {a, b, c} 语法,Midjourney 会自动生成 3! = 6 个组合的图,适合”快速对比不同元素组合”。例如 a {red, blue, green} car in {city, forest, beach} 会自动生成 9 张图。
5. 用 Niji 模式做二次元:加 --niji 6 参数,切到 Niji 模型,专门生成二次元风格。
小技巧
- 快捷键:网页版
Ctrl/Cmd+Enter发送,/调出命令菜单 - 种子 (Seed):在生成结果右上角”✱“图标,可以看到 seed 值,用
--seed 12345复现结果 - 变体 (V):在 4 张候选图里,点 V1-V4 可以基于该图做”小幅变体”
- 放大 (U):U1-U4 放大单张图,Upscale(2x)、Upscale (Creative)、Upscale (Subtle) 三种模式
- 参数顺序:参数可以放在 prompt 末尾,顺序无要求;常用参数建议保存为预设
- 重做 (R):R1-R4 重新生成 4 张候选图,基于原 prompt
参考链接
- Midjourney 官网:https://www.midjourney.com
- Midjourney 文档:https://docs.midjourney.com
- Midjourney 社区:https://discord.gg/midjourney
- Midjourney 风格速查:https://docs.midjourney.com/docs/parameter-list
- 知乎”Midjourney 教程”专题:https://www.zhihu.com/topic/27609123
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
2. Midjourney
Midjourney 完全指南:AI 绘画入门到精通
当前最受欢迎的 AI 图像生成工具,开箱即用的优秀 AI 绘画选择
⭐ 评分: 9.5/10 💰 价格: Basic $10 / Standard $30 / Pro $60 / Mega $120 月 🏢 厂商: Midjourney 🌐 官网: midjourney.com
📋 评测信息
项目 内容 信息来源 基于官方文档整理 质量等级 ✅ verified(基于官方文档验证) 信息来源标注:功能与定价来自 Midjourney 官网及官方文档;图像质量评价基于公开评测和社区反馈整理。
⚠️ 声明:本文基于公开资料整理。
一、什么是 Midjourney?
Midjourney 是目前最受欢迎的 AI 图像生成工具,由 Midjourney 公司开发。公司由 David Holz(大卫·霍尔茨,前 Leap Motion 创始人)创立,于 2022 年 7 月开启公测。它以出色的图像质量、丰富的艺术风格、活跃的社区著称,是很多设计师、艺术家、爱好者的首选 AI 绘画工具。
Midjourney 最初完全运行在 Discord 上,只需一个 Discord 账号即可开始使用。2024 年 12 月官方网页版正式发布后,Web 版逐步成为主流入口,完成了从”纯 Discord”到”Web 优先”的产品转型。
关键版本时间线:
| 时间 | 事件 |
|---|---|
| 2022-07 | 公测,基于 Discord |
| 2023-12 | V6 发布 |
| 2024-08 | V6.1 发布 |
| 2024-12 | Web 版正式发布(告别纯 Discord) |
| 2025-04 | V7 发布 |
| 2025-12 | V7.1 / Niji 7 发布 |
市场数据(基于公开资料整理,截至 2025-12):
- 付费订阅用户超过 2000 万
- 累计生成图片超过 100 亿张
- 企业客户超过 50,000 家(包括 Adidas、BBC、AutoZone、Cisco、HP、Salesforce、Unity 等)
- 年收入(ARR)约 $5 亿+
- 2024 年中估值约 $100 亿
二、Midjourney 主要特点
- 图像质量顶尖:生成的图片细节丰富,构图美观,艺术感强
- 风格多样:从照片写实、二次元动漫到抽象艺术,各种风格都能驾驭
- 版本更新快:从 v1 到 v7,不断提升质量和文字理解能力;V7 在艺术风格和复杂场景表现上进一步领先
- 社区活跃:每天都有大量创作者分享作品和提示词
- 功能丰富:支持图生图、放大、Variation 变化、区域重绘、风格引用(—sref)、角色引用(—cref)等高级功能
- Niji 动漫引擎:Niji 7(2025-12 发布)专为日本动漫风格优化,角色一致性比 V7 更强,线条质量接近手绘,适合漫画、轻小说、动画概念图
三、Midjourney 价格方案
| 方案 | 价格 | 快速 GPU 时间 | 核心特点 | 适合人群 |
|---|---|---|---|---|
| Basic | $10/月 | 3.3 小时(约 200 张) | 有限慢速生成 | 个人爱好者轻度使用 |
| Standard | $30/月 | 15 小时(约 900 张) | 不限慢速生成 | 大多数创作者 |
| Pro | $60/月 | 30 小时(约 1800 张) | Stealth Mode(隐身模式),不限快速生成 | 重度创作者、专业用户、品牌方 |
| Mega | $120/月 | 60 小时(约 3600 张) | Stealth Mode + 优先排队 | 设计公司、广告公司、工作室 |
| Enterprise | 联系销售 | 定制 | 大型企业定制 | 大型设计公司、电影工作室 |
提示:按 GPU 时间收费,快速生成消耗 GPU 时间,慢速生成不消耗(Standard 及以上不限慢速)。如果你只是偶尔画图,Basic 就够了;每天都用建议选 Standard;商业创作需要隐私保护建议选 Pro(Stealth Mode 为 Pro 独家,生成的图不在社区公开)。
四、Midjourney 入门:第一步怎么画?
1. 准备工作
- 注册 Discord 账号或访问 Midjourney 网页版
- 加入 Midjourney 官方 Discord 服务器,或在网页版直接开始
- 订阅付费计划(免费试用已经取消了)
- 在 Discord 任意一个 newcomer 频道输入
/imagine开始画图,或在网页版创作页面直接输入提示词
2. 基本提示词写法
最简单的格式:/imagine prompt: [描述] --ar 宽高比
示例:
/imagine prompt: a cute cat sitting on a window, rainy day, warm lighting, cinematic photo --ar 16:9
解释:
a cute cat sitting on a window:主体描述rainy day, warm lighting, cinematic photo:风格、氛围描述--ar 16:9:指定图片宽高比为 16:9
3. 常用参数
| 参数 | 作用 | 示例 |
|---|---|---|
--ar | 设置宽高比 | --ar 16:9 |
--v 7 | 使用 v7 版本 | --v 7 |
--style raw | 更写实,减少艺术化 | --style raw |
--sref | 引用风格,提升跨图风格一致性 | --sref [图片URL] |
--cref | 引用角色,保持角色一致性(V6 起) | --cref [图片URL] |
--no | 排除不需要的元素 | --no trees |
五、Midjourney 使用技巧
1. 提示词结构建议
好的提示词结构:
主体 + 细节 + 场景 + 光线 + 风格 + 画质 + 参数
示例:
photograph of an old man walking in a rain forest, fog, morning sunlight filtering through leaves, National Geographic style, hyper detailed, 8k --ar 16:9 --v 7
2. 从参考图开始
你可以上传一张图片作为参考,Midjourney 会参考它的构图和风格生成新图。只需要把图片链接放在提示词最前面。
3. 使用 V 和 U 按钮
生成四张图后:
- U:Upscale,放大选中的这一张
- V:Variation,基于这一张变化出四张类似的图
如果你喜欢构图但细节不对,可以用 V 再变化几次。
4. Zoom Out 功能
Midjourney v6 起支持 Zoom Out,可以把画好的图往外扩展,创作更大场景,非常实用。
5. 使用 —sref 和 —cref 保持一致性
--sref(风格引用):上传一张风格参考图,后续生成的图片自动保持相同的视觉风格,大幅提升跨图风格一致性--cref(角色引用):上传一张角色参考图,在不同场景中生成同一角色,适合漫画连载、品牌 IP 等需要角色统一的创作场景
6. Web 版的 Image Wall 找灵感
网页版的 Image Wall(图像墙)是浏览社区作品、寻找灵感的最佳方式。每天花 30 分钟浏览社区作品,有助于发现新的提示词思路和风格方向。
六、竞品简介
- Stable Diffusion:开源免费、可本地部署、可训练自己的模型、自由度更高,但需要一定技术基础;不想折腾选 Midjourney,喜欢定制选 SD。
- DALL-E 3:理解提示词更准确、文字生成更好,集成在 ChatGPT 里方便;Midjourney 则在艺术感和风格多样性上更胜一筹。
- Flux Pro:角色一致性强、专业商业级,$0.05/张;Midjourney 在艺术质量和社区生态上更突出。
📋 多维度简评、详细竞品对比和用户反馈请查看 Midjourney 多维度简评
七、常见问题 FAQ
Q1:Midjourney 生成的图片能商用吗?
A:订阅用户可以商用,但需查看具体方案条款。Pro 及以上方案提供 Stealth Mode,适合商业创作。
Q2:Midjourney 支持中文吗?
A:支持,但用英文提示词效果更好、更精确。建议用英文写 prompt。
Q3:免费试用还有吗?
A:免费试用已经取消,必须订阅付费计划才能使用。
Q4:网页版和 Discord 版有什么区别?
A:网页版更直观,支持历史记录、收藏夹、实时参数调整;Discord 仍是重要入口,社区互动更活跃。
📚 参考资源
- 官方文档:docs.midjourney.com(V7 + Niji 7 详细说明)
- 官方博客:midjourney.com/blog(完整更新日志)
- 案例库:midjourney.com/showcase(50,000+ 企业作品)
最后更新:2026-06-17 · 作者:MagicNetWorld
3. Midjourney 多维度简评
Midjourney 多维度简评
本文基于公开资料整理,对 Midjourney 进行多维度分析
📊 评分明细
| 维度 | 权重 | 得分 (/10) | 评分依据 |
|---|---|---|---|
| ⚙️ 功能 | 30% | 10.0 | 图像质量业界顶尖、丰富艺术风格、角色一致性、网页版+Discord、活跃社区 |
| ✨ 输出质量 | 25% | 10.0 | 输出质量SOTA、艺术表现力强、细节丰富、风格多样 |
| 🖐️ 易用性 | 15% | 9.5 | Discord操作有学习曲线、网页版更直观、新手需适应 |
| 💰 价格 | 15% | 9.0 | Basic $10/月起、无免费版、Standard $30/月主流选择 |
| 🔒 稳定性 | 10% | 10.0 | 服务稳定、图像生成快速、版本迭代频繁(V6→V7) |
| 🛡️ 隐私 | 5% | 9.0 | 生成图像归用户所有、隐私政策透明、企业版可用 |
| 加权总分 | 100% | 9.7 | 最终得分 = 各维度得分 × 权重的加权总和 |
深度竞品对比
vs Stable Diffusion
- Midjourney:开箱即用,不用部署,质量稳定,但不能本地部署,按次收费
- Stable Diffusion:开源免费,可以本地部署,可以训练自己的模型,自由度更高,但需要折腾
怎么选:不想折腾选 Midjourney,喜欢折腾想自由定制选 SD。
vs DALL-E 3
- Midjourney:艺术感更强,风格更多样,社区生态好
- DALL-E 3:理解提示词更准确,文字生成更好,集成在 ChatGPT 里方便
vs Flux / GPT-4o 图像生成(2026 年新增竞品)
| 维度 | Midjourney V7 | GPT-4o 图像 | Flux Pro 1.1 | Stable Diffusion 3.5 |
|---|---|---|---|---|
| 艺术质量 | ⭐⭐⭐⭐⭐ 突出 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 文字渲染 | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| 角色一致性 | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 生成速度 | ~30 秒 | ~15 秒 | ~10 秒 | ~5 秒(本地) |
| 价格 | $10-$120/月 | 含在 ChatGPT Plus | $0.05/张 | 免费(本地) |
| 适合 | 艺术 / 品牌 | 通用 / 文字 | 一致性 / 专业 | 自部署 / 自定义 |
综合建议:艺术创作和品牌设计首选 Midjourney Pro;通用图像和文字渲染可选 ChatGPT Plus(GPT-4o 图像);角色一致性需求可关注 Flux Pro;本地部署和自定义选 Stable Diffusion。
用户反馈
优点
✅ 出图质量稳定:平均水平比很多开源模型高 ✅ 开箱即用:不需要部署,有网就能用 ✅ 功能更新快:持续加新功能,Zoom Out、Vary (Region)、—sref、—cref 都很好用 ✅ 社区氛围好:容易找到灵感和提示词参考 ✅ Web 版体验提升:2024-12 Web 版发布后,历史记录、收藏夹、实时参数调整等功能大幅改善使用体验 ✅ Niji 动漫引擎:Niji 7 专为动漫风格优化,角色一致性和线条质量出色
缺点
❌ 收费:免费试用取消了,必须订阅才能用 ❌ 依赖 Discord:虽然出了网页版,Discord 仍是重要入口 ❌ 商用注意条款:订阅用户可以商用,但要看具体方案条款 ❌ 中文理解一般:用英文提示词效果更好 ❌ V7 版权争议:训练数据包括艺术家作品,引发相关诉讼,商用前需评估风险 ❌ 文字渲染较弱:相比 DALL-E 3 / GPT-4o 图像生成,文字渲染能力差距明显 ❌ 不能本地部署:对比 Stable Diffusion / Flux 缺少本地部署选项
总结与建议
Midjourney 目前仍然是开箱即用的优秀 AI 绘画工具。最新的 V7 版本在艺术风格和复杂场景表现上进一步领先,Niji 7 动漫引擎为动漫创作者提供了专业级工具。2024-2026 年的 Web 版转型让使用体验大幅改善,从”极客玩具”走向”主流工具”。
适用场景建议
- 艺术创作和品牌设计 → Midjourney Pro(首选)
- 精准文字渲染和对话式创作 → DALL-E 3 / GPT-4o 图像生成
- 完全自由的定制和本地部署 → Stable Diffusion
- 角色一致性核心需求 → Flux Pro
本文基于公开资料整理。
报告生成时间:2026-06-17 · 作者:MagicNetWorld
同分类推荐
AI图像生成 分类下的其他工具