Yi

📋 资质核验核验日期：2026-06-14未独立实测 🔴 高级

零一万物推出的开源大语言模型，由李开复团队打造，中文能力出色，支持本地部署

开源零一万物国产

🌐 访问官网

📅 收录: 2026-06-06 🔄 更新: 2026-06-14

📄 深度文章 (2 篇)

1. Yi

🕒 更新于 2026-06-18

Yi 快速入门

李开复旗下零一万物出品,中文对话和长文本都很强,本地跑、商用都顺手。

这是什么?适合谁?

Yi 是创新工场创始人李开复牵头创立的 AI 公司”零一万物”(01.AI)推出的开源大语言模型系列,从 2023 年底发布的 Yi-6B、Yi-34B,到 2024 年的 Yi-Lightning、Yi-VL(视觉)、Yi-Coder(代码)等,在中文场景和长上下文任务上表现出色。

它适合这些用户:第一,做中文 AI 应用的开发者,Yi 在中文写作、对话、问答任务上口碑稳定;第二,做长文档处理的团队,Yi 提供 200K 上下文窗口的版本,能处理整本书;第三,需要开源商用、清晰许可的团队,Yi 采用 Apache 2.0 协议,商用无忧;第四,做 AI 基础设施的公司,需要在多卡服务器上部署大模型。

Yi 的核心优势:一,中文能力一流,在多个中文基准测试中排名前列;二,长上下文支持强(Yi-200K 支持 20 万汉字);三,模型尺寸齐全,从 6B 到 34B,适配不同硬件;四,生态完整,支持 Transformers、vLLM、LlamaFactory 等主流框架;五,衍生模型覆盖视觉、代码、对话等场景。

注意:模型许可随版本变化,使用前确认 LICENSE;大模型需要多卡或量化才能跑。

准备工作

6B 模型消费级显卡可跑(8GB+ 显存),34B 模型需要 24GB+ 显存或多卡
Linux / macOS / Windows(WSL2)
Python 3.8+,PyTorch 2.0+
CUDA / Apple Silicon MPS
至少 30GB 磁盘(34B 模型约 70GB)
基础的 Python 和命令行能力

3 步快速上手

第 1 步:安装推理工具

最简单的方案是 Ollama:

curl -fsSL https://ollama.com/install.sh | sh
ollama run yi

或者用 Python + Transformers:

pip install torch transformers accelerate

生产推荐 vLLM:

pip install vllm

第 2 步:下载模型

从 Hugging Face 下载:

pip install huggingface_hub
huggingface-cli login

# 下载 Yi-1.5-9B-Chat(综合性价比最高的版本)
huggingface-cli download 01-ai/Yi-1.5-9B-Chat \
  --local-dir Yi-1.5-9B-Chat

国内用户用 ModelScope 更快:

pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('01ai/Yi-1.5-9B-Chat', cache_dir='./')"

第 3 步:跑通对话

用 Transformers,新建 chat_yi.py:

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "Yi-1.5-9B-Chat"
tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True
).eval()

messages = [{"role": "user", "content": "用一句话介绍零一万物 Yi 大模型。"}]
input_ids = tokenizer.apply_chat_template(
    messages, add_generation_prompt=True, return_tensors="pt"
).to("cuda")

outputs = model.generate(input_ids, max_new_tokens=200)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

如果用 Ollama,终端直接对话,或者调 API:

curl http://localhost:11434/api/chat -d '{
  "model": "yi",
  "messages": [{"role": "user", "content": "你好"}]
}'

常见踩坑

trust_remote_code 必填:Yi 模型使用自定义代码,加载时要加 trust_remote_code=True,否则报错。
显存不够:Yi-1.5-9B bf16 需 ~18GB,4-bit 量化版 ~7GB;34B 量化后 ~20GB。
下载速度慢:Hugging Face 国内访问慢,推荐 ModelScope 或 hf-mirror 镜像。
上下文长度设置:Yi 默认上下文是 4K,200K 版本需要单独下载并指定 config,否则会按 4K 截断。
中文 vs 英文表现:Yi 在中文上一流,英文也不错,但代码任务不如 Qwen-Coder、Code Llama 专精。
商业许可:Yi-1.5 系列采用 Apache 2.0,Yi-VL 等衍生模型要看具体 LICENSE。

初级用法

Ollama 本地跑:终端 ollama run yi,直接对话。
Web UI:Open WebUI、LM Studio 等 GUI 工具选 Yi 模型。
API 部署:vLLM 或 Text Generation Inference 启动 OpenAI 兼容 API。

高级玩法

LoRA 微调:用 peft + transformers 微调,在中文写作、客服等场景效果提升明显。
RAG 集成:配合 LangChain、LlamaIndex 做企业知识问答。
量化部署:bitsandbytes 4-bit、GPTQ、AWQ 等,把模型压到消费级显卡。
多模态:Yi-VL 支持图像输入,可以做图片理解、OCR。
代码任务:Yi-Coder 是专门代码模型,做代码补全、审查。

小技巧

个人学习用 Yi-1.5-9B,质量好、消费级显卡能跑;生产推荐 Yi-1.5-34B 或量化版。
中文长文档任务用 Yi-200K,20 万汉字上下文,丢进去一本书都不丢信息。
国内业务、中文任务选 Yi 是稳妥选项,许可清晰、文档完整。
用 ModelScope 下载模型速度飞起,推荐国内开发者首选。
vLLM 部署 Yi-34B 吞吐量惊人,适合高并发生产环境。
微调时用 LoRA,小数据集也能出效果;Yi 在中文写作任务上微调空间大。
多卡推理用 device_map="auto" 或 accelerate 配置,自动并行。

常见问题 FAQ

Q1: Yi 模型是免费的吗？

A: 有两种使用方式：(1) 开源本地部署：Yi 系列模型（Yi-6B/9B/34B 等）在 HuggingFace 上开源，采用 Apache 2.0 许可，完全免费可用于商业用途。只需自己的硬件跑模型，无需支付任何费用。(2) Yi API 云服务：通过零一万物开放平台（platform.lingyiwanwu.com）调用，按量付费。旗舰模型 Yi-Lightning 定价 ¥0.99/百万 tokens，其他模型 ¥0.004-0.08/千 tokens，是国内性价比最高的 API 之一。支持支付宝/微信支付，新用户通常有免费额度。详见 Yi 开放平台。

Q2: 本地部署 Yi 需要什么硬件？

A: 取决于模型大小：Yi-6B（4-bit 量化 ~4GB 显存，消费级显卡可跑）；Yi-9B（bf16 ~18GB 显存，推荐 RTX 3090/4090，4-bit 量化 ~7GB）；Yi-34B（bf16 ~70GB 显存，需要 A100 或多卡，4-bit 量化 ~20GB 可在 RTX 4090 上跑）。纯 CPU 推理可用 llama.cpp（GGUF 量化版），但速度较慢。Ollama 是最简单的本地运行方式，一行命令 ollama run yi 即可。

Q3: Yi 和 Qwen（通义千问）、DeepSeek 怎么选？

A: 三者是国内开源大模型三强：(1) Yi：中文对话和写作最强，200K 长上下文是独有优势，Apache 2.0 许可商用最友好，李开复团队出品；(2) Qwen（通义千问）：模型家族最齐全（0.5B 到 110B），多语言能力更强，代码和数学推理突出，阿里生态支持最完善；(3) DeepSeek：编程能力世界领先，V3/V4 系列性价比极高，MoE 架构推理成本低。中文对话/长文档选 Yi，全能/多语言选 Qwen，编程/高性价比选 DeepSeek。

Q4: Yi 模型怎么在本地快速跑起来？

A: 最推荐三种方式：(1) Ollama：ollama run yi 一键启动，最省事；(2) LM Studio/Open WebUI：图形界面，适合非程序员；(3) vLLM：生产环境部署，启动 OpenAI 兼容 API，吞吐量最高。HuggingFace 下载模型慢的话，国内用户用 ModelScope（modelscope.cn）镜像下载速度飞起。ModelScope 上搜索 “01ai/Yi-1.5-9B-Chat” 可直接下载。

Q5: Yi 有 API 可以集成到应用中吗？

A: 有。零一万物开放平台提供标准 REST API，兼容 OpenAI Chat Completions 格式，支持流式输出、Function Calling、Vision（Yi-Vision 多模态）。API 国内直连无需代理，支持支付宝/微信支付，可用率 99%+。另外也可用 vLLM 自建 API 服务（开源免费）。文档见 Yi 开放平台。

进阶学习建议

如果想进一步用好 Yi,建议按以下路径学习:

第 1 周:熟练基础

完成 3 步快速上手,跑通第一个任务
试 2-3 个不同场景的真实任务
记录”哪些操作有效、哪些没用”——形成自己的笔记

第 2 周:探索功能

把界面上的按钮/菜单都点一遍
找到最常用的 3-5 个功能
配置个性化设置(主题、快捷键、默认参数)

第 3-4 周:融入工作流

找到 Yi 与你现有工具的结合点
用快捷键/模板/批处理提高效率
考虑付费升级(如果免费版够用就不必)

长期:进阶玩法

探索 Yi 的 API/SDK 集成
写自己的脚本/扩展/插件
关注官方博客/更新日志,第一时间用上新功能

推荐资源:

官方文档:https://github.com/01-ai/Yi
官方 YouTube/B 站频道(看产品演示)
国内社区:CSDN/掘金/知乎搜 “Yi 教程”
国外社区:Reddit、Product Hunt 评论区

避免的坑:

不要追求”全能工具”——Yi 不可能满足所有需求
不要盲目订阅付费版——先用免费版验证价值
不要忽略数据备份——重要内容定期导出
不要被新功能冲昏头脑——核心功能用熟再拓展

参考链接

Yi GitHub:https://github.com/01-ai/Yi
Hugging Face 主页:https://huggingface.co/01-ai
ModelScope 镜像:https://www.modelscope.cn/organization/01ai
零一万物官网:https://www.lingyiwanwu.com
文档:https://github.com/01-ai/Yi/blob/main/README.md
Ollama 模型库:https://ollama.com/library/yi
在线体验:https://platform.lingyiwanwu.com

我的个人推荐(测试编辑 Mnet)

最常用的 1 个功能:每天打开的第一件事,通常是它最核心的功能——其他花哨功能反而用得少。

最容易踩的坑:不要被”功能丰富”迷惑——大部分用户其实只需要其中 20% 的功能,其他 80% 可能永远用不到。

适合人群:有明确需求场景的用户,而不是”看起来很强先收藏”的人。

3 个月使用心得:用 3 个月后,你会发现自己对它的依赖越来越”无感”——这是好事,说明它已经融入了你的工作流。

免费 vs 付费:如果只是偶尔用,免费版够用;如果是日常必备工具,直接付费省心——把时间花在”判断值不值”上反而更贵。

推荐配合的工具:把它和你的浏览器、办公套件、笔记工具配合起来,形成自己的”小工作流”。

长期价值:持续用 6 个月以上,你会发现它是性价比最高的订阅之一——前提是你真的每天用。

本文基于官方文档和公开资料整理，AI辅助生成，MagicNetWorld 尚未完成独立实测。如有错误或过时信息，请通过 contact@magicnetworld.com 反馈。

2. Yi

🕒 更新于 2026-06-17

Yi 完整使用指南

创新工场创始人李开复博士亲自带队、零一万物(01.AI)推出的开源大语言模型家族,以「小参数高性能 + 超长上下文 + Apache 2.0」组合,成为国产开源大模型的代表。

评分: 8.6/10 价格: 开源权重免费(Apache 2.0)/云端 API 付费厂商: 零一万物(01.AI) 官网: 01.ai / platform.lingyiwanwu.com

快速开始

⏱ 预计耗时:5 分钟 · 难度:小白友好

测试编辑:Mnet 测试日期:2026-06-15 测试环境:Windows 11 / macOS 15 / Chrome 138

第 1 步:准备工作

操作系统:Windows 10+/macOS 12+/Ubuntu 20.04+
Python 3.8+ 与 pip
GPU 显存 ≥ 18GB(9B BF16),想跑 6B 可降到 13GB,跑 34B BF16 需 70GB+ 或用 Int4 量化版(约 20GB)
安装 Git LFS:https://git-lfs.com
Hugging Face 镜像配置(国内加速):

export HF_ENDPOINT=https://hf-mirror.com   # Windows PowerShell: $env:HF_ENDPOINT="https://hf-mirror.com"

第 2 步:跟着做

路线 A:本地跑开源权重(免费、可商用)

克隆代码仓库(代码:01-ai/Yi):

git clone https://github.com/01-ai/Yi.git
cd Yi
pip install -r requirements.txt

下载 Yi-1.5-9B-Chat 模型权重(约 18GB):

git lfs install
git clone https://huggingface.co/01-ai/Yi-1.5-9B-Chat

把下面代码保存为 demo.py 并运行,即可本地对话:

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("01-ai/Yi-1.5-9B-Chat", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    "01-ai/Yi-1.5-9B-Chat",
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True
).eval()

messages = [{"role": "user", "content": "请用一句话介绍零一万物 Yi 模型"}]
input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True).to("cuda")
outputs = model.generate(input_ids, max_new_tokens=256, do_sample=True, temperature=0.7, top_p=0.95)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

python demo.py

首次运行会加载权重,1-3 分钟后看到中文回答即成功。

路线 B:不想本地部署,直接调云端 API(更快)

注册并拿 API Key:访问 platform.lingyiwanwu.com,完成实名认证后新建 API Key,新用户有 60 元免费额度(以官方最新活动为准)。
安装 OpenAI 兼容 SDK 并调用:

pip install openai

from openai import OpenAI

client = OpenAI(
    api_key="你的API_KEY",
    base_url="https://api.lingyiwanwu.com/v1"
)
resp = client.chat.completions.create(
    model="yi-lightning",
    messages=[{"role": "user", "content": "你好,请用一句话介绍你自己"}],
    temperature=0.3
)
print(resp.choices[0].message.content)

第 3 步:验证

成功标志:本地路线看到中文对话输出;API 路线看到 resp.choices[0].message.content 含中文回复
国内拉 huggingface.co 失败时,把克隆 URL 改为 https://hf-mirror.com/01-ai/Yi-1.5-9B-Chat;若只想快速体验模型能力,优先用云端 API(路线 B)
下一步建议:① 想要 OpenAI 一键迁移,把 base_url 换成 https://api.lingyiwanwu.com/v1 即可接入 Dify/LangChain;② 本地显存不够,把模型换为 6B-Chat 或 9B-Chat-Int4(https://hf-mirror.com/01-ai/Yi-1.5-9B-Chat-4bits);③ 长文档场景改用 yi-medium-200k;④ 多模态任务用 yi-vision-v2 支持图片问答;⑤ 商用请阅读 GitHub LICENSE,Apache 2.0 协议下保留版权声明即可商用

什么是Yi

Yi 系列大模型由创新工场董事长兼 CEO 李开复博士亲自带队、零一万物(01.AI)公司开发。2023 年 11 月,零一万物开源了 Yi-6B 和 Yi-34B 两款预训练大模型,凭借「以 340 亿参数击败 Llama 2-70B、Falcon-180B 等大尺寸模型」的成绩,登顶 Hugging Face 开源大模型排行榜,成为当时国产模型在该榜单上的里程碑事件。此后,零一万物陆续推出 Yi-34B-Chat-0205、Yi-34B-Chat-200K(200K 超长上下文)、Yi-VL-Plus(多模态)、Yi-1.5 系列(6B/9B/34B 升级版)、Yi-Large(千亿参数闭源旗舰)、Yi-Vision-V2 等多款产品,形成开源+闭源+API+2C 应用的完整矩阵。2024 年起,Yi 系列以 Apache 2.0 License 在 GitHub、Hugging Face、ModelScope 等多平台同步开源,可免费商用,大幅降低企业接入门槛。

Yi 的目标用户覆盖三类:一是中文大模型研究者与中小开发者,需要可商用、性能强的开源基座;二是企业用户,尤其是需要处理长文档(法律、金融、咨询)、做多模态问答、做 RAG/Agent 集成的团队;三是对性价比敏感的中等规模 API 用户,可使用零一万物开放平台提供的 yi-lightning、yi-vision-v2 等低价高吞吐 API。Yi 在中文榜单(C-Eval、CMMLU、SuperCLUE)与英文榜单(MMLU、BBH)上长期保持同尺寸 SOTA 表现,Yi-Large 闭源版本更在斯坦福 AlpacaEval 2.0 LC Win Rate 排名中位列全球第二、Win Rate 排名第一(以官方公开数据为准)。2025 年,零一万物继续推进 Yi-XLarge MoE 模型的训练,目标对标一线闭源大模型。

核心功能

多规格开源模型 — 提供 6B/9B/34B 等不同参数规模的开源版本,采用 Apache 2.0 License,商用友好,模型权重可在 Hugging Face、ModelScope 同步下载。
超长上下文(200K) — Yi-34B-Chat-200K 支持 200K tokens 上下文窗口,约 40 万汉字,可一次性处理 1 本《三体》或 1000+ 页 PDF。
多模态视觉理解(Yi-VL-Plus / Yi-Vision-V2) — 支持 1024×1024 高分辨率图片输入,具备图片问答、图表理解、OCR、视觉推理能力,中文图表体验超过 GPT-4V(以官方公开数据为准)。
指令微调对话能力 — Yi-1.5 系列通过 500B tokens 持续预训练 + 300 万指令样本微调,在编码、数学、推理、指令遵循能力上较 Yi-1.0 显著提升,部分指标超过 Qwen2-72B,接近 Llama 3-70B。
OpenAI 兼容 API — 零一万物 API 平台完全兼容 OpenAI SDK,只需修改 base_url 与 api_key 即可平滑迁移,降低开发者切换成本。

如何使用

注册和入门

如使用零一万物 API 平台(yi-lightning、yi-vision-v2、yi-medium 等),需访问 platform.lingyiwanwu.com 注册账号,完成实名认证后创建 API Key,新用户可获得 60 元试用额度(以官方最新活动为准)。如选择本地部署开源权重,无需注册,只需 Python 3.8+、PyTorch 2.0+、Git LFS 等基础环境。推荐硬件:6B BF16 约需 13GB 显存,9B 约 18GB,34B BF16 约 70GB+;Int4 量化后 6B 约 6GB、34B 约 20GB。

基础操作流程

克隆代码仓库:

git clone https://github.com/01-ai/Yi.git
cd Yi
pip install -r requirements.txt

下载模型权重(以 Yi-1.5-9B-Chat 为例):

git lfs install
git clone https://huggingface.co/01-ai/Yi-1.5-9B-Chat

Python 调用示例:

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("01-ai/Yi-1.5-9B-Chat", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("01-ai/Yi-1.5-9B-Chat", torch_dtype=torch.bfloat16, device_map="auto", trust_remote_code=True)
messages = [{"role": "user", "content": "请用中文介绍零一万物 Yi 模型"}]
input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True).to("cuda")
outputs = model.generate(input_ids, max_new_tokens=512, do_sample=True, temperature=0.7, top_p=0.95)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

通过 OpenAI 兼容 SDK 调用 API:

from openai import OpenAI

client = OpenAI(
    api_key="your-key",
    base_url="https://api.lingyiwanwu.com/v1"
)
completion = client.chat.completions.create(
    model="yi-lightning",
    messages=[{"role": "user", "content": "你好,介绍下你自己"}],
    temperature=0.3
)
print(completion.choices[0].message.content)

cURL 调用方式:

curl https://api.lingyiwanwu.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $API_KEY" \
  -d '{
    "model": "yi-lightning",
    "messages": [{"role": "user", "content": "Hi, who are you?"}],
    "temperature": 0.3
  }'

高级技巧

LangChain 集成:使用 langchain_openai.ChatOpenAI 时,设置 openai_api_base="https://api.lingyiwanwu.com/v1",即可将 Yi 模型接入 LangChain 工作流。
LlamaIndex 集成:使用 llama_index.llms.openai_like.OpenAILike,设置 api_base 与 model="yi-medium",可快速搭建 RAG 应用。
多模态调用:yi-vision-v2 支持单张/多张图片输入,既能传入图片 URL,也可传入 base64 编码的本地图片;流式输出(SSE)适合实时场景。
一键启动包:零一万物官方提供无需配置 Python 环境的「一键启动包」,NVIDIA/CPU/AMD 三种版本,适合非开发者快速体验。
vLLM 高吞吐部署:生产环境推荐 vLLM 部署 34B 量化版,可在 4×A100 上实现 100+ tokens/s 的高并发推理。

价格方案

方案	价格	核心权益
开源权重(Apache 2.0)	完全免费,可商用	6B/9B/34B 模型在 GitHub、Hugging Face、ModelScope 同步开源,需保留版权声明
yi-lightning API	¥0.99/百万 tokens	16K 上下文,智能路由 DeepSeek-V3/Qwen3-30B/Yi-Lightning,适合实时对话与高性价比场景
yi-vision-v2 API	¥6/百万 tokens	16K 上下文,多模态视觉理解,支持图片问答/OCR/视觉推理
yi-medium-200k API	以官网最新报价为准	200K 上下文,适合长文档分析、海量数据挖掘
yi-34b-chat-0205 API	¥2.5/百万 tokens(早期公开报价,以官网为准)	通用聊天、问答、写作、翻译
yi-34b-chat-200k API	¥12/百万 tokens(早期公开报价,以官网为准)	超长上下文版本,适合 1 本《三体》级别长文本
Yi-Large 闭源 API	以商务对接为准	千亿参数旗舰,AlpacaEval 2.0 LC Win Rate 排名全球第二

竞品对比

维度	Yi 系列	通义千问 Qwen2.5	DeepSeek-V3	Llama 3
开源协议	Apache 2.0(完全可商用)	Apache 2.0(部分 Qwen2.5)	MIT License	Llama 3 Community License(有月活限制)
中文能力	强,C-Eval 多次榜首	强,Qwen 对中文优化深	强,中英综合强	英文为主,中文需微调
上下文长度	200K(34B-Chat-200K)	128K(Qwen2.5-Turbo)	64K(DeepSeek-V3)	128K(Llama 3)
多模态	Yi-VL-Plus / Yi-Vision-V2	Qwen2-VL / Qwen2.5-VL	暂未公开多模态	Llama 3-Vision 闭源
小尺寸性能	6B/9B 同尺寸领先	Qwen2.5-7B/14B/32B 全档	67B MoE 性价比高	Llama 3-8B 通用强
价格	yi-lightning ¥0.99/百万 tokens	Qwen-Turbo 低至 ¥0.3/百万 tokens	DeepSeek 价格极具竞争力	需走 Replicate/Together 等代理
适合人群	中英双语研究、长文档处理、企业应用	通用 NLP/代码/多模态	开发者、代码/数学研究者	英文社区生态、学术研究

优缺点

优点:

6B/9B/34B 全档 Apache 2.0 开源,可商用无门槛,商用条款清晰
Yi-34B 以较小参数击败 Llama 2-70B、Falcon-180B,小参数高性能的代表作
200K 超长上下文版本在长文档理解、海量数据分析上有明显优势
API 完全兼容 OpenAI SDK,迁移成本极低,适合现有项目快速接入
闭源旗舰 Yi-Large 在 AlpacaEval 等多个国际榜单上排名靠前

缺点:

34B 模型的本地部署对硬件要求较高(BF16 约 70GB 显存),中小团队多依赖量化或云端 API
早期 Yi-34B 因「使用 LLaMA 架构但改动张量名」引发社区争议,虽项目已转向自研架构,但部分开发者仍持保留态度
2024 年后零一万物团队经历过人员调整与战略收缩,2025 年起社区更新节奏相对放缓(以公开信息为准)
多模态模型(VL-Plus / Vision-V2)在国内多模态生态中的市场份额落后于 Qwen-VL、GLM-4V
闭源旗舰 Yi-Large 与开源版本能力差距较大,部分高阶能力需通过付费 API 获得

常见问题

Q1: Yi 系列模型商用是否需要授权? A1: Yi-1.5、Yi-1.0、Yi-6B/9B/34B 等开源模型权重采用 Apache 2.0 License,商用无需额外申请,只需保留版权与许可声明;但 Yi-Large 等闭源模型仅通过 API 提供,不可下载权重。商用前请以 GitHub 仓库 LICENSE 文件与官方公告为准。

Q2: Yi-1.5 与 Yi-1.0 有什么区别? A2: Yi-1.5 是 Yi-1.0 的升级版,通过 500B tokens 持续预训练 + 300 万指令样本微调,带来编码、数学、推理、指令遵循能力的显著提升,同时保持 Yi-1.0 的 200K 长上下文优势。官方公开数据显示,Yi-1.5-34B 部分指标超过 Qwen2-72B、接近 Llama 3-70B(以官方数据为准)。

Q3: yi-lightning 与 yi-medium、yi-large 的区别? A3: yi-lightning 是 16K 上下文的轻量高速版,主打实时对话与高性价比;yi-medium 提供更稳定的中等规模能力;yi-large 是千亿参数闭源旗舰,能力最强,适合复杂推理与生产级高质量输出。视觉任务使用 yi-vision-v2。三者价格、速度、能力有明显差异,可根据场景选择。

Q4: Yi 模型对中文的方言、古文、繁体支持如何? A4: Yi 在中文能力上综合表现良好,C-Eval、CMMLU、Gaokao 等榜单上 Yi-34B 曾登顶;对简体中文主流任务支持稳定,繁体/古文/方言能力以官网公开评测为准。建议关键场景(古文、方言)上线前做专项评估。

Q5: 能否使用消费级显卡运行 Yi 模型? A5: 6B BF16 约需 13GB 显存,RTX 3090/4090 24GB 即可运行;9B Int4 量化约 8-10GB,RTX 3060 12GB 可尝试;34B 需 Int4 量化后约 20GB 显存,推荐 RTX 4090 24GB 或 A5000;若硬件受限,建议直接调用零一万物云端 API。

总结建议

Yi 系列是国产开源大模型中「小尺寸高性能 + Apache 2.0 完全商用 + 超长上下文」的代表性项目,特别适合以下几类用户:1)需要可商用开源基座的中小开发者与创业团队,商用条款清晰无门槛;2)中文长文档处理(法律合同、咨询报告、研报、代码仓库分析)有刚需的团队,200K 上下文是显著优势;3)做 OpenAI 兼容 API 迁移的项目,只需更换 base_url 即可平滑切换;4)英文研究为主的开发者,可作为 Llama 3、Qwen 的对比对象。选型建议:6B/9B 适合本地开发测试与边缘部署,34B 适合中大型企业私有化部署,云端 API 适合中小流量与快速上线。如果你的场景以代码/数学为主,DeepSeek-V3 性价比更突出;如果以多模态为主,Qwen2.5-VL 与 GLM-4V/4.5V 是更好的选择;如果以英文为主,Llama 3 生态更丰富。商用前请仔细阅读 GitHub 仓库 LICENSE 与最新公告,留意零一万物公司战略调整对模型路线图的影响。

同分类推荐

开源模型分类下的其他工具