硅基流动

📋 资质核验核验日期：2026-06-14未独立实测 🔴 高级

AI模型推理平台，提供多种开源模型的高速推理服务，性价比高，开发者API调用友好

免费推理国产

🌐 访问官网

📅 收录: 2026-06-09 🔄 更新: 2026-06-14

📄 深度文章 (2 篇)

1. 硅基流动

🕒 更新于 2026-06-18

硅基流动快速入门

国产版的”Replicate”,免费额度大方,开源大模型 API 跑起来比官方还便宜。

这是什么?适合谁?

硅基流动(SiliconFlow)是国内一家 AI 推理云服务平台,提供 Qwen、DeepSeek、Llama、Stable Diffusion、Whisper 等主流开源模型的 API 接口。和直接调用官方服务相比,硅基流动的优势在于”价格便宜 + 国内访问 + 速度稳定”。

它适合以下用户:第一,个人开发者、学生、独立创作者,需要一个便宜好用的大模型 API 来跑学习项目或副业;第二,创业团队,业务还在验证阶段,需要控制成本,不想一上来就投入 OpenAI 或 Anthropic;第三,做开源应用、二次开发,需要在国内稳定访问开源大模型的工程师。

硅基流动最大的特点是:兼容 OpenAI 接口格式,这意味着如果你已经在用 OpenAI,只需要把 base_url 改一下、API Key 替换一下,代码几乎不用改,就能切到硅基流动,国内访问速度飞起,价格还便宜。

免费额度相当大方,新用户通常能拿到几千万 token 的赠送额度,够用很久。

准备工作

一个手机号(国内)
联网的电脑和浏览器
Python 3.8+ 或 Node.js 16+ 开发环境
基础的命令行能力
可选:用邮箱注册(支持手机号 + 微信)

3 步快速上手

第 1 步:注册账号

打开 https://siliconflow.cn,点击右上角”注册”,用手机号或微信扫码完成注册。登录后,实名认证(手机号注册后通常自动通过)。

第 2 步:获取 API Key

登录后在左侧菜单找到”API Keys”(或”密钥管理”),点击”新建 API Key”,给 Key 起个名字(比如”my-project”),权限默认全选即可,点击创建,立刻复制保存显示的 Key 字符串(以 sk- 开头)。

接着在”模型广场”或”模型列表”页面挑选你想用的模型。常见选项:

Qwen/Qwen2.5-72B-Instruct(通义千问)
deepseek-ai/DeepSeek-V3(深度求索)
meta-llama/Llama-3.3-70B-Instruct
stabilityai/stable-diffusion-3-5-large(图像生成)
openai/whisper-large-v3(语音转文字)

记录模型 ID,后续代码里要用。

第 3 步:发起第一次调用

硅基流动兼容 OpenAI 协议,直接用 OpenAI SDK 就行。安装:

pip install openai

新建 hello_sf.py:

from openai import OpenAI

client = OpenAI(
    api_key="sk-你的key",
    base_url="https://api.siliconflow.cn/v1"
)

response = client.chat.completions.create(
    model="Qwen/Qwen2.5-72B-Instruct",
    messages=[
        {"role": "user", "content": "用一句话介绍硅基流动。"}
    ]
)

print(response.choices[0].message.content)

运行后,几秒内就能拿到通义千问模型给出的回答。注意 base_url 必须改成硅基流动的地址,这是和官方 OpenAPI 的唯一区别。

常见踩坑

忘记改 base_url:很多新手直接复制 OpenAI 的代码,忘了把 base_url 改成硅基流动的地址,会连接失败。
模型 ID 写错:模型 ID 必须完全匹配(含斜杠和大小写),写错会返回 404。复制粘贴最安全。
免费额度用完:免费额度有限,生产环境大量调用会触发充值,建议在控制台设预算提醒。
并发限制:不同模型有不同 RPM(每分钟请求数)限制,大量并发时可能触发 429,加重试机制。
图片生成需要单独 API:文生图、语音转文字用的是不同的 API 端点(/v1/images/generations、/v1/audio/transcriptions),不是 chat completions。
国内偶发波动:虽然是国内服务,但高峰期仍然有波动,生产代码务必加重试和超时。

初级用法

对话生成:用上面的代码,改 model 即可切换不同大模型。
文本嵌入:用 BAAI/bge-m3 等嵌入模型,把文本变成向量,用于搜索、推荐、RAG。
图像生成:用 stabilityai/stable-diffusion-3-5-large,配合 OpenAI Images API 格式调用。

高级玩法

RAG 全套:硅基流动提供 embedding + LLM,可以自己搭 RAG;也可以配合向量数据库(Milvus、Qdrant)做企业级知识库。
Function Calling:多数主流模型支持函数调用,做 Agent 应用。
流式输出:设 stream=True,逐字返回结果,做实时聊天 UI。
批量推理:长任务(批量翻译、批量标注)用 Batch API,价格更便宜。
语音转文字:用 Whisper 模型,把音频文件直接传给 /v1/audio/transcriptions 端点。

小技巧

不同模型擅长不同任务:Qwen 中文强、DeepSeek 编程强、Llama 英文强,根据业务选型能省 token 提升质量。
硅基流动支持”模型对比”功能,同一 prompt 同时跑多个模型,方便选型。
代码里用环境变量 SILICONFLOW_API_KEY 存 Key,不要硬编码,避免泄露。
定期看”用量统计”页面,了解哪些模型调用最多,可以优化成本。
配合 LangChain、LlamaIndex 等开源框架,硅基流动可以无缝替代 OpenAI,几乎零迁移成本。

常见问题 FAQ

Q1: 硅基流动有免费额度吗？

A: 有，而且相当慷慨。新用户注册即送 ¥14 余额（约 2000 万 Token），邀请好友可再获 ¥14。此外平台提供 15+ 个完全免费的模型（如 Qwen2.5-7B、DeepSeek-R1-Distill-Qwen-7B、GLM-4-9B-Chat 等），免费模型每月有固定免费 Token 配额。付费模型按量计费，如 DeepSeek-V3 输入 ¥2/百万 Token、输出 ¥8/百万 Token。

Q2: 硅基流动和直接用 OpenAI/DeepSeek 官方 API 有什么区别？

A: 硅基流动兼容 OpenAI API 格式（只需改 base_url 和 API Key），代码几乎零改动即可迁移。优势：1) 国内服务器，访问速度快、延迟低；2) 价格通常比官方便宜；3) 聚合多个模型厂商，一个 API Key 通吃。劣势：模型列表由平台决定，官方的某些最新功能可能延迟上线。

Q3: 硅基流动适合生产环境吗？

A: 适合。平台提供稳定的 API 服务，国内延迟低。但需注意：免费模型有速率限制（RPM），生产环境建议使用付费模型以获得更高并发和稳定性。高峰期可能有波动，建议业务代码加重试和超时机制。

Q4: 硅基流动支持哪些类型的模型？

A: 支持文本生成（Qwen、DeepSeek、GLM、Kimi、Llama 等）、图像生成（Stable Diffusion 系列）、语音识别（Whisper）、文本嵌入（BGE-M3）等多类模型。具体以官网模型广场实时列表为准：https://siliconflow.cn/models。

进阶学习建议

如果想进一步用好硅基流动,建议按以下路径学习:

第 1 周:熟练基础

完成 3 步快速上手,跑通第一个任务
试 2-3 个不同场景的真实任务
记录”哪些操作有效、哪些没用”——形成自己的笔记

第 2 周:探索功能

把界面上的按钮/菜单都点一遍
找到最常用的 3-5 个功能
配置个性化设置(主题、快捷键、默认参数)

第 3-4 周:融入工作流

找到硅基流动与你现有工具的结合点
用快捷键/模板/批处理提高效率
考虑付费升级(如果免费版够用就不必)

长期:进阶玩法

探索硅基流动的 API/SDK 集成
写自己的脚本/扩展/插件
关注官方博客/更新日志,第一时间用上新功能

推荐资源:

官方文档:https://siliconflow.cn
官方 YouTube/B 站频道(看产品演示)
国内社区:CSDN/掘金/知乎搜 “硅基流动教程”
国外社区:Reddit、Product Hunt 评论区

避免的坑:

不要追求”全能工具”——硅基流动不可能满足所有需求
不要盲目订阅付费版——先用免费版验证价值
不要忽略数据备份——重要内容定期导出
不要被新功能冲昏头脑——核心功能用熟再拓展

参考链接

硅基流动官网:https://siliconflow.cn
模型广场:https://siliconflow.cn/models
文档:https://docs.siliconflow.cn
API 参考:https://docs.siliconflow.cn/cn/api-reference
定价:https://siliconflow.cn/pricing
OpenAI 兼容说明:https://docs.siliconflow.cn/cn/userguide/quickstart

本文基于官方文档和公开资料整理，AI辅助生成，MagicNetWorld 尚未完成独立实测。如有错误或过时信息，请通过 contact@magicnetworld.com 反馈。

2. 硅基流动

🕒 更新于 2026-06-17

硅基流动完整使用指南

国内开源模型 API 的”卖铲人”,注册送体验额度,9B 以下模型长期免费,性能与价格都值得关注。

评分: 8.6/10 价格: 按量计费,9B 以下模型免费,新用户有代金券厂商: SiliconFlow 官网: siliconflow.cn

快速开始

⏱ 预计耗时:5 分钟 · 难度:小白友好

测试编辑:Mnet 测试日期:2026-06-15 测试环境:Windows 11 / macOS 15 / Chrome 138

第 1 步:准备工作

需要准备 2 样东西:

手机号(国内手机号即可,收验证码用)
实名认证(微信扫码秒过,不实名会触发 QPS 限流)

整个流程5-10 分钟,是国内注册最丝滑的大模型 API 平台之一。新用户注册即送 14 元余额(约 2000 万 token),用邀请码双方各多得 14 元(推荐码随便搜)。

第 2 步:跟着做

注册 + 实名

打开 siliconflow.cn/zh-cn,点击右上角 登录/注册
用手机号 + 验证码完成注册
登录后,右上角点 账户管理 → 实名认证,微信扫码 10 秒搞定

获取 API Key

进入 cloud.siliconflow.cn/account/ak
点击 新建 API 密钥,描述随便填(比如 my-app)
立即复制密钥(形如 sk-xxxxxxxxxxxxxxxx),关闭后无法再次查看完整密钥

调用 API(OpenAI 兼容协议,pip install openai)

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxxxxxxxxxx",  # 上面复制的 API Key
    base_url="https://api.siliconflow.cn/v1"
)

response = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V3",  # 免费额度内的旗舰模型
    messages=[{"role": "user", "content": "用一句话介绍硅基流动。"}]
)
print(response.choices[0].message.content)

curl(零依赖):

curl https://api.siliconflow.cn/v1/chat/completions \
  -H "Authorization: Bearer $SF_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-ai/DeepSeek-V3",
    "messages": [{"role": "user", "content": "用一句话介绍硅基流动。"}]
  }'

第 3 步:验证

成功标志:Python 脚本输出 DeepSeek 的中文回复,硅基流动控制台 账户管理 → 余额 页面能看到 token 消耗扣费。

排错要点:

401 invalid api key → API Key 复制错误,确认是 sk- 开头
429 rate limit → 未实名会被严格限流,先去完成实名认证
model not found → 模型名要带厂商前缀,比如 Qwen/Qwen2.5-72B-Instruct,不能只写 Qwen2.5
余额为 0 → 14 元用完了,可以在充值页面加钱(支付宝/微信)

下一步建议:

想用满血 DeepSeek-R1(推理版):deepseek-ai/DeepSeek-R1,深度思考能力很强
想跑多模态:试 Qwen/Qwen2-VL-72B-Instruct 或 OpenGVLab/InternVL2-26B
想本地客户端:搭配 Cherry Studio 或 ChatBox,在设置里填 API Key 即可用 GUI
9B 以下小模型永久免费(并发有限),适合个人开发测试

什么是硅基流动

硅基流动(SiliconFlow)是一家专注于 AI 基础设施的科技公司,总部位于北京海淀区,由清华大学计算机系博士袁进辉创立。公司核心产品 SiliconCloud 是面向开发者与企业的一站式大模型云服务平台,基于自研 SiliconLLM 推理引擎与 OneDiff 加速库,提供文本生成、代码补全、多模态理解、Embedding 向量、文生图、文生视频等多种模型 API。

硅基流动的目标用户非常明确:一是需要在国内合规链路下调用开源大模型(DeepSeek、Qwen、GLM、Llama、Flux 等)的开发者;二是在生产环境中需要稳定、低成本推理服务的中型 AI 团队;三是希望快速对比多个开源模型效果、做模型选型的产品与研究人员。2026 年 6 月,硅基流动完成超 20 亿元 B 轮融资,由携程、晶科能源、金蝶、联通新沃、盛奕资本、壁仞、蔚来资本、商汤、巨人网络、华兴资本等机构投资,资金将用于算力基础设施与模型生态建设。

硅基流动的差异化卖点在于”开源生态 + 推理性能 + 性价比”——平台几乎囊括了国产主流开源模型,提供 OpenAI 兼容的调用方式,9B 以下小模型可长期免费使用,适合个人开发者学习与原型验证,企业用户则可以走按量计费或商务洽谈,适合中小型 AI 应用的工程化落地。

核心功能

主流开源模型一站调用 — 覆盖 DeepSeek V3/R1、Qwen 2.5/3、ChatGLM-4、Llama 3.x、Yi、Baichuan、Mistral、Flux 等数十款开源大模型,涵盖语言、代码、多模态、向量、图像、视频场景,无需自行部署。
自研 SiliconLLM 推理引擎 — 深度优化模型并行计算与显存调度,提供高吞吐、低延迟的推理服务,在开源模型推理速度上处于国内较高水平。
OneDiff 加速库 — 针对 Stable Diffusion、Flux 等扩散模型的高性能推理加速库,文生图/文生视频场景下显著提升生成速度,适合 AIGC 内容生产。
多模态 API 矩阵 — 覆盖文本生成、代码补全、Embedding 向量化、语音合成、图像生成、视频生成、视觉理解,一站式提供大模型 API 服务。
免费额度与新用户福利 — 9B 以下小模型长期免费,新用户注册可获得代金券(约 16 元),个人开发者可零成本体验主流模型,适合学习与原型验证。

如何使用

注册和入门

使用硅基流动需要在 siliconflow.cn 注册账号,支持邮箱或手机号注册并完成实名认证。进入控制台后,在”API 密钥”模块创建密钥,即可在 Playground 中测试模型效果,也可以直接调用 API。

新用户通常会获得 14-16 元的代金券,9B 以下小模型(Qwen 2.5 7B、Llama 3 8B、ChatGLM-4 9B 等)长期免费,适合个人学习与低并发实验。对于企业用户,可以在控制台提交企业认证,获得发票、报销、专属技术支持。

基础操作流程

硅基流动提供 OpenAI 兼容的 API 接入方式,绝大多数已使用 OpenAI SDK 的项目都可以几乎零成本迁移。以 Python 调用 DeepSeek-V3 为例:

from openai import OpenAI

client = OpenAI(
    api_key="<your-siliconflow-key>",
    base_url="https://api.siliconflow.cn/v1",
)

response = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V3",
    messages=[{"role": "user", "content": "用中文解释冒泡排序的原理"}],
)
print(response.choices[0].message.content)

调用文生图模型(以 Flux 为例):

response = client.images.generate(
    model="black-forest-labs/FLUX.1-schnell",
    prompt="a futuristic city at night, neon lights, cyberpunk style",
    size="1024x1024",
)
print(response.data[0].url)

Embedding 向量化、语音合成、视觉理解等 API 同样在 SiliconCloud 文档中心提供完整示例,接口风格与 OpenAI 保持一致,迁移成本低。

高级技巧

进阶用法主要有四类:第一,使用 SiliconCloud 模型广场对比多个开源模型效果,在 Playground 中输入同一 prompt 切换不同模型,直观对比响应质量与速度;第二,利用 OneDiff 加速库做自托管部署,适合对延迟与成本有极致要求的生产环境;第三,使用控制台的预算上限与告警功能,设置项目级用量阈值,避免意外大额扣费;第四,使用企业级私有化部署方案,把整套推理服务落地到客户机房或专有云,适合对数据合规有严格要求的政企客户。

价格方案

硅基流动的定价策略以”按量计费 + 免费额度”为主,9B 以下模型长期免费,主流模型单价在国内属于较低水平(2026 年公开数据,以官网为准):

模型	输入	输出	备注
DeepSeek V3(官方)	2 元 / 1M tokens	3 元 / 1M tokens	平台公开价 4/12 元,代理有 1.2/1.8
Qwen 2.5 系列(7B-72B)	阶梯定价	阶梯定价	7B/14B 等小模型长期免费
ChatGLM-4(9B)	免费	免费	长期免费额度
Llama 3 8B	免费	免费	长期免费额度
Flux Schnell	低单价	—	文生图,OneDiff 加速
Embedding(bge 系列)	低单价	—	向量检索
新用户代金券	14-16 元	—	注册即得,有效期约 1 个月
9B 以下小模型	免费	免费	长期免费

需要注意的是,硅基流动在 2026 年的 9B 以下免费政策为长期承诺,但部分高端模型(如 DeepSeek-R1 671B)按量计费,价格略低于其他平台官方价。境外模型支持较少,主要服务国产开源模型场景。

竞品对比

维度	硅基流动	阿里云百炼	火山引擎(豆包)	DeepSeek 官方
价格	9B 以下免费,主流 1-12 元	Qwen3-Plus 2/4 元	豆包 Lite 0.3/0.6 元	DeepSeek V3 2/3 元
核心优势	开源生态全、推理快、免费	阿里云生态、长文本	字节生态、价格低	推理能力强、价格稳定
适合人群	个人/中小团队、开源模型	阿里云重度、企业	价格敏感、C 端高并发	编程、深度推理

整体来看,硅基流动是”国产开源模型一站式调用”的代表,免费额度与推理性能是其最大优势;阿里云百炼在 Qwen3 系列与阿里云生态方面具备优势;火山引擎在豆包自研模型与价格上具备竞争力;DeepSeek 官方在编程与推理能力上具备特色。

优缺点

优点:

9B 以下小模型长期免费,新用户有代金券,个人开发者可零成本体验开源模型。
主流国产开源模型一站调用,无需对接多个平台,管理成本低。
SiliconLLM 与 OneDiff 加速带来较高推理性能,延迟与吞吐表现稳定。
OpenAI 兼容接口,迁移成本极低。缺点:
境外模型支持较少,主要服务国产开源模型场景,需要国际模型的团队仍需其他平台。
部分高端模型价格略高于官方直购(平台有运维与加速成本),需要结合实际场景对比。
企业级 SLA、私有化部署方案仍在持续完善中,大客户需要走商务洽谈。

常见问题

Q1:硅基流动和 DeepSeek 官方有什么区别? A1:硅基流动是 API 聚合平台,提供 DeepSeek、Qwen、GLM、Llama 等多种开源模型的统一调用,OpenAI 兼容,适合需要多个模型对比或多模型路由的团队;DeepSeek 官方仅提供 DeepSeek 自家模型,但在编程与推理场景上具备较强的能力。两者可按需选择或组合使用。

Q2:9B 以下模型长期免费是真的吗? A2:是。硅基流动官方明确表示 9B 以下参数量的开源模型(Qwen 2.5 7B、Llama 3 8B、ChatGLM-4 9B、Yi 1.5 9B 等)长期免费使用,适合个人学习、轻量任务、低并发实验。但免费额度通常有 QPS/RPM 限制,生产环境需要关注。

Q3:如何选择合适的模型? A3:文本对话/通用任务用 Qwen 2.5 7B/14B 或 ChatGLM-4;编程/深度推理用 DeepSeek V3/R1;长文档用 Qwen2.5-72B 或 DeepSeek-V3;文生图用 Flux;Embedding 用 bge 系列。具体可在 Playground 中对比效果。

Q4:支持私有化部署吗? A4:支持。硅基流动提供企业级私有化部署方案,把 SiliconLLM 推理引擎与 OneDiff 加速库部署到客户机房或专有云,适合对数据合规有严格要求的政企客户。详细方案以商务洽谈为准。

总结建议

硅基流动是国内开源大模型 API 的高性价比选择,9B 以下免费 + 新用户代金券的策略,非常适合个人开发者学习与原型验证,小团队也可以零成本启动 AI 项目。生产环境建议优先用 70B 级别的主力模型(DeepSeek V3、Qwen 2.5 72B)做核心推理,9B 模型作为兜底/分类/抽取等辅助任务,既能保证效果又能压低单位成本。涉及境外模型需求时,建议组合 OpenAI / Anthropic 官方或 Azure 渠道,搭建多模型路由体系。

同分类推荐

AI开发平台分类下的其他工具

硅基流动 快速入门