商量 快速入门
商汤科技推出的多模态 AI 助手,“日日新”大模型驱动,图像视频理解是强项。
这是什么?适合谁?
商量是商汤科技在 2023 年推出的对话式 AI,基于自研的”日日新”(SenseNova)大模型系列。2026 年 6 月主推 SenseNova V6 系列,覆盖语言、图像、视频、3D 内容生成等多种模态。商汤在计算机视觉领域积累深厚(港股上市,亚洲最大的 AI 视觉公司),所以”商量”的核心差异化是”多模态理解和生成”,特别是图像、视频的理解能力。
相比豆包、文心一言,商量的差异化是”图像/视频的深度理解”。它可以:1)分析医学影像(CT、MRI)并辅助诊断;2)理解复杂场景图(城市规划图纸、工业设计图);3)解析长视频(电影、课程录像)并生成结构化笔记;4)做 3D 内容生成(文生 3D、图生 3D)。这些能力在通用对话 AI 里都比较弱。
适合谁?四类人最受益:一是教育/培训行业,需要视频课程转写、章节总结;二是设计/创意行业,需要图像理解、风格迁移辅助;三是医疗/工业等垂直领域,需要 AI 辅助看图;四是对”多模态 AI”感兴趣的极客用户。注意:商量在”中文对话通用能力”上(创意写作、日常聊天)略弱于豆包/通义千问,主要因为它的研发资源倾斜到了多模态方向;如果你的需求是纯文字对话,优先选豆包/通义。
准备工作
- 设备要求:网页/App/iOS/Android 都支持
- 账号要求:手机号注册(支持国内+海外部分国家)
- 付费要求:基础对话免费,API 和高级功能按量付费
- 网络要求:国内直连
chat.sensetime.com,无需国际网络连接 - 可选准备:准备一张清晰的图片或一段视频(URL),体验多模态能力
3 步快速上手
第 1 步:打开官网
浏览器访问 https://chat.sensetime.com,首页是对话界面,顶部有”日日新 V6”模型标识。
第 2 步:注册并登录
点击右上角”登录”,用手机号或邮箱注册。首次登录有新手引导,可以跳过。
第 3 步:跑第一个任务——上传一张图让它详细描述
点输入框左侧的”图片”图标,上传一张复杂场景图(比如一张街景、菜单、博物馆展品的照片),然后输入:
请详细描述这张图片的内容,包括:
1. 主体是什么
2. 背景环境
3. 关键文字信息(如果有)
4. 我可以基于这张图提出的 3 个问题
预期输出:商量会在 10-15 秒内给出一份多模态分析,通常比通用对话 AI 描述更细致——它会从”主体-背景-文字-关系”几个维度展开,适合”看图说话”、“无障碍阅读”等场景。
常见踩坑
踩坑 1:图片上传后”识别失败”
- 症状:上传一张图,商量回复”图片解析失败,请重试”
- 原因:图片格式不支持(WEBP/HEIC 部分版本不支持);图片分辨率过低(低于 200x200)
- 解决:转成 JPG/PNG 格式;图片长边至少 500 像素
踩坑 2:长视频理解被截断
- 症状:上传一个 1 小时的视频,商量只看了前 10 分钟
- 原因:免费版视频分析单次限制约 15-20 分钟
- 解决:把视频分段;升级到企业版(API 支持更长视频)
踩坑 3:对话”失忆”很快
- 症状:多轮对话进行到 10 轮左右,商量开始”忘记”前面的设定
- 原因:免费版上下文窗口有限
- 解决:每 5-10 轮主动重申关键信息;开启”新对话”分主题管理
踩坑 4:对中文流行语”反应慢”
- 症状:问”yyds 是什么意思”,商量的回答比较书面化
- 原因:商汤的模型在”网感/流行语”训练上不如豆包/腾讯
- 解决:在提示词里加”用口语化、接地气的语言回答”;或者问正式话题,商量表现更好
踩坑 5:API 调用 401 错误
- 症状:用 Python 调用商汤 API,返回鉴权失败
- 原因:商汤 API 使用 AccessKey/SecretKey 鉴权
- 解决:在 https://platform.sensenova.cn 创建应用,获取 AK/SK,使用官方 SDK
踩坑 6:某些话题拒绝回答
- 症状:问某些敏感话题,商量回复”该问题我无法回答”
- 原因:商汤 AI 受国内合规策略约束
- 解决:换更中性的措辞;商业/学术/技术类话题不受影响
初级用法
1. 图像理解:上传图片后,直接问”图里有什么”、“这个图标是什么意思”、“帮我描述这张图给盲人听”,商量会输出结构化描述,适合无障碍阅读、视觉替代。
2. 视频总结:把视频 URL 粘贴进去(支持 B 站、YouTube、本地视频),商量会自动转写并生成章节总结、关键观点,适合”网课复盘”、“会议录像提炼”。
3. 多轮对话 + 图像:在对话里上传多张图,让商量做”对比分析”(比如对比两款产品外观、两个城市街景),这是商量的强项。
高级玩法
1. 通过商汤大装置 API 做企业级集成:商汤大装置 https://platform.sensenova.cn 提供完整的 API,支持图像理解、视频分析、3D 生成。Python 调用:
import requests
url = "https://api.sensenova.cn/v1/llm/chat-completions"
headers = {
"Authorization": "Bearer <你的 API Key>",
"Content-Type": "application/json"
}
data = {
"model": "SenseChat-Vision",
"messages": [
{
"role": "user",
"content": [
{"type": "text", "text": "这张图里有什么?"},
{"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}}
]
}
]
}
resp = requests.post(url, headers=headers, json=data)
print(resp.json())
2. 用”日日新”做 3D 内容生成:商汤在 3D 内容生成上是国内第一梯队,提供文生 3D、图生 3D 的 API,适合游戏开发、电商 3D 展示、AR/VR 应用。文档在 https://platform.sensenova.cn/doc。
3. 接入”商量”到企业微信/钉钉:商汤提供企业 IM 集成方案,可以把商量嵌入企业内部群,做知识问答、数据查询、智能客服。适合制造业、零售业等需要”AI + 内部数据”的场景。
小技巧
- 快捷键:网页版
Ctrl/Cmd+Enter发送 - 多端同步:登录后 PC 端和移动端对话同步
- 角色设定:在 system 提示词里告诉模型”你是一位资深艺术评论家”,图像分析质量显著提升
- 温度调节:高级设置里调整创造性,0=精确(适合分析),1=发散(适合创意)
- 多语言:支持中英日韩法德西等 100+ 语言,直接用对话形式即可
参考链接
- 商量官网:https://chat.sensetime.com
- 商汤大装置平台:https://platform.sensenova.cn
- 商汤 API 文档:https://platform.sensenova.cn/doc
- 商汤科技官网:https://www.sensetime.com
- 知乎”商量体验”专题:https://www.zhihu.com/topic/27650021
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
同分类推荐
AI对话 分类下的其他工具