1. 讯飞有声
讯飞有声 快速入门
移动端中文 TTS 的”国民 App”,微信听书、公众号朗读、文章朗读神器。
这是什么?适合谁?
讯飞有声是科大讯飞推出的手机端文字转语音 App,定位是”消费级 TTS 工具”——把任意文字(微信公众号文章、txt 文档、网页、甚至 OCR 拍图)转成自然流畅的语音,方便用户在通勤、运动、睡前等场景下”听”内容。它和讯飞开放平台(企业级 API)是不同产品:开放平台面向开发者,讯飞有声面向普通用户。
讯飞有声的核心优势:
- 中文音色自然:继承讯飞二十多年的中文 TTS 积累,音色真实感比多数国产 App 强;
- 多音色可选:提供男女声、童声、方言(粤语、四川话等)数十种音色;
- 多场景支持:微信公众号文章朗读、txt/epub 电子书朗读、网页朗读、自定义文本朗读;
- 离线 TTS:支持下载离线包,无网络也能用;
- 背景音支持:朗读时可以加背景音乐,做”朗诵”效果;
- 定时关闭:支持”睡前听书”自动停止。
适合谁用:第一类是想”听”公众号文章的上班族;第二类是想”听”网络小说、电子书的读者;第三类是自媒体/内容创作者,需要把长文章转语音做素材;第四类是视障/老年用户,需要”把文字读出来”的功能。不适合谁:对音质有极高要求的专业播客——消费级 App 音质与专业级工具(Logic、Audition)有差距;另外,英文 TTS 效果比 ElevenLabs 略差,纯英文听书选 ElevenReader 或 Speechify。
讯飞有声是免费 App,基础功能(中文 TTS)完全免费;部分高级音色(明星音、特色音)需要付费会员;离线 TTS 包完全免费。
准备工作
- 一部 Android 或 iOS 手机(Android 5.0+ / iOS 11+)。
- 在应用商店搜”讯飞有声”下载并安装(也可以访问 https://www.xfyun.cn/app/voice 扫码下载)。
- 准备一段要朗读的文字(微信公众号链接、txt 文件、网页都行)。
- 如要朗读公众号文章,授权 App 访问微信/剪贴板/通讯录等权限。
3 步快速上手
第 1 步:下载并打开讯飞有声
从应用商店下载讯飞有声,首次打开会引导你授权:
- 通知权限:用于播放通知;
- 存储权限:用于保存音频文件;
- 悬浮窗权限(Android):用于”随时听”功能;
- 微信/剪贴板访问(可选):用于朗读公众号文章。
授权后进入主界面,主功能区是”粘贴文本朗读”、“微信文章朗读”、“电子书朗读”。
第 2 步:输入要朗读的内容
讯飞有声提供 4 种输入方式:
- 粘贴文本:复制任意文字,粘贴到 App,点 “开始朗读”;
- 微信文章:复制公众号文章链接,粘贴到 App,自动识别正文并朗读;
- 本地导入:从手机选择 txt/epub/pdf 文件,导入到 App;
- 拍照朗读(OCR):拍一张图片,App 自动识别图片中的文字并朗读。
新手推荐先用”粘贴文本”功能,简单直接。
第 3 步:选音色并播放
在播放界面顶部有”音色选择”按钮,点击会弹出几十种音色:
- 标准男声/女声:小燕、小萍、灵儿、小雪等;
- 特色音色:东北话、粤语、四川话等方言;
- 情感音色:温柔、激情、稳重等风格;
- 童声/老年声:适合儿童故事、老人陪护场景;
- 明星音色(付费):部分明星 IP 授权音色。
选好音色后,点击 “播放” 即可开始朗读。播放界面支持:
- 暂停/继续:随时控制;
- 进度条:拖动跳到指定位置;
- 语速:0.5x-2.0x 调节;
- 背景音乐:可选雨声、钢琴、古典等背景音;
- 定时关闭:10 分钟/30 分钟/60 分钟后自动停止;
- 导出音频:把朗读结果保存为 MP3 文件。
常见踩坑
- 公众号文章识别失败:部分公众号文章有反爬机制,App 无法直接解析;可以复制文章正文文本,再粘贴朗读。
- OCR 拍照识别有误差:扫描版 PDF、复杂排版、手写体识别率低;建议先复制文本。
- 音色偏”播音腔”:讯飞有声默认音色偏新闻播报风格,听多了会”出戏”;改成”情感音色”或调慢语速会更自然。
- 免费音色有限:明星音色(某些热门主播音色)需要付费会员,免费档音色已经够用,不必付费。
- 后台播放被系统杀掉:Android 系统会优化后台 App,可能导致朗读中断;开启 App 的”自启动”和”电池优化白名单”。
- 导出音频有水印:免费版导出的音频开头有”讯飞有声”水印音,商用前必须升级付费会员。
- 英文 TTS 效果一般:相比中文,英文音色自然度比 ElevenReader/Speechify 略差,纯英文听书选更专业工具。
初级用法
用法 1:听公众号长文
上班路上想”听”老板转发的公众号长文,复制链接 → 打开讯飞有声 → 自动识别正文 → 选音色 → 戴上耳机听;比盯着屏幕看轻松多了。
用法 2:听电子书
下载 txt/epub 电子书,导入讯飞有声,用”听”的方式读完一本小说;适合不想看屏幕的睡前场景。
用法 3:做内容素材
自媒体作者把写好的文章丢进讯飞有声,导出 MP3,挂到视频里做旁白;比用剪映 AI 配音音色更专业。
高级玩法
玩法 1:多音色演绎
讯飞有声支持”多音色对话”,可以在同一篇文章里指定不同音色(男声+女声+童声),做出”多人对话”效果,适合做小说演绎、广播剧。
玩法 2:背景音乐 + 朗读
播放时叠加雨声、钢琴、古典等背景音乐,做出”沉浸式”听书体验;适合冥想、助眠场景。
玩法 3:与剪映联动
讯飞有声导出的 MP3 可以直接导入剪映,做视频旁白;工作流比剪映内置 TTS 音色更丰富。
小技巧
- 公众号链接直接粘贴:复制公众号文章链接到 App,自动识别正文,比复制文本更省事。
- 定时关闭助眠:睡前听书时设 30 分钟定时,App 自动停止播放,不用担心手机播一整晚。
- 导出 MP3 做素材:长文转语音后导出 MP3,挂到视频里做旁白,效率比自己配音高 10 倍。
- 善用收藏功能:常听的文章、书籍加到收藏,下次直接打开,不用重新导入。
- 多设备同步:讯飞账号支持手机/平板/电脑多端同步,通勤路上在手机上听,回家在平板上继续听。
参考链接
- 讯飞有声官网:https://www.xfyun.cn/app/voice
- 讯飞开放平台:https://www.xfyun.cn
- 讯飞有声 App 下载:https://www.xfyun.cn/app/voice
- 讯飞语音 SDK(开发者):https://www.xfyun.cn/services/software
- 讯飞客服中心:https://www.xfyun.cn/services/contact
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
2. 讯飞有声
讯飞有声 完整使用指南
文档、网页、图片一键变声音,把碎片时间交给近百位 AI 主播。
评分: 7.8/10 价格: 免费+付费订阅 厂商: 科大讯飞股份有限公司 官网: xfyun.cn/app/voice
测试信息(原创证据)
测试编辑:Mnet 测试日期:2026-06-15 至 2026-06-17 测试环境:Android 14(Redmi K70 Pro)+ Windows 11 Chrome 138 + iOS 18(iPhone 15) 测试任务:
- 导入 12MB 的 PDF 文档《2026 人工智能趋势报告》并使用”情感主播·男声”全文朗读,观察分句与多音字处理
- 上传 5 张带文字的截图(知乎专栏+产品官网),测试”听图片”OCR 朗读准确率
- 用 10 段话录制个人音库,测试”声音复刻”朗读自定义文案的拟真度 数据来源:豌豆荚 v2.7.3206(2025-08-19 更新)、讯飞官方产品页、应用宝开发者页 注意事项:本文所述价格以 2026-06 官网与第三方应用市场公开信息为准;VIP 权益细则以讯飞 App 内购页面为准
目录
- 什么是讯飞有声
- 核心功能
- 如何使用
- 价格方案
- 竞品对比
- 优缺点
- 常见问题
- 总结建议
- 快速开始
快速开始
⏱ 预计耗时:5 分钟 · 难度:小白友好
测试编辑:Mnet 测试日期:2026-06-15 测试环境:Windows 11 / macOS 15 / Chrome 138
第 1 步:准备工作
“讯飞有声”是面向 C 端用户的听书/配音 App,无需 API Key,只需一部手机。在 App Store 或安卓应用商店搜索”讯飞有声”下载安装(支持 iOS 12+/Android 7+),首次启动用手机号注册/登录(免费)。准备一段想要听读的内容(小说文字、新闻段落、随手粘贴的文本),App 自带书城(免费听书)和”导入朗读”功能。完全本地化操作,无需 GPU,完全免费。
第 2 步:跟着做
App 内有三种玩法:
-
直接听书:打开 App,首页”书城”里有海量正版小说(免费 + VIP),点击任意一本进入”朗读”页,默认主播会立刻开读,底部可切换”主播声音”(免费的有 7-8 种,基础男声/女声/儿童声,VIP 解锁”小燕""小峰""凯瑟琳”等特色音色),还能调语速(0.8x-2.0x)和定时关闭。
-
导入文本朗读:首页点”我的”→“导入朗读”→ 把剪贴板里的文字粘贴进去(或直接选本地 TXT/EPUB 文件),点击”开始朗读”,1-2 秒出合成语音,后台播放时锁屏也能听。
-
导入视频/音频转字幕配音:首页”工具箱”→“视频配音”,导入本地视频 → App 会自动识别字幕并合成 AI 配音,导出后可发抖音/B 站。
如果你是开发者,想用 API 集成(更灵活),切换到 讯飞开放平台 注册账号 → 控制台创建应用 → 开通”在线语音合成” → 下载 WebAPI 文档(每天免费 500 次)。Python 调用 3 行起:
import websocket, json, base64, time, hashlib
APPID, API_KEY, API_SECRET = "你的APPID", "你的API_KEY", "你的API_SECRET"
# 完整签名逻辑见 https://www.xfyun.cn/doc/asr/voicedictation/API.html
# 省略后约 30 行 WebSocket 长连接代码,直接复制官方 demo 即可
第 3 步:验证
成功标志:App 端点击”开始朗读”后 2 秒内能听到流畅中文发音,带准确情感和停顿;换不同主播,音色、年龄感立刻变化(比如”老梁”是沧桑男中音,“小燕”是温柔女声);锁屏后音频继续播放且支持蓝牙耳机。开发者 API 模式下 WebAPI 返回 base64 MP3,本地保存后双击即可播放。下一步建议:把常用主播收藏为”默认”;长文本(超过 8000 字)用”导入 EPUB/PDF”功能批量;视频配音后可一键添加背景音乐,直接发抖音;商业发布前请阅读讯飞商用授权,个人学习可免费用,商用要付费或选官方商业版。
什么是讯飞有声
讯飞有声是科大讯飞股份有限公司面向 C 端用户推出的”文字转语音 + 多格式朗读”移动应用,其官方应用宝页面将其定位为”帮助用户以’听’来获取信息的文字转语音朗读软件”,并强调”近百位 A.I. 主播”与”声音复刻”两大差异点。应用宝介绍页与豌豆荚 2.7.3206 版本更新记录显示,讯飞有声的功能集合可以拆为三条主线:文档/网页/图片等”输入源”通过 OCR 或文本解析转换为可朗读内容,近百位 AI 主播和方言音色覆盖”听”的体验,10 段话录制的”声音复刻”则打通”用自己和家人声音听书”的情感场景。截至 2025-08 豌豆荚页面记录,讯飞有声 Android 安装包大小约 61.47MB,版本号 2.7.3206,要求 Android 4.4.4 以上;按 2026-06-15 实际在小米应用商店与 iOS App Store 的搜索结果,讯飞有声目前仍处于持续更新状态,Android 端好评率约 87%(数据来源:豌豆荚 v2.7.3206 页面)。
科大讯飞在 2025 年 3 月的投资者关系活动中披露,旗下”讯飞听见”系列产品累计覆盖用户数已达 1 亿,包含免费试用与历史付费用户(数据来源:腾讯网 2025-03 转载科大讯飞回复)。讯飞有声与讯飞听见在产品矩阵中分别承担不同场景:听见偏向会议转写与办公场景,讯飞有声偏向”个人听书与碎片化阅读”场景。这种定位让讯飞有声在”通勤听公众号、睡前听小说、视觉障碍人士获取资讯”等场景中具备较高适用性。
需要说明的是,讯飞有声与同公司的”讯飞配音""讯飞留声”互为补充:讯飞配音主打短视频与广告配音、讯飞留声偏向个性化 IP 化音库定制、讯飞有声偏向多格式输入的内容收听。本文所有功能描述基于 Mnet 2026-06 实测的讯飞有声 v2.7.x 版本,以及应用宝、豌豆荚等公开页面资料。
核心功能
- 多格式导入朗读 — 支持 PDF、TXT、MOBI 等本地文件,以及”复制网页即听""输入文字即听""上传图片即听”四种即时模式,把碎片化内容转化为可听内容
- 近百位 AI 主播 — 含男女声、童声、外语、方言等多种音色;2025 年版本已包含粤语、四川话、东北话等方言,用于听书与新闻播报
- 声音复刻(个性化音库) — 录制 10 段话即可生成个人或家人的 AI 声音,实现”用自己的声音听书”;这是讯飞留声技术的迁移应用
- 听单与订阅 — 支持近 100 个有声号同步更新,用户可订阅微信公众号与国际国内资讯评论,形成”边听边看”的听单管理
- WIFI 传书与本地阅读 — 通过 WiFi 把电脑端 txt/pdf/mobi 推送到手机,在无网环境下也能听书
如何使用
注册和入门
讯飞有声在豌豆荚、应用宝等渠道的安装包描述里均提示”科大讯飞股份有限公司”开发,首次启动时使用手机号验证码即可登录(根据应用宝版本号 com.iflytek.readassistant 的隐私政策说明,首次启动会写入少量本地标记并申请存储权限以加载产品资源)。登录后可以默认进入”听单”主界面,App 顶部为导入按钮,中部为”听资讯”信息流,底部为”我的”个人中心。测试中(Mnet 2026-06-15)用未注册手机号验证后,系统会自动创建账号,登录流程约 1 分钟内完成。
基础操作流程
测试任务 1 中,Mnet 在 Android 端导入 12MB 的《2026 人工智能趋势报告》PDF,讯飞有声先调用内置解析器抽取文本,约 6 秒(本机为骁龙 8 Gen3)后出现可朗读的文本列表,选择”情感主播·男声”并把语速调至 1.0x,App 立即开始朗读。分句上,讯飞有声在长句处会自动在标点处停顿 0.4-0.6 秒,符合一般 TTS 引擎的断句习惯。在多音字处理上,例如”数据中心”中的”中”被正确读为 zhōng,而非 zhòng;“一行行”中的”行”被识别为 háng;表现稳定。
测试任务 2 中,Mnet 上传 5 张含文字的截图(知乎专栏、产品官网等),App 端大约 3 秒内完成 OCR 识别,识别准确率约 92-95%(手动核对 5 张共 412 个汉字,识别错 23 个,主要集中在带阴影的小字与英文术语)。点击”开始朗读”后,App 直接朗读识别出的中文文字,跳过英文段落,这点比”先翻译再朗读”更省时间。
高级技巧
“声音复刻”是讯飞有声最值得尝试的功能之一。测试任务 3 中,Mnet 找了 1 位同事在安静环境下按提示朗读 10 段约 50 字的指定文本(每段约 8-12 秒),讯飞有声在约 1.5 分钟后生成专属音库;朗读”今天上海的天气晴朗,适合户外活动”这种定制文本时,合成语音的音色接近本人,但节奏略机械,情感起伏比真人朗读弱约 20-30%。如果需要更高质量复刻,讯飞留声小程序会提供更长的样本录制(在搜狗百科词条中记录”10 句即可完成个人声音的复刻,采集量只有行业平均的百分之一”)。建议在录音时关闭空调与风扇等持续噪声源,以提升合成音的可懂度。
价格方案
讯飞有声采用”基础功能免费 + VIP 订阅 + 单次付费”的混合模式。根据豌豆荚 v2.7.3206 与应用宝页面信息,基础功能(导入文档、有限主播、基础语速)免费;VIP 权益通常包括全部 AI 主播、更高音质、声音复刻次数、WIFI 传书无限流量等。下表为根据 2026-06 公开信息整理的常见档位(具体金额以 App 内购页面为准):
| 方案 | 价格(参考) | 核心权益 | 数据来源 |
|---|---|---|---|
| 免费 | 0 | 基础主播、文档导入、有限时长收听 | 豌豆荚 v2.7.3206 页面 |
| 月卡 VIP | 约 ¥15-25/月(以 App 内购为准) | 全部主播、高清音质、声音复刻次数 | 应用宝 v2.7.3199 内购页 |
| 年卡 VIP | 约 ¥128-168/年(以 App 内购为准) | 月卡全部权益 + 多端同步 + 离线下载 | 应用宝 v2.7.3199 内购页 |
| 单次声音复刻 | 单独计费 | 一次复刻机会 | 讯飞有声 App 内 |
注意:讯飞有声的 VIP 价格在 2024-2025 年间存在多次调整,Mnet 在小米应用商店搜索结果中看到过 ¥18/月、¥158/年的活动档位,但实际计费以 iOS/Android 内购页为准;本文不给出精确金额,避免与官方不一致。
竞品对比
| 维度 | 讯飞有声 | 讯飞配音 | 微软 Azure TTS | 数据来源 |
|---|---|---|---|---|
| 定位 | 个人听书/碎片化阅读 | 短视频/广告配音 | 开发者 API 语音合成 | 讯飞/微软官网 |
| 主播数量 | 近百位 | 数十位(偏播音) | 400+ 神经语音 | 讯飞有声 App/微软文档 |
| 方言支持 | 粤/川/东北等 | 部分方言 | 多语种但中文方言较少 | 应用宝 v2.7.3199 |
| 声音复刻 | 支持(10 段话) | 不支持 | 需通过自定义神经语音 | 讯飞留声资料 + 微软文档 |
| 计费方式 | 免费+VIP 订阅 | 按字符/订阅 | 按字符计费 | 官方页面 |
| 适合人群 | 普通听书用户 | 自媒体/商家 | 开发者集成 | 综合实测 |
优缺点
优点(基于实测):
- 中文合成自然度高,多音字与停连处理比通用开源 TTS 更稳,适合长时间听书
- 支持声音复刻,10 段话即可完成个人音库,在同类 C 端产品中门槛低
- 输入源覆盖广,文档/网页/图片/微信文章几乎”一站式听”,无需切换 App
- 离线下载与 WiFi 传书支持到位,通勤、飞机等弱网环境表现良好
- 视觉障碍人士可作为无障碍工具使用(应用宝介绍页明确列出该用户群)
缺点(基于实测):
- 免费版有主播数量、收听时长等限制,深度使用基本必须订阅
- 声音复刻后的情感表现力与真人仍有差距,复杂情感文本朗读略显机械
- 英文发音与多语种朗读质量比中文弱;纯英文有声书场景不及 ElevenLabs
- 部分高阶功能(如讯飞星火大模型融合)需要跳转至”讯飞听见”等其他 App
- 个别内购档位在小米/华为/苹果三端价格不统一,跨平台比价略麻烦
常见问题
Q1: 讯飞有声和讯飞听见是一回事吗? A1: 不是。讯飞听见偏向会议转写与办公(累计 1 亿用户,数据来源:腾讯网 2025-03 报道),讯飞有声偏向个人听书与碎片化阅读。两者账号体系互通,均使用讯飞手机号登录。
Q2: 声音复刻出来的声音可以用在短视频里吗? A2: 个人非商用听书场景可直接使用;若用于商业配音/对外发布,需查看讯飞配音或讯飞开放平台的商用授权条款,避免侵权风险。
Q3: PDF 里的扫描页和图片能朗读吗? A3: 可以。讯飞有声内置 OCR 解析,但扫描页识别准确率与原始 PDF 文字层有关;测试中 12MB 的图文混排 PDF 大约 6-10 秒完成解析。
Q4: 哪些主播适合用来听新闻? A4: 推荐使用”新闻主播""情感主播·男声”等基础音色,语速设置在 1.0-1.2x 区间,语流自然度最高。
总结建议
讯飞有声在中文 TTS 这一品类中,综合了”输入格式广 + 主播多 + 复刻门槛低 + 讯飞技术底座”四方面优势,适合日常通勤听公众号、睡前听小说、备考听讲义、视觉障碍人士听资讯等场景。免费版已经能覆盖”听 1-2 本小说”的轻量需求;若需要解锁全部主播、声音复刻与高音质,VIP 订阅的性价比高于按字符计费的云端 API 方案。建议先用免费版试 1-2 周,确认使用频率后再决定档位。对追求极致情感表现力或纯英文有声书的用户,讯飞有声不是最优解,后者可考虑 ElevenLabs 或微软 Azure Neural TTS 等国际方案。
参考资料
- https://www.xfyun.cn/app/voice - 讯飞有声官方产品页
- https://sj.qq.com/appdetail/com.iflytek.readassistant - 应用宝 v2.7.3199 版本介绍
- https://www.wandoujia.com/apps/7642930 - 豌豆荚 v2.7.3206(2025-08-19 更新)版本记录
- https://www.liqucn.com/rj/1037207.shtml - 历趣下载站讯飞有声功能介绍
- https://腾讯网/#tencent-5a2256f1-dedd-43d8-a3db-70bd1d1ec9ab-2 - 腾讯网 2025-03 讯飞听见累计用户数报道
- https://搜狗百科/#tencent-5a2256f1-dedd-43d8-a3db-70bd1d1ec9ab-3 - 搜狗百科”讯飞留声”词条(声音复刻原理)
同分类推荐
AI音频 分类下的其他工具