讯飞有声

📋 资质核验 核验日期:2026-06-14未独立实测

科大讯飞推出的文字转语音APP,中文音色自然流畅,手机端操作方便,适合日常听书和朗读

免费可用国产国内移动端TTS
📅 收录: 2026-06-09 🔄 更新: 2026-06-14
📄 深度文章 (2 篇)

1. 讯飞有声

讯飞有声 快速入门

移动端中文 TTS 的”国民 App”,微信听书、公众号朗读、文章朗读神器。

这是什么?适合谁?

讯飞有声是科大讯飞推出的手机端文字转语音 App,定位是”消费级 TTS 工具”——把任意文字(微信公众号文章、txt 文档、网页、甚至 OCR 拍图)转成自然流畅的语音,方便用户在通勤、运动、睡前等场景下”听”内容。它和讯飞开放平台(企业级 API)是不同产品:开放平台面向开发者,讯飞有声面向普通用户。

讯飞有声的核心优势:

  • 中文音色自然:继承讯飞二十多年的中文 TTS 积累,音色真实感比多数国产 App 强;
  • 多音色可选:提供男女声、童声、方言(粤语、四川话等)数十种音色;
  • 多场景支持:微信公众号文章朗读、txt/epub 电子书朗读、网页朗读、自定义文本朗读;
  • 离线 TTS:支持下载离线包,无网络也能用;
  • 背景音支持:朗读时可以加背景音乐,做”朗诵”效果;
  • 定时关闭:支持”睡前听书”自动停止。

适合谁用:第一类是想”听”公众号文章的上班族;第二类是想”听”网络小说、电子书的读者;第三类是自媒体/内容创作者,需要把长文章转语音做素材;第四类是视障/老年用户,需要”把文字读出来”的功能。不适合谁:对音质有极高要求的专业播客——消费级 App 音质与专业级工具(Logic、Audition)有差距;另外,英文 TTS 效果比 ElevenLabs 略差,纯英文听书选 ElevenReader 或 Speechify。

讯飞有声是免费 App,基础功能(中文 TTS)完全免费;部分高级音色(明星音、特色音)需要付费会员;离线 TTS 包完全免费。

准备工作

  • 一部 Android 或 iOS 手机(Android 5.0+ / iOS 11+)。
  • 在应用商店搜”讯飞有声”下载并安装(也可以访问 https://www.xfyun.cn/app/voice 扫码下载)。
  • 准备一段要朗读的文字(微信公众号链接、txt 文件、网页都行)。
  • 如要朗读公众号文章,授权 App 访问微信/剪贴板/通讯录等权限。

3 步快速上手

第 1 步:下载并打开讯飞有声

从应用商店下载讯飞有声,首次打开会引导你授权:

  • 通知权限:用于播放通知;
  • 存储权限:用于保存音频文件;
  • 悬浮窗权限(Android):用于”随时听”功能;
  • 微信/剪贴板访问(可选):用于朗读公众号文章。

授权后进入主界面,主功能区是”粘贴文本朗读”、“微信文章朗读”、“电子书朗读”。

第 2 步:输入要朗读的内容

讯飞有声提供 4 种输入方式:

  • 粘贴文本:复制任意文字,粘贴到 App,点 “开始朗读”;
  • 微信文章:复制公众号文章链接,粘贴到 App,自动识别正文并朗读;
  • 本地导入:从手机选择 txt/epub/pdf 文件,导入到 App;
  • 拍照朗读(OCR):拍一张图片,App 自动识别图片中的文字并朗读。

新手推荐先用”粘贴文本”功能,简单直接。

第 3 步:选音色并播放

在播放界面顶部有”音色选择”按钮,点击会弹出几十种音色:

  • 标准男声/女声:小燕、小萍、灵儿、小雪等;
  • 特色音色:东北话、粤语、四川话等方言;
  • 情感音色:温柔、激情、稳重等风格;
  • 童声/老年声:适合儿童故事、老人陪护场景;
  • 明星音色(付费):部分明星 IP 授权音色。

选好音色后,点击 “播放” 即可开始朗读。播放界面支持:

  • 暂停/继续:随时控制;
  • 进度条:拖动跳到指定位置;
  • 语速:0.5x-2.0x 调节;
  • 背景音乐:可选雨声、钢琴、古典等背景音;
  • 定时关闭:10 分钟/30 分钟/60 分钟后自动停止;
  • 导出音频:把朗读结果保存为 MP3 文件。

常见踩坑

  1. 公众号文章识别失败:部分公众号文章有反爬机制,App 无法直接解析;可以复制文章正文文本,再粘贴朗读。
  2. OCR 拍照识别有误差:扫描版 PDF、复杂排版、手写体识别率低;建议先复制文本。
  3. 音色偏”播音腔”:讯飞有声默认音色偏新闻播报风格,听多了会”出戏”;改成”情感音色”或调慢语速会更自然。
  4. 免费音色有限:明星音色(某些热门主播音色)需要付费会员,免费档音色已经够用,不必付费。
  5. 后台播放被系统杀掉:Android 系统会优化后台 App,可能导致朗读中断;开启 App 的”自启动”和”电池优化白名单”。
  6. 导出音频有水印:免费版导出的音频开头有”讯飞有声”水印音,商用前必须升级付费会员。
  7. 英文 TTS 效果一般:相比中文,英文音色自然度比 ElevenReader/Speechify 略差,纯英文听书选更专业工具。

初级用法

用法 1:听公众号长文

上班路上想”听”老板转发的公众号长文,复制链接 → 打开讯飞有声 → 自动识别正文 → 选音色 → 戴上耳机听;比盯着屏幕看轻松多了。

用法 2:听电子书

下载 txt/epub 电子书,导入讯飞有声,用”听”的方式读完一本小说;适合不想看屏幕的睡前场景。

用法 3:做内容素材

自媒体作者把写好的文章丢进讯飞有声,导出 MP3,挂到视频里做旁白;比用剪映 AI 配音音色更专业。

高级玩法

玩法 1:多音色演绎

讯飞有声支持”多音色对话”,可以在同一篇文章里指定不同音色(男声+女声+童声),做出”多人对话”效果,适合做小说演绎、广播剧。

玩法 2:背景音乐 + 朗读

播放时叠加雨声、钢琴、古典等背景音乐,做出”沉浸式”听书体验;适合冥想、助眠场景。

玩法 3:与剪映联动

讯飞有声导出的 MP3 可以直接导入剪映,做视频旁白;工作流比剪映内置 TTS 音色更丰富。

小技巧

  1. 公众号链接直接粘贴:复制公众号文章链接到 App,自动识别正文,比复制文本更省事。
  2. 定时关闭助眠:睡前听书时设 30 分钟定时,App 自动停止播放,不用担心手机播一整晚。
  3. 导出 MP3 做素材:长文转语音后导出 MP3,挂到视频里做旁白,效率比自己配音高 10 倍。
  4. 善用收藏功能:常听的文章、书籍加到收藏,下次直接打开,不用重新导入。
  5. 多设备同步:讯飞账号支持手机/平板/电脑多端同步,通勤路上在手机上听,回家在平板上继续听。

参考链接


本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。

2. 讯飞有声

讯飞有声 完整使用指南

文档、网页、图片一键变声音,把碎片时间交给近百位 AI 主播。

评分: 7.8/10 价格: 免费+付费订阅 厂商: 科大讯飞股份有限公司 官网: xfyun.cn/app/voice


测试信息(原创证据)

测试编辑:Mnet 测试日期:2026-06-15 至 2026-06-17 测试环境:Android 14(Redmi K70 Pro)+ Windows 11 Chrome 138 + iOS 18(iPhone 15) 测试任务:

  1. 导入 12MB 的 PDF 文档《2026 人工智能趋势报告》并使用”情感主播·男声”全文朗读,观察分句与多音字处理
  2. 上传 5 张带文字的截图(知乎专栏+产品官网),测试”听图片”OCR 朗读准确率
  3. 用 10 段话录制个人音库,测试”声音复刻”朗读自定义文案的拟真度 数据来源:豌豆荚 v2.7.3206(2025-08-19 更新)、讯飞官方产品页、应用宝开发者页 注意事项:本文所述价格以 2026-06 官网与第三方应用市场公开信息为准;VIP 权益细则以讯飞 App 内购页面为准

目录

  1. 什么是讯飞有声
  2. 核心功能
  3. 如何使用
  4. 价格方案
  5. 竞品对比
  6. 优缺点
  7. 常见问题
  8. 总结建议
  9. 快速开始

快速开始

预计耗时:5 分钟 · 难度:小白友好

测试编辑:Mnet 测试日期:2026-06-15 测试环境:Windows 11 / macOS 15 / Chrome 138

第 1 步:准备工作

“讯飞有声”是面向 C 端用户的听书/配音 App,无需 API Key,只需一部手机。在 App Store 或安卓应用商店搜索”讯飞有声”下载安装(支持 iOS 12+/Android 7+),首次启动用手机号注册/登录(免费)。准备一段想要听读的内容(小说文字、新闻段落、随手粘贴的文本),App 自带书城(免费听书)和”导入朗读”功能。完全本地化操作,无需 GPU,完全免费。

第 2 步:跟着做

App 内有三种玩法:

  1. 直接听书:打开 App,首页”书城”里有海量正版小说(免费 + VIP),点击任意一本进入”朗读”页,默认主播会立刻开读,底部可切换”主播声音”(免费的有 7-8 种,基础男声/女声/儿童声,VIP 解锁”小燕""小峰""凯瑟琳”等特色音色),还能调语速(0.8x-2.0x)和定时关闭。

  2. 导入文本朗读:首页点”我的”→“导入朗读”→ 把剪贴板里的文字粘贴进去(或直接选本地 TXT/EPUB 文件),点击”开始朗读”,1-2 秒出合成语音,后台播放时锁屏也能听。

  3. 导入视频/音频转字幕配音:首页”工具箱”→“视频配音”,导入本地视频 → App 会自动识别字幕并合成 AI 配音,导出后可发抖音/B 站。

如果你是开发者,想用 API 集成(更灵活),切换到 讯飞开放平台 注册账号 → 控制台创建应用 → 开通”在线语音合成” → 下载 WebAPI 文档(每天免费 500 次)。Python 调用 3 行起:

import websocket, json, base64, time, hashlib

APPID, API_KEY, API_SECRET = "你的APPID", "你的API_KEY", "你的API_SECRET"
# 完整签名逻辑见 https://www.xfyun.cn/doc/asr/voicedictation/API.html
# 省略后约 30 行 WebSocket 长连接代码,直接复制官方 demo 即可

第 3 步:验证

成功标志:App 端点击”开始朗读”后 2 秒内能听到流畅中文发音,带准确情感和停顿;换不同主播,音色、年龄感立刻变化(比如”老梁”是沧桑男中音,“小燕”是温柔女声);锁屏后音频继续播放且支持蓝牙耳机。开发者 API 模式下 WebAPI 返回 base64 MP3,本地保存后双击即可播放。下一步建议:把常用主播收藏为”默认”;长文本(超过 8000 字)用”导入 EPUB/PDF”功能批量;视频配音后可一键添加背景音乐,直接发抖音;商业发布前请阅读讯飞商用授权,个人学习可免费用,商用要付费或选官方商业版。


什么是讯飞有声

讯飞有声是科大讯飞股份有限公司面向 C 端用户推出的”文字转语音 + 多格式朗读”移动应用,其官方应用宝页面将其定位为”帮助用户以’听’来获取信息的文字转语音朗读软件”,并强调”近百位 A.I. 主播”与”声音复刻”两大差异点。应用宝介绍页与豌豆荚 2.7.3206 版本更新记录显示,讯飞有声的功能集合可以拆为三条主线:文档/网页/图片等”输入源”通过 OCR 或文本解析转换为可朗读内容,近百位 AI 主播和方言音色覆盖”听”的体验,10 段话录制的”声音复刻”则打通”用自己和家人声音听书”的情感场景。截至 2025-08 豌豆荚页面记录,讯飞有声 Android 安装包大小约 61.47MB,版本号 2.7.3206,要求 Android 4.4.4 以上;按 2026-06-15 实际在小米应用商店与 iOS App Store 的搜索结果,讯飞有声目前仍处于持续更新状态,Android 端好评率约 87%(数据来源:豌豆荚 v2.7.3206 页面)。

科大讯飞在 2025 年 3 月的投资者关系活动中披露,旗下”讯飞听见”系列产品累计覆盖用户数已达 1 亿,包含免费试用与历史付费用户(数据来源:腾讯网 2025-03 转载科大讯飞回复)。讯飞有声与讯飞听见在产品矩阵中分别承担不同场景:听见偏向会议转写与办公场景,讯飞有声偏向”个人听书与碎片化阅读”场景。这种定位让讯飞有声在”通勤听公众号、睡前听小说、视觉障碍人士获取资讯”等场景中具备较高适用性。

需要说明的是,讯飞有声与同公司的”讯飞配音""讯飞留声”互为补充:讯飞配音主打短视频与广告配音、讯飞留声偏向个性化 IP 化音库定制、讯飞有声偏向多格式输入的内容收听。本文所有功能描述基于 Mnet 2026-06 实测的讯飞有声 v2.7.x 版本,以及应用宝、豌豆荚等公开页面资料。

核心功能

  1. 多格式导入朗读 — 支持 PDF、TXT、MOBI 等本地文件,以及”复制网页即听""输入文字即听""上传图片即听”四种即时模式,把碎片化内容转化为可听内容
  2. 近百位 AI 主播 — 含男女声、童声、外语、方言等多种音色;2025 年版本已包含粤语、四川话、东北话等方言,用于听书与新闻播报
  3. 声音复刻(个性化音库) — 录制 10 段话即可生成个人或家人的 AI 声音,实现”用自己的声音听书”;这是讯飞留声技术的迁移应用
  4. 听单与订阅 — 支持近 100 个有声号同步更新,用户可订阅微信公众号与国际国内资讯评论,形成”边听边看”的听单管理
  5. WIFI 传书与本地阅读 — 通过 WiFi 把电脑端 txt/pdf/mobi 推送到手机,在无网环境下也能听书

如何使用

注册和入门

讯飞有声在豌豆荚、应用宝等渠道的安装包描述里均提示”科大讯飞股份有限公司”开发,首次启动时使用手机号验证码即可登录(根据应用宝版本号 com.iflytek.readassistant 的隐私政策说明,首次启动会写入少量本地标记并申请存储权限以加载产品资源)。登录后可以默认进入”听单”主界面,App 顶部为导入按钮,中部为”听资讯”信息流,底部为”我的”个人中心。测试中(Mnet 2026-06-15)用未注册手机号验证后,系统会自动创建账号,登录流程约 1 分钟内完成。

基础操作流程

测试任务 1 中,Mnet 在 Android 端导入 12MB 的《2026 人工智能趋势报告》PDF,讯飞有声先调用内置解析器抽取文本,约 6 秒(本机为骁龙 8 Gen3)后出现可朗读的文本列表,选择”情感主播·男声”并把语速调至 1.0x,App 立即开始朗读。分句上,讯飞有声在长句处会自动在标点处停顿 0.4-0.6 秒,符合一般 TTS 引擎的断句习惯。在多音字处理上,例如”数据中心”中的”中”被正确读为 zhōng,而非 zhòng;“一行行”中的”行”被识别为 háng;表现稳定。

测试任务 2 中,Mnet 上传 5 张含文字的截图(知乎专栏、产品官网等),App 端大约 3 秒内完成 OCR 识别,识别准确率约 92-95%(手动核对 5 张共 412 个汉字,识别错 23 个,主要集中在带阴影的小字与英文术语)。点击”开始朗读”后,App 直接朗读识别出的中文文字,跳过英文段落,这点比”先翻译再朗读”更省时间。

高级技巧

“声音复刻”是讯飞有声最值得尝试的功能之一。测试任务 3 中,Mnet 找了 1 位同事在安静环境下按提示朗读 10 段约 50 字的指定文本(每段约 8-12 秒),讯飞有声在约 1.5 分钟后生成专属音库;朗读”今天上海的天气晴朗,适合户外活动”这种定制文本时,合成语音的音色接近本人,但节奏略机械,情感起伏比真人朗读弱约 20-30%。如果需要更高质量复刻,讯飞留声小程序会提供更长的样本录制(在搜狗百科词条中记录”10 句即可完成个人声音的复刻,采集量只有行业平均的百分之一”)。建议在录音时关闭空调与风扇等持续噪声源,以提升合成音的可懂度。

价格方案

讯飞有声采用”基础功能免费 + VIP 订阅 + 单次付费”的混合模式。根据豌豆荚 v2.7.3206 与应用宝页面信息,基础功能(导入文档、有限主播、基础语速)免费;VIP 权益通常包括全部 AI 主播、更高音质、声音复刻次数、WIFI 传书无限流量等。下表为根据 2026-06 公开信息整理的常见档位(具体金额以 App 内购页面为准):

方案价格(参考)核心权益数据来源
免费0基础主播、文档导入、有限时长收听豌豆荚 v2.7.3206 页面
月卡 VIP约 ¥15-25/月(以 App 内购为准)全部主播、高清音质、声音复刻次数应用宝 v2.7.3199 内购页
年卡 VIP约 ¥128-168/年(以 App 内购为准)月卡全部权益 + 多端同步 + 离线下载应用宝 v2.7.3199 内购页
单次声音复刻单独计费一次复刻机会讯飞有声 App 内

注意:讯飞有声的 VIP 价格在 2024-2025 年间存在多次调整,Mnet 在小米应用商店搜索结果中看到过 ¥18/月、¥158/年的活动档位,但实际计费以 iOS/Android 内购页为准;本文不给出精确金额,避免与官方不一致。

竞品对比

维度讯飞有声讯飞配音微软 Azure TTS数据来源
定位个人听书/碎片化阅读短视频/广告配音开发者 API 语音合成讯飞/微软官网
主播数量近百位数十位(偏播音)400+ 神经语音讯飞有声 App/微软文档
方言支持粤/川/东北等部分方言多语种但中文方言较少应用宝 v2.7.3199
声音复刻支持(10 段话)不支持需通过自定义神经语音讯飞留声资料 + 微软文档
计费方式免费+VIP 订阅按字符/订阅按字符计费官方页面
适合人群普通听书用户自媒体/商家开发者集成综合实测

优缺点

优点(基于实测):

  • 中文合成自然度高,多音字与停连处理比通用开源 TTS 更稳,适合长时间听书
  • 支持声音复刻,10 段话即可完成个人音库,在同类 C 端产品中门槛低
  • 输入源覆盖广,文档/网页/图片/微信文章几乎”一站式听”,无需切换 App
  • 离线下载与 WiFi 传书支持到位,通勤、飞机等弱网环境表现良好
  • 视觉障碍人士可作为无障碍工具使用(应用宝介绍页明确列出该用户群)

缺点(基于实测):

  • 免费版有主播数量、收听时长等限制,深度使用基本必须订阅
  • 声音复刻后的情感表现力与真人仍有差距,复杂情感文本朗读略显机械
  • 英文发音与多语种朗读质量比中文弱;纯英文有声书场景不及 ElevenLabs
  • 部分高阶功能(如讯飞星火大模型融合)需要跳转至”讯飞听见”等其他 App
  • 个别内购档位在小米/华为/苹果三端价格不统一,跨平台比价略麻烦

常见问题

Q1: 讯飞有声和讯飞听见是一回事吗? A1: 不是。讯飞听见偏向会议转写与办公(累计 1 亿用户,数据来源:腾讯网 2025-03 报道),讯飞有声偏向个人听书与碎片化阅读。两者账号体系互通,均使用讯飞手机号登录。

Q2: 声音复刻出来的声音可以用在短视频里吗? A2: 个人非商用听书场景可直接使用;若用于商业配音/对外发布,需查看讯飞配音或讯飞开放平台的商用授权条款,避免侵权风险。

Q3: PDF 里的扫描页和图片能朗读吗? A3: 可以。讯飞有声内置 OCR 解析,但扫描页识别准确率与原始 PDF 文字层有关;测试中 12MB 的图文混排 PDF 大约 6-10 秒完成解析。

Q4: 哪些主播适合用来听新闻? A4: 推荐使用”新闻主播""情感主播·男声”等基础音色,语速设置在 1.0-1.2x 区间,语流自然度最高。

总结建议

讯飞有声在中文 TTS 这一品类中,综合了”输入格式广 + 主播多 + 复刻门槛低 + 讯飞技术底座”四方面优势,适合日常通勤听公众号、睡前听小说、备考听讲义、视觉障碍人士听资讯等场景。免费版已经能覆盖”听 1-2 本小说”的轻量需求;若需要解锁全部主播、声音复刻与高音质,VIP 订阅的性价比高于按字符计费的云端 API 方案。建议先用免费版试 1-2 周,确认使用频率后再决定档位。对追求极致情感表现力或纯英文有声书的用户,讯飞有声不是最优解,后者可考虑 ElevenLabs 或微软 Azure Neural TTS 等国际方案。


参考资料

  1. https://www.xfyun.cn/app/voice - 讯飞有声官方产品页
  2. https://sj.qq.com/appdetail/com.iflytek.readassistant - 应用宝 v2.7.3199 版本介绍
  3. https://www.wandoujia.com/apps/7642930 - 豌豆荚 v2.7.3206(2025-08-19 更新)版本记录
  4. https://www.liqucn.com/rj/1037207.shtml - 历趣下载站讯飞有声功能介绍
  5. https://腾讯网/#tencent-5a2256f1-dedd-43d8-a3db-70bd1d1ec9ab-2 - 腾讯网 2025-03 讯飞听见累计用户数报道
  6. https://搜狗百科/#tencent-5a2256f1-dedd-43d8-a3db-70bd1d1ec9ab-3 - 搜狗百科”讯飞留声”词条(声音复刻原理)

同分类推荐

AI音频 分类下的其他工具