超七成阅读APP都借百度语音技术促用户增长

2023-11-03

全国十多亿人在这个春节集体“关门闭户”与手机和网络作伴,除了手游和短视频流量飞涨,在线阅读也迎来“高光时刻”,特别是当手机阅读APP标配了语音朗读即“听书”功能。

据百度大脑AI开放平台的后台数据显示,疫情期间,支持“听书”功能的语音合成技术的调用量飙升,峰值时日均调用量增加20亿。这20亿次调用量约等于2000亿字的阅读量,相当于每天将《哈利·波特》全集读上6万多遍!

市面上超过70%的泛阅读类APP已经接入百度大脑的语音技术,让用户随时随地、随心所欲切换“读书”和“听书”,解放双手双眼,沉浸书海不间断。

2万本小说14天实现音频化,七猫小说用“听小说”拓展阅读场景

以接入百度大脑语音技术的七猫小说为例,上线语音朗读即听书功能后,七猫小说的下载量直线上升。据国内专业的移动应用数据分析平台七麦数据显示,1月下旬开始,七猫小说的下载量一直处于苹果App Store免费榜前列,最高曾达到图书榜首位,总榜第二位。
在这里插入图片描述

七猫小说是一款拥有丰富网文资源与“阅读赚金币”奖励机制的免费阅读软件,团队非常重视拓展阅读场景,他们早早便洞察到,快节奏的生活下越来越多的人开始尝试“听书”这种更便捷的方式。但在号称“得内容者得天下”的在线阅读领域里,七猫小说海量的小说资源却给“转化”带来了困难。在花了不少时间研究如何将小说音频化后,七猫小说最终决定接入百度大脑语音识别和语音合成技术,仅用了14天,实现2万本有声小说的“量产”上线。

自此,每一位用户都能通过七猫小说随时随地的听书,朗读时有磁性男声、甜美女声、萌萌童声等9种音色供选择,速度能从0.5倍速调到3倍速。七猫小说因此迅速拓展了通勤、运动、睡前、做家务、休息间隙等全新阅读场景。听书功能上线3个月来,单个用户平均每日听书时长在5小时左右,上线初在官方读者群中,该功能收获了一大波好评,例如“功能很棒,终于可以在不能看小说的时候接着听了”。
在这里插入图片描述

百度大脑语音技术覆盖超7成泛阅读类APP,自然度、流畅度MAX

事实上,百度大脑语音技术已覆盖泛阅读领域70%以上的产品,例如掌阅、得间小说、起点中文网、飞卢小说等都已接入,让用户可以利用碎片化时间,像听音乐一样的去听书。

百度大脑语音合成技术能够将小说文字输出成流畅自然的语音,支持中文普通话、中英文混读。即使是大篇幅的文字也能顺畅播放,断字断句准确,并对语句中停顿处理得当。同时,合成语音中能控制音调、音量,让合成效果更接近真人发声。

在这里插入图片描述
在这里插入图片描述

据第十六次全国国民阅读调查结果显示,目前已有近30%的读者有了“听书”习惯。同时艾媒研究院发布的《艾媒报告|2018—2019中国有声书市场专题研究报告》也指出,当前国内有声书用户规模达到3.85亿,有声书市场规模达46.3亿元。市场需求大,用户增长快,人们对听书体验的要求也势必提高。

对于小说、散文、科普等不同内容,所需发音人的音色、韵律、情感各不相同。针对这一诉求,百度大脑迅速响应,即将在4月上线更多专门为阅读听书场景打造的发音人音库,包括适合朗读武侠、散文、悬疑推理小说等各个类型的声音,让语音朗读效果更生动有趣。

有声阅读这种适用于多场景和碎片化时间的阅读方式,正在逐渐影响着人们阅读的习惯。无论是校园教育,还是走入职场后的自我学习,阅读始终都是人们提升能力的重要途径,而借助音频形式,更有助于让优秀文学作品触及更多年轻读者群体。从读书到听书,百度大脑的语音技术既帮阅读软件开拓了全新的阅读场景,也惠及着背后数以亿计的读者,让一键“听万卷”成为现实。

立即体验语音合成 https://ai.baidu.com/tech/speech/tts

期待你的加入

百度开发者中心已开启征稿模式,欢迎开发者登录developer.baidu.com进行投稿,优质文章将获得丰厚奖励和推广资源。
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

超七成阅读APP都借百度语音技术促用户增长 的相关文章

  • DSTC10 赛道最佳论文揭晓 文心 PLATO 再获殊荣

    国际对话系统技术挑战赛DSTC The Dialog System Technology Challenge 作为全球人工智能顶级学术竞赛 由微软 卡内基梅隆大学的科学家于2013年发起 在对话领域具有极高的权威性和知名度 近日 第十届对话
  • Kaldi-MFCC模块源码主流程分析

    那么趁着这个机会 研究一下kaldi源码中MFCC部分的内容 不说废话 我们从 compute mfcc feats cc开始讲解 这里是个main函数 需要携带参数 具体使用样例如下 1 compute mfcc feats 其实看到这里
  • 中文语音识别数据集总结

    目录 OpenSLR国内镜像 1 Free ST Chinese Mandarin Corpus 2 Primewords Chinese Corpus Set 1 3 爱数智慧中文手机录音音频语料库 Mandarin Chinese Re
  • Python轻松搞定免费语音合成,利用百度AI为短视频配音

    1 创建百度AI账号 1 1 点击进入百度AI 左上角 开放能力 gt 语音合成 gt 立即使用 如果是试用 可以直接点击在线语音合成 不过语音不能下载 要下载还得用下面方式 调用百度AI的API 1 2 然后登录百度云账户 进入管理中心
  • 模型训练——Loss函数 归纳汇总

    上一篇文章 语音降噪模型归纳汇总 很意外地收到了点赞收藏和关注 如此的反馈给了我极大的鼓舞 这里就再梳理了一下loss函数相关的知识 以求方便能作为一份工具性质的文章展现出来 能力一般 水平有限 欢迎大家指正 干货分享 欢迎收藏点赞加关注
  • AI语音合成软件免费的有哪些?常用的语音合成软件

    近年来 短视频作为一种新兴的互联网内容传播形式 逐渐获得各大平台和粉丝的青睐 其时长简短并适合在移动状态和休闲状态下观看的特点 将产品受众面拓展到整体网民的88 3 上至老年人 下至小孩子 都多多少少可以自己创作一些短视频作品以供娱乐 那么
  • 【更好的中文语音识别SpeechBrain Win10/11本地部署,基于Aishell】

    环境 Win11x64 Vscode Python3 7 2x64 Pytorch1 9 CPU or GPU 本文默认Win11 Win10 100 素可以得 默认向下兼容 首先 你得把Vscode弄好 python 插件安装 py环境搭
  • lattice

    lattice 在实际的语音识别系统中 最优路径不一定与实际字序列匹配 我们一般希望能够得到得分最靠前的多条候选路径 即N best 为了紧凑地保存候选路径 我们一般采用lattice 词图 来保存识别的候选序列 lattice本质上是一个
  • 语音转文字,视频转文字的新大陆!--飞书(好用记得点个赞)

    语音转文字 视频转文字的新大陆 飞书 1 选择自己对应的系统 下载飞书 飞书是字节跳动于2016年自研的新一代一站式协作平台 网址 https www feishu cn 2 下载安装之后 使用手机号 邮箱等注册登录 点击会议 点击进入子菜
  • GMM-HMM在语音识别中的应用

    1 语音识别系统的基本结构 2 涉及算法 3 GMM高斯混合模型 3 1高斯混合模型的基本概念 高斯混合模型是指具有如下形式的概率分布模型 p y k 1k k y k p y arrowvert theta sum k 1 k alpha
  • 【AI外呼+RPA自动加微】,解锁企微新能力

    促销季临近 各类线上促销活动又拉开帷幕 多数商家意识到 在铺广告 做推广获客的同时 还可以利用好现有的用户数据 与客户建立更紧密的联系 激活客户进行二次转化 为了更加便于激活 运营客户 我们可以将客户引入另一个流量载体 企微私域 在使用平台
  • ECM麦克风电路元器件计算

    ECM麦克风电路元器件设计 一 计算Micbias 偏置电阻R R 偏置电压 micbias电压 静态电流 1 偏置电阻计算案例 供电2V ECM麦克风电流500uA 偏置电阻取值 设置合适的偏置电阻 麦克风实现最大输出 需麦克风两端电压是
  • 语音识别-信号处理篇

    我的书 淘宝购买链接 当当购买链接 京东购买链接 连接前端和后端的语音识别 ASR 的关键是给到后端 根据特征判定词 句 系统的特征类型和特征质量 对于传统的语音识别系统常采用MFCC mel frequency ceptral coeff
  • WebRTC中AECM算法简介

    1 算法介绍以及整体框架 1 1算法整体框架 AECM 属于 WebRTC 语音处理引擎 Voice Engine 的子模块 是为移动设备专门设计的回声消除处理模块 其内部有根据芯片类型进行汇编指令级的特殊优化 AECM 的主体工程文件可以
  • 2023 年最常见的人工智能面试问题

    人工智能面试问题 自从我们意识到人工智能如何对市场产生积极影响以来 几乎每个大型企业都在寻找人工智能专业人士来帮助他们实现愿景 在这个人工智能面试问题博客中 我收集了面试官最常问的问题 人工智能 AI 面试问答 人工智能面试准备 此 Edu
  • OCR加持白描App,让AI成为视障者的眼睛

    现实中 你可以轻松无障碍地阅读各类平面印刷文字以及身边的一切 或许你未曾想过 视障人群该怎么办呢 统计数据显示 中国大约有1700万的视障群体 相当于每100个人中就有超过1位是视障人士 但我们在日常生活中却很少见到他们 那是因为视障群体在
  • iOS系统语音识别

    iOS10语音识别框架Speech 项目中用到语音识别功能 这里简单的进行了一下封装 大概实现了系统语音识别的功能 还没测试 应该会有很多坑 语音识别功能封装 系统的语音识别 外部语音输入 实现语音转文字功能 项目地址 https gith
  • 基于node.js 实现百度ai人脸检测功能(api)

    基于node js 实现百度ai人脸检测功能 api 很有幸和老师同学们一起尝试学习百度ai的相关技术文档 自己做了一个很ez的人脸检测的小网页 和大家分享一下 百度ai技术文档 百度ai人脸检测技术文档 1 首先根据技术文档中的要求我们要
  • 语音识别学习记录 [再谈频率混叠(定量分析、离散采样后频谱的周期延拓)]

    前几天在语音识别学习记录 传说中的频率混叠和Nyquist定理 定性理解 中简单理解了一下频率混叠的原因 但是也发现了很多不明白的问题 1 为什么信号经过傅里叶变换后在频域是关于y轴对称的 这个问题的回答已经写在语音识别学习记录 信号经傅里
  • 大语言模型:开启自然语言处理新纪元

    导言 大语言模型 如GPT 3 Generative Pre trained Transformer 3 标志着自然语言处理领域取得的一项重大突破 本文将深入研究大语言模型的基本原理 应用领域以及对未来的影响 1 简介 大语言模型是基于深度

随机推荐

  • Ext combobox 动态模糊匹配

    var gfxmComb new Ext form ComboBox id gfxmComb store gfxmStore typeAhead true mode local editable true displayField xmMc
  • vtk python3环境安装配置

    vtk python3环境安装配置 安装miniconda 下载地址 https docs conda io en latest miniconda html https docs conda io en latest miniconda
  • 2019年金秋第五周助教小结

    总结 经观察本周作业完成情况 有一部分同学对于第二题的要求有所误解 题目的加密是要求将每个字符向后移动三个位置 而大部分人理解成了将每个字符的ASCll码值加三个单位 因为本周的作业相较容易 除了对题目的理解有问题之外 大部分同学都能写的出
  • UDP协议的简单概述

    1 UDP协议概述 UDP是User Datagram Protocol 用户数据协议 的简称 是一种无连接的协议 该协议工作在OSI模型中的第四层 传输层 处于IP协议的上一层 传输层的功能就是建立 端口到端口 的通信 UDP提供面向事务
  • C语言入门-王道考研

    1 1 C语言结构
  • 七牛云图片上传

    七牛云图片上传 进入七牛云官网 注册 登录找到对象存储 新建存储空间 进入个人中心 找到秘钥管理获取AK和SK 代码 pox xml导入依赖
  • pyecharts 画折线图去掉折线上小圆圈

    如果想删除上图标记出来的小圆圈 变为如下形式 只需在代码中加入 is symbol show False 即可 line add country date column dict country line width 3 is symbol
  • 数据库设计(真题讲解)-软件设计(三十四)

    系统开发 McCabe复杂度 下 软件设计 三十三 https blog csdn net ke1ying article details 129719533 spm 1001 2014 3001 5501 ER模型 1对1 1对多 多对多
  • matlab相关性分析频谱_利用Matlab绘制正弦信号的频谱图并做相关分析范文

    专业知识整理分享 利用 Matlab 绘制正弦信号的频谱图并做相关分析 一 作业要求 1 信号可变 信号的赋值 相位 频率可变 2 采样频率 fs 可变 3 加各种不同的窗函数并分析其影响 4 频谱校正 5 频谱细化 二 采用 matlab
  • 最少砝码问题(用一部分数的和/差表示区间上所有的整数)

    问题1 需要表示 1 N 的所有重量 最少需要多少砝码 答案 需要 1 2 4 ceiling logN 每个砝码代表二进制数的一位 N有ceiling logN 个二进制位 问题2 需要表示 1 N 的所有重量 手头已有一些砝码 问 怎样
  • 微信小程序获取用户手机号

    微信小程序获取用户手机号需要企业小程序 个人小程序是无法获取到手机号的 我们先看看官方的解释 获取手机号 获取微信用户绑定的手机号 需先调用wx login接口 因为需要用户主动触发才能发起获取手机号接口 所以该功能不由 API 来调用 需
  • mysql脏读,幻读,不可重复读以及间隙所解决幻读

    1 数据脏读 事务a修改了某条数据 然后事务b读取了事务a修改的该条数据 然后事务a由于某些原因 事务a回滚了 这样事务b读到的数据就和回滚的数据不同了 这时事务b读取的数据就是脏数据 概况一句话就是一个事务读取了另一个事务未提交的数据 2
  • 免费看小说,国产浏览器出手了,吊打各类阅读软件

    一 UC浏览器 小说多且免费 UC浏览器提供了非常方便的小说阅读体验 用户可以随意选择自己想要阅读的小说网站 并且一键切换到纯净的阅读模式 享受真正的沉浸式阅读 此外 UC浏览器还自带书城 用户可以在这里找到各种受欢迎的小说 避免书荒 书城
  • webpack-dev-server配合nginx启动时遇到热替换模块请求跨域

    当本地URL已经用Nginx代理 例如http vue native guahao inc 代理到http vue native guahao inc com不带端口号时 本地的webpack dev server会遇到请求热更新的json
  • android.accounts包

    包 android accounts 英文原文 http developer android com reference android accounts package summary html 版本 Android 4 0 r1 译者署
  • 概率论与数理统计

    概率论与数理统计 一 概率论基本概述 1 1 随机试验 1 2 样本空间与随机事件 1 3 频率与概率 1 4 古典概型 1 5 条件概率 1 6 独立性 二 随机变量及其分布 2 1 随机变量 2 2 离散型随机变量及其分布 2 3 随机
  • mbed OS会成为物联网的 Android 吗?

    转载至 http www mbed org cn archives mbed os E4 BC 9A E6 88 90 E4 B8 BA E7 89 A9 E8 81 94 E7 BD 91 E7 9A 84 android E5 90 9
  • 使用远程服务器总是因网络中断、终端不小心关闭、锁屏等导致程序中断

    分享编程工具实用方法 面对无穷无尽的配置bug 其他文章 Windows连接远程Linux服务器 VSCode配置 免密设置 跳板机配置 GeForce RTX 3090无法使用mmsegmentation官方推荐cuda版本 ubuntu
  • 计算机辅助实验圆弧连接画法,机械制图基础-18、圆弧连接的画法

    绘图时 经常要用已知半径的圆弧 但圆心要在作图中确定 这样的圆弧 称为连接圆弧 连接圆弧需要光滑连接已知直线或圆弧 光滑连接也就是要在连接点处相切 为了保证相切 必须准确地作出连接圆弧的圆心和切点 一 用已知半径为R的圆弧连接两条已知直线
  • 超七成阅读APP都借百度语音技术促用户增长

    全国十多亿人在这个春节集体 关门闭户 与手机和网络作伴 除了手游和短视频流量飞涨 在线阅读也迎来 高光时刻 特别是当手机阅读APP标配了语音朗读即 听书 功能 据百度大脑AI开放平台的后台数据显示 疫情期间 支持 听书 功能的语音合成技术的