将一句汉字文本转化为对应的拼音

2023-11-12

语音合成时,数据预处理,需要将一句汉字文本转化为对应的拼音,其中,汉字文本包含标点符号,而拼音含有声调不含标点符号

具体格式举例如下:

输入:“设置文件名,怎么样?”

输出:she4 zhi4 wen2 jian4 ming2 zen3 me5 yang5

代码如下:

import re
from pypinyin import pinyin, Style

text = '“设置文件名,怎么样?”'
# 先去掉所有的标点,也就是去掉所有的非汉字
text = re.sub(u"[^\u4e00-\u9fa5]", "", text)
print(text)

# 再将每个字转化为带声调的拼音
pinyins = [p[0] for p in pinyin(text, style=Style.TONE3, strict=False, neutral_tone_with_five=True)]
pinyins = ' '.join(pinyins).strip()
print(pinyins)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将一句汉字文本转化为对应的拼音 的相关文章

随机推荐

  • win10环境android反编译apk

    我发现我想整点啥啊 从网上搜教程 一个教程永远不能成功 感谢以下所有教程 android反编译apk 首先我找到的是这个教程 https blog csdn net qq 31939617 article details 124610655
  • 逆变器方案(高频/工频)正弦波逆变器驱动板,兼容EG8010主芯片的EGS002驱动板,单极性交替驱动,解决单边发热需要全波整流采样

    逆变器方案 高频 工频 正弦波逆变器驱动板 兼容EG8010主芯片的EGS002驱动板 单极性交替驱动 解决单边发热需要全波整流采样 两个半桥能量不均匀导致的性能不稳定 可选单极性基波调制 兼容高频机峰值单线分压采样 不用更改任何电路 此驱
  • nodejs中创建web服务,监听本地IP

    nodejs官网例子 var http require http http createServer function req res res writeHead 200 Content Type text plain res end He
  • android 错误 exported needs to be explicitly specified for Apps targeting Android 12

    问题描述 android 错误 android exported needs to be explicitly specified for Apps targeting Android 12 问题原因 由于项目的编译版本compileSdk
  • java中String、StringBuffer和StringBuilder的区别

    java中String StringBuffer和StringBuilder的区别 java中用于处理字符串常用的有三个类 java lang String java lang StringBuffer java lang StrungBu
  • vs2017试用期满后的处理

    vs2017是免费社区 但是第一次试用的时候没有登录账户 提示试用期满不能进行操作 现在根据查到的方法 在微软账户注册 注册后把浏览器关闭 很必要 然后再在vs中登录就会激活了 可以放心的使用 ps 也有的说需要要卸载后在安装的 发现并不必
  • Hugging face教程-使用速查表-快速入门

    Hugging face笔记 course url https huggingface co course chapter5 8 fw pt 函数详细情况 https huggingface co docs transformers mai
  • 使用python的pyecharts库绘制多选项卡折线图示例

    使用python的pyecharts库绘制多选项卡折线图示例 pyecharts介绍 环境 安装环境 条形图 折线图 多选项卡折线图 参考 pyecharts介绍 Pyecharts是一个用于生成Echarts图表的类库 可以与Python
  • 虚拟机可以ping通外网,但xshell无法远程连接的解决办法

    刚开始学习大数据 linux需要配三个节点 但是静态IP设置之后发现xshell无法连接 关闭防火墙啥的都没用 无奈之时突然想起自己当时瞎搞过这个VMware8虚拟网卡的ip地址 我把这个的ipv4的地址自己设置了 于是猜想是不是这个问题
  • Android 组件

    TextView 文本框 用于显示文本的一个控件 文本的字体尺寸单位为 sp sp scaled pixels 放大像素 主要用于字体显示 文本常用属性 属性名 说明 id 为TextView设置一个组件id 根据id 我们可以在Java代
  • 通过pip安装pytorch超时问题解决

    前言 这篇文章只记录通过pip安装pytorch超时问题的解决方案 默认阅读者已经安装了Python2 7或者其他3 x的版本 版本信息 系统 macos 11 1 pip 21 0 1 python 3 8 解决方案 第一步 去官网查询合
  • Docker之nacos集群部署(详细教你搭建)

    目录 一 mysql安装与基本操作 一 mysql安装 1 拉取mysql镜像 2 定义挂载目录 3 配置my cnf my ini 4 开启mysql容器 5 用navicat连接工具连接远程端口 6 nacos数据库配置 创建一个nac
  • R语言(一) ggplot2常用绘图命令总结

    提到R语言 总会想到它强大的绘图包ggplot2 甚至于其他语言中也有它的痕迹 例如 python中的matplotlib模块就有ggplot样式 以下 总结了一些日常绘图中常用的命令 目录 一 基本绘图 二 精雕细琢 1 添加标题 横纵轴
  • [项目案例]短视频APP从需求到上架的全流程回顾

    错过竖屏社交短视频 你会错过一个时代 大概是前年参加过一门线下的商业公开课 LuckinCoffee现任CMO 杨飞说过的一句有关短视频的很有代表性的话 看看现在快手 微视 抖音的火爆 再加上5G 短视频的趋势是无可阻挡的了 这个项目案例是
  • Jupyter Notebook 修改默认路径

    Jupyter Notebook的默认路径在用户文件夹下 长期在这个文件夹里编写程序可能会造成文件数量的积累以及看的比较乱 所以我们这里把Jupyter Notebook 的文件路径位置给改一下 该方法是在Windows系统进行的 对于Li
  • STM32F103ZET6【标准库函数开发】------常用的寄存器和库函数

    GPIO寄存器结构和库函数 图1 图2 ADC寄存器结构和库函数 图1 图2 DMA寄存器结构和库函数 图1 图2 EXTI寄存器结构和库函数 图1 图2 NVIC寄存器结构和库函数 图1 图2
  • Anaconda Python 激活环境变量

    Anaconda Python 激活环境变量 Warning This Python interpreter is in a conda environment but the environment has not been activa
  • 09.8 python基础--PyQt5库

    09 8 1 程序 coding utf 8 import sys from PyQt5 import QtWidgets from PyQt5 QtGui import QFont QIcon QtWidgets不包含QFont必须调用Q
  • 搭建karma+mocha+chai+webpack的支持es6的单元测试

    问题背景 首先 在搭建之前要知道在什么情况下需要karma mocha chai webpack的单元测试呢 首先你写的项目是一个前端项目 是运行在浏览器中的 写好的代码包含了es6的语法 则需要搭建这样一个单元测试环境 mocha是真正的
  • 将一句汉字文本转化为对应的拼音

    语音合成时 数据预处理 需要将一句汉字文本转化为对应的拼音 其中 汉字文本包含标点符号 而拼音含有声调不含标点符号 具体格式举例如下 输入 设置文件名 怎么样 输出 she4 zhi4 wen2 jian4 ming2 zen3 me5 y