“Text To Sound”的版本间的差异
来自丢石头百科
Yousimaier17(讨论 | 贡献) (→产品说明) |
Yousimaier17(讨论 | 贡献) (→产品说明) |
||
第23行: | 第23行: | ||
**支持任意中文文本的合成。 | **支持任意中文文本的合成。 | ||
**支持英文字母的合成,遇到英文单词时按字母方式发音。 | **支持英文字母的合成,遇到英文单词时按字母方式发音。 | ||
− | * 支持编码类型:支持GB2312、GBK、Unicode和UTF- | + | * 支持编码类型:支持GB2312、GBK、Unicode和UTF-8四种编码方式。详见[http://public.voicetx.com/zh/home/encoding 编码说明] |
* 合成文本量: | * 合成文本量: | ||
**UTF-8编码:支持最多2000字节的文本合成。 | **UTF-8编码:支持最多2000字节的文本合成。 | ||
第29行: | 第29行: | ||
* 文本智能处理:对常见的数值、电话号码、时间日期、度量衡符号等格式的文本,芯片能够根据内置的文本匹配规则进行正确的识别和处理。 | * 文本智能处理:对常见的数值、电话号码、时间日期、度量衡符号等格式的文本,芯片能够根据内置的文本匹配规则进行正确的识别和处理。 | ||
**例如:“2012-05-01 10:36:28”读作 “二零一二年五月一日十点三十六分二十八秒”,“火车的速度是622km/h” 读作 “火车的速度是六百二十二公里每小时”,“-12℃”读作“零下十二摄氏度”。 | **例如:“2012-05-01 10:36:28”读作 “二零一二年五月一日十点三十六分二十八秒”,“火车的速度是622km/h” 读作 “火车的速度是六百二十二公里每小时”,“-12℃”读作“零下十二摄氏度”。 | ||
− | + | * 多音字和姓氏处理:对存在多音字的文本,例如:“银行行长穿过人行道向骑着自行车的银行职员行走过去”,芯片可以自动对文本进行分析,判别文本中多音字的读法并合成正确的读音。 | |
− | + | **例如:“他是一位姓朴的朴素的韩国艺人。”,句中两个“朴”字前面一个读作“piao2”,后面一个读作“pu3”。 | |
+ | * 音量、语速、语调调整:支持10级音量控制、30级语速、10级语调调节; | ||
+ | * 提示音: | ||
多种文本控制标记,提升文本处理的正确率; | 多种文本控制标记,提升文本处理的正确率; | ||
多种播放控制,包括:合成、停止、暂停合成、继续合成 | 多种播放控制,包括:合成、停止、暂停合成、继续合成 |
2024年3月26日 (二) 16:13的版本
| ||||||||||||||||||||||
| ||||||||||||||||||||||
|
产品概述
- Text To Sound是一款基于SYN8086芯片制作的中文语音合成模块。本模块可通过UART接口,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。转换后的音色清亮圆润。支持GB2312、GBK、UTF-8 和Unicode 四种编码方式,能识别数值、电话号码、时间日期、度量衡符号及自动识别多音字的读法并合成正确的读音。支持10级音量、30级语速、10级语调调节;多种文本控制标记,提升文本处理的正确率;多种播放控制,包括:合成、停止、暂停合成、继续合成。支持UART通讯方式;多种通讯波特率供选择;各项指标均满足室外严酷环境下的应用。可用于车载终端、考勤终端、公交报站、语音对讲等领域。
产品说明
- 工作电压:5V
- 通信接口:UART
- 支持波特率:9600bps、57600bps、115200bps,可通过拨码开关选择。
- 低功耗模式:支持 Deep Sleep模式。使用控制命令可以使芯片进入 Deep Sleep模式。
- 支持语音类型:
- 支持任意中文文本的合成。
- 支持英文字母的合成,遇到英文单词时按字母方式发音。
- 支持编码类型:支持GB2312、GBK、Unicode和UTF-8四种编码方式。详见编码说明
- 合成文本量:
- UTF-8编码:支持最多2000字节的文本合成。
- GB2312、GBK、UNICODE小头、UNICODE大头编码:支持最多4000字节的文本合成。
- 文本智能处理:对常见的数值、电话号码、时间日期、度量衡符号等格式的文本,芯片能够根据内置的文本匹配规则进行正确的识别和处理。
- 例如:“2012-05-01 10:36:28”读作 “二零一二年五月一日十点三十六分二十八秒”,“火车的速度是622km/h” 读作 “火车的速度是六百二十二公里每小时”,“-12℃”读作“零下十二摄氏度”。
- 多音字和姓氏处理:对存在多音字的文本,例如:“银行行长穿过人行道向骑着自行车的银行职员行走过去”,芯片可以自动对文本进行分析,判别文本中多音字的读法并合成正确的读音。
- 例如:“他是一位姓朴的朴素的韩国艺人。”,句中两个“朴”字前面一个读作“piao2”,后面一个读作“pu3”。
- 音量、语速、语调调整:支持10级音量控制、30级语速、10级语调调节;
- 提示音:
多种文本控制标记,提升文本处理的正确率; 多种播放控制,包括:合成、停止、暂停合成、继续合成