CSK6 大模型开发套件可将文字内容合成为语音音频并进行播放,支持使用文本标注功能对合成语音的效果进行控制。可通过日志串口发送待合成的文本内容实现语音的合成,并使用指令对播放进行控制。
应用图标:
联网要求: 不需要
示例功能:
开发套件默认出厂 TF 卡中已包含本应用,可直接进行功能体验。
若您需要下载单独的应用示例固件,请参照本示例的《固件下载与烧录》进行操作。
离线语音合成适用于公交报站、停车场、叫号机、考勤机等场景的语音播报需求;
程序运行后,可听到开发套件播放 “你好”
的合成音频,此时代表程序已正常运行。
本功能支持两位发言人的切换,依次点击切换发音人
,发音人1
,屏幕显示发音人切换成功。
发音人0为女声,发音人1为男声。
使用 TypeC 数据线连接电脑(WIN10及以上系统) USB 与开发板上的 DAP_USB
接口:
打开在线串口终端工具,选择对应的串口设备进行连接,波特率默认115200,完成配置后点击连接按钮。
完成连接后在下方文本框输入对应的XTTS指令,即可完成对应合成操作。
1.鉴于部分串口工具实现的 Shell 不支持非ASCII字符输入,文本框提供了一项功能:自动将中文转换为编码后的字符串表示并发送。
2.使用方法:在文本框输入xtts play 你好
点击发送即可实现自动转换。
命令 | 说明 |
---|---|
xtts play <text> |
播放合成文本 |
xtts pause |
暂停合成 |
xtts resume |
若合成被暂停,则继续合成 |
xtts utf8 |
(默认)设置xtts的编码格式为utf8 |
xtts gbk |
设置xtts的编码格式为gbk |
为了提供更好的TTS合成效果和用户可自行控制合成方式,我们提供了一套标记设置,通过这些标记可自由实现理想的合成音频,使用方式请参考《简单文本标注用户手册》
项目 | 链接 |
---|---|
获取固件 | 可参照《固件下载与烧录》单独下载本应用的固件。 |
获取源码 | 可参照《语音合成开发指南》了解如何拉取代码并完成代码的编译与烧录。 |
简单文本标注 | 我们提供了一套标记设置,可参照《简单文本标注用户手册》进行使用和修改。 |