大模型语音交互与识图(LLM_pic)示例默认唤醒后会有固定女声应答语——“在呢”。本文主要讲解如何将该应答语替换为自己的个性化音频。
准备一个打算让其唤醒后播放的音频,音频长度不建议太长。音频文件格式要求如下:
可访问 https://www.iflyos.cn/tts-file 进行播报音频的生成和下载
以替换大模型语音交互与识图(llm_pic)
的唤醒应答语为例,将第一步中准备好的 mp3
文件替换以下原工程文件:llm_pic/resource/tone/000_geeting.mp3
切换至 SDK 根目录(duomotai_ap
)下,执行以下脚本指令完成对工程中提示音的打包:
lisa zep exec mklfs apps\LLM_pic\resource\tone\ littlefs.bin 0x100000
此命令中的参数(
0x100000
)区域于 llm_pic 工程中 dts 文件中(LLM_pic\boards\csk6_duomotai_devkit.overlay
)的中文件系统的定义:
命令执行成功后可在 duomotai_ap
目录下看到生成的 littlefs.bin
文件:
./tools/littlefs_packer/mklfs apps/LLM_pic/resource/tone/ littlefs.bin 0x100000
此命令中的参数(
0x100000
)区域于 llm_pic 工程中 dts 文件中(LLM_pic\boards\csk6_duomotai_devkit.overlay
)的中文件系统的定义:
命令执行成功后可在 duomotai_ap
目录下看到生成的 littlefs.bin
文件:
拷贝第三步生成的littlefs.bin
文件,替换到LLM_pic
工程目录下的resource/littlefs/littlefs.bin
回到 SDK 根目录(duomotai_ap
)下,执行以下指令进行编译打包:
lisa zep build -b csk6_duomotai_devkit apps\LLM_pic -p
编译完成后,使用 Type-C 数据线连接开发套件的 DAP_USB
接口,选中以下其中一种方式对固件进行烧录:
cskburn desktop
是一款聆思推出的桌面烧录工具,在下载并安装 cskburn desktop 烧录工具后,双击图标运行软件:
1.点击串口下拉框,选择连接开发套件后识别到的串口编号;
2.将编译输出的.bin
文件拖拽进烧录区域;
3.点击开始烧录,等待烧录完成。
若您已按照 《环境搭建》 教程完成开发环境的安装,可在编译完成后执行 lisa zep exec cskburn
指令完成烧录。
lisa zep exec cskburn -s \\.\COMxx -C 6 -b 1500000 0x000000 --verify-all .\build\zephyr\zephyr.bin
请将命令行中的的 COMx 替换为开发套件在 PC 上对应的串口号(可通过设备管理器查看)。例如:
COM3
。
lisa zep exec cskburn -s PORT -C 6 0x000000 --verify-all ./build/zephyr/zephyr.bin -b 1500000
请将命令行中的 PORT 替换为开发套件连接在 PC 上对应的串口号。例如:
/dev/ttyUSB0
。
烧录完成后,程序将自动运行,你也可以通过按压开发板上的复位按键进行复位运行,可唤醒体验替换后的应答语。
此方式可能会覆盖您原本在开发套件做过的资源烧录替换类操作(如替换唤醒词资源),如果您需要同时更该唤醒词,可在烧录本固件后重新烧录新的唤醒词资源,或参照《替换唤醒词》同步替换唤醒词资源后进行打包。