其实就是一种类似的传送能力文字转WAV音频