应该是一种单独的道文字转WAV音频