就是他的核心任务文字转WAV音频