既然他们选择了文字转WAV音频