所以他才通过文字转WAV音频