也只能是放过了文字转WAV音频