但如果原本就是基础级别文字转WAV音频