而且必须同时进行文字转WAV音频