显然也是有所预留的文字转WAV音频