他们必须进行第二次文字转WAV音频