他们已经控制了入口文字转WAV音频