他们要做的就是在原地等待文字转WAV音频