同时他也必须尽量扬起声音进行回答文字转WAV音频