然后还要当众的低头认错文字转WAV音频