但显然他不会当着这么多人的面取出来文字转WAV音频