考试很多时候考的是状态文字转WAV音频