似乎是在辨别着什么文字转WAV音频