他其实是在试探文字转WAV音频