咱们就能监测到他们在干什么文字转WAV音频