带着质问和审视去问对方文字转WAV音频