但是从这几个人之间的谈话和语气上猜测文字转WAV音频