两个人几乎是同时回答的文字转WAV音频