两个声音几乎是重叠着自她口中发出文字转WAV音频