所以两人只是暂时先分别文字转WAV音频