然后将他们四人分开文字转WAV音频