剩下的就是四家或者五家一起进行采访的文字转WAV音频