就需要几人一组同时输出文字转WAV音频