原本按照行动就两人一组文字转WAV音频