同时还要控制他们按照特定的轨迹运转文字转WAV音频