选拔的方式依旧和第二轮一样文字转WAV音频