在上半场的后半段文字转WAV音频