在每个人物的出场小事件中文字转WAV音频