也就是说根据原剧情的话文字转WAV音频