是因为需要配合周围的风声以及细细的脚步声文字转WAV音频