然后从中间开始寻找每一层的变化文字转WAV音频