但在自身体形缩小的情况下文字转WAV音频