他们用一种类似兽爬的方式文字转WAV音频