其实很多时候人类都是处于下风的文字转WAV音频