一般情况下是不会遇到人类的文字转WAV音频