而且从气息上面判断文字转WAV音频