所以才会条件反射的说出文字转WAV音频