他有自己的一套鉴别方法文字转WAV音频