但最基本的辨别是非的能力还是有的文字转WAV音频