他们基本可以判定文字转WAV音频