不能单纯用好与坏来界定文字转WAV音频