也只会判一个误诊文字转WAV音频