这是个不太准确但比较简单的区分标准文字转WAV音频