是因为他还有另外一层把握文字转WAV音频