我们当初为了方便解释文字转WAV音频