然后在将其分离出去文字转WAV音频