然后再次掠出文字转WAV音频