所以他必须去文字转WAV音频