那他为什么不从一开始就说文字转WAV音频