所以普通人承受两个已是很难文字转WAV音频