而外界还要维持大量资源的输入文字转WAV音频