最基础的是资源分配和获取能力文字转WAV音频