我指的是它的硬件设备以及师资力量文字转WAV音频