只是并没有明说这个能力到底指什么文字转WAV音频