所以他们也只能选择第二种方法文字转WAV音频