但是更多的时候都是在新罗这边文字转WAV音频