就是走一个过场的文字转WAV音频