他们想到的还是传承文字转WAV音频