无怪乎在国内人们更愿意将其称为文字转WAV音频