他们都是可以理解的文字转WAV音频