他们看上去是文字转WAV音频