虽然他们确实是要离开了文字转WAV音频