又怎么可能会那么放弃文字转WAV音频