所以他们根本就没想过要防御文字转WAV音频