似乎成了他们唯一可能的选择文字转WAV音频