所以他们反而担忧文字转WAV音频