一般不会说出文字转WAV音频