但是许娜给出的理由是文字转WAV音频