只能通过后天训练来增加文字转WAV音频