先从一个区域一个区域这样分层次挑选文字转WAV音频