否则如果真要严格处理文字转WAV音频