有大量的时间作为缓冲文字转WAV音频