那就只能采用数量堆积的方式文字转WAV音频