但是每一次的补充文字转WAV音频