因此只能将这个计划再向后延迟文字转WAV音频