三个阶段同时进行文字转WAV音频