所有的动作是在同时动用的文字转WAV音频