在这个时候都只会做出同一种决定文字转WAV音频