按照前两次的经验来判断文字转WAV音频