在不确定上面有人的情况下就叫喊文字转WAV音频