并且获取他们的身份信息了文字转WAV音频