所以所获得的线索也是很少文字转WAV音频