根据影象纪录分析文字转WAV音频