所以拍摄时文字转WAV音频