在拍摄结束之前文字转WAV音频