虽然他不能一一辨识文字转WAV音频