阿里巴巴云栖大会圆满收关,中国信息通信研究院(以下简称“中国信通院”)云计算与大数据研究所人工智能部副主任董晓飞应邀参会,同时发布并解读业界首个智能文档处理标准。
该标准由中国信息通信研究院联合实在智能、百度、阿里云、来也科技、达观数据、国家电网、工商银行、浦发银行、云问科技、拓尔思(300229)、海康威视(002415)、中移信息、中国电信(601728)、捷通华声、点通数据、矽赫科技等多家核心参编单位共同开展,旨在形成智能文档处理技术和产品能力评估共识,解决当前用户方在智能文档处理产品选型上难以对标的问题,促进智能文档处理技术及产业有序发展。
标准总体分为技术能力、产品能力和应用能力三个模块,聚焦产品技术性能优越度、功能完备度和应用成熟度提出技术要求和评估方法。其中,技术能力模块包含4个能力域和18个能力项,产品能力模块包含3个能力域和15个能力项,应用能力模块包含4个能力域和27个能力项。
近年来企业智能化转型热度持续攀升,随着计算机视觉、自然语言处理等领域技术能力持续提升,人机交互、机器人流程自动化等延伸技术也在不断创新。机器人流程自动化(RPA)、流程挖掘、智能文档处理等智能工具产品的应用,使得企业逐步由信息化向数字化和智能化加速转型。
智能文档处理作为企业智能应用的典型产品,融合NLP、OCR等技术,能够自动化、智能化释放企业数据资源,以数据驱动知识图谱、RPA、智能决策等技术,联合助力夯实企业转型基座。尤其是现阶段,语言文字在生产生活中的应用主要以文档的形式居多,如何借助自然语言处理、知识图谱、光学字符识别等人工智能关键技术实现文档处理的自动化、数字化、智能化,当下备受学术界和产业界关注。针对这一需求,实在智能通过全国产全自研的AI能力,依托光学字符识别(OCR)、自然语言处理(NLP)、知识图谱(KG)等核心技术,实现文档管理的智能化,打造人工智能能力在文档分析审阅场景的解决方案——实在智能文档审阅(IDP)。
实在智能文档审阅(IDP)能够基于版面分析的文档页面理解和信息提取,结合NLP的重叠实体 / 嵌套实体识别 等多项技术,实现准确的信息抽取,以便RPA进行后续的对比和应用,更利用了强大的预训练模型,实现内容密集、篇幅长、非结构化文档的分析和审阅,重新定义文档审阅模式。
如在赋能贷款审核业务场景中,实在智能文档审阅(IDP)能自动识别提取纸质信息,并同步到系统中,可实现信息自动录入、外部征信查询及信息整合,并对各类文件中的重要信息进行提取,辅助审批人员判断贷款资料的真实性、一致性、合规性等,自动完成信息审核与校验,提升审核效率,帮助客户经理能投入到更高价值的工作事务中。
实在智能文档审阅(IDP)助力了多家银行打通银行贷款审核完整链路,实现资源整合、能力沉淀,实现业务效率、风控能力、客户体验多点提升,为银行业数字化转型带来更丰富的场景解决方案。
目前,实在智能文档审阅(IDP)智慧文本已广泛应用于金融、制造、通信、烟草、政府等行业以及法律、审计、财会等各个行业的各种文档处理场景当中,帮助企业从复杂、琐碎的合同处理中解放出来,实现文档全流程管理智能化,提升更多从业者的工作价值和成就感,从而使企业聚焦核心业务,实现资产、人效最大化。(晓麦)