企业充斥着大量有复用价值的数据、资料和内容性信息。每一家企业都会有很多商业文档和法律文档需要使用和维护。企业需要将有价值的文档资料进行结构化处理,以确保其有效,安全,可靠。然而,目前企业的各种文档资料仍然主要依靠人工手段进行核心内容的阅读和提取。但人力的工作时段有限,不具备实时性和连续工作性。自然语言处理技术助力企业提高文档信息的核心内容提取效率,同时减少人工成本。而海量的企业数据又能有效的训练机器学习的能力,不断的提升技术的性能和表现。
作者 | 单赢、田辰
 一 
智能企业法务的市场规模
目前,市场上提供的基于自然语言处理和深度学习技术的法律服务企业越来越多。企业法务服务的市场主要分为软件解决方案和平台两个部分自动化法律领域中各种工作的需求不断增加,这将为在最终用户中更多地部署法律智能软件解决方案提供了前所未有的机会。MarketandMarket的数据预测,世界范围内,人工智能法务类软件的市场将从2019年的3.17亿美元增长到2024年的12.36亿美元,在预测期内的复合年增长率为31.3%。市场的主要增长包括对基于人工智能的客户支持服务和自动化的需求不断增长。
 二 
企业法务系统中常用智能技术
文本相似度计算 :文档相似度主要是依赖文字内容语义相似度计算的技术实现的一种典型NLP技术。一般用于信息检索的和知识问答的模糊匹配。精准的文本相似度计算能够有效的对企业法务类文档进行整理和分类,同时能够通过模糊信息匹配的方式实现智能化的文档信息检索。
文本抽取技术:可以将文本信息中的关键信息识别出来,并通过自动化的方式将其抽取出来。该技术可用于将发票内容中的关键信息,包括合同类和知识产权类文档当中的具体权益人,相关期限,已经明细内容,自动生成计算机可理解的结构化数据。
关键信息识别技术:可以检索结构化的文本数据,并通过关键字词向量的信息将预设的信息内容或与之相关的信息内容识别出来。该技术被运用与企业法务合同等文案的检查工作,通过合规信息实现质量评估,以及欺诈检测。有效降低人力成本与人工失误导致的各种损失。
文本聚类技术:通过对大量数据对分析,自动发现样本之间的相似性,并将其划分为不同的小组,将相似的数据归档到一起,这种根据相似性归档的任务称为聚类。文本聚类的任务被广泛用于文本挖掘,信息检索和文本排重等领域。
 三 
智能技术在企业法务系统中的应用分布

 四 
企业法务系统的案例介绍
ROSS - ROSS平台是基于IBM的认知计算机沃森(Watson)建立的,可以理解自然语言、回答问题、提出假设并监督法律体系的发展。ROSS则可以“通读法律”、收集证据、做出推论,然而给出基于证据的高度相关性答案。能够处理的任务包括产权纠纷,破产申请等。随着被使用范围越来越广,ROSS的性能将继续获得提高。
法小淘 - 法小淘是一款用于法务相关问题咨询的智能对话助手。用户可以通过手机上的应用与“法小淘”进行一对一语音对话,“法小淘”会向用户提供法律上的答疑解惑,根据用户的具体问题,进行初步的智能案情分析,然后通过案例、名片等数据进行匹配,推荐合适的诉讼法院、专业律师等。
eBrevia - eBrevia使用与哥伦比亚大学合作开发的行业领先的机器学习和自然语言处理技术,能够快速的从合同中提取数据,并对其进行准确的理解和分析,并通过预订规则得到分析结果。eBrevia在尽职调查和租约抽象化的任务上具备较好的准确性和速度。
Legartis - Legartis是一家开发合同智能软件的法律技术初创公司。为企业的法务部门提供安全的人工智能文档分析解决方案,并帮助企业避免风险。Legartis经过法律专家的培训,使用机器学习和自然语言处理技术,对企业的合同以及其他法务文件进行学习和分析,有效的实现合同分析以及相关业务的自动化。
 五 
智能企业法务应用的局限性
随着自然语言处理技术的不断突破,越来越多的企业选择使用智能助手协助公司法务人员对公司的各种文档进行归档和整理。然而,目前企业当中的大多数文件依然是以传统的纸质文档为主。因此,采集结构化的数据进行训练,从而实现技术的落地仍然有一定的困难。一方面,扫描文档生产的PDF和图片文档很难被直接转化成干净的txt文档,另一方面人们普遍相信传统的制作文档更加严谨,不宜造假。
 六 
智能企业法务应用的发展趋势
未来人工智能与自然语言理解技术将逐渐成熟,将会有越来越多的企业将选择使用智能法律服务。结构化数据存储安全与数据私有化部署将是企业法务智能化的两大发展趋势。标准化的存储方式将使得人们逐渐习惯于将法务文件进行数字化拷贝。届时,数据的可读性与安全性都将变得更加规范化。私有化数据部署则在有效保障企业数据安全的前提下,更加精准的对企业进提供性化的服务。
本文为智周系列报告核心版,相应深度版的推出计划将在后续公布,敬请大家关注。针对「自然语言处理技术在企业法务文档中的应用一主题,有哪些方向或主题,你希望在报告深度版中读到详细的阐述与分析,欢迎留言,这将成为我们制作报告深度版的重要参考。
关于「智周」系列报告
机器之心「智周」人工智能技术应用报告系列重点关注现有人工智能技术应用较成熟且应用潜力较大的正在进行智慧升级的传统行业及场景,逐行业、逐场景为产业用户高效而不失深度地呈现不同人工智能技术的产业落地现状、企业案例、技术应用趋势等。「智周」人工智能技术应用报告系列包含核心版深度版两个版本:
核心版浓缩精华分析内容至2页内,覆盖重要数据、分析结论及案例简述,以供使用者高效系统地了解人工智能技术在自身所关注产业内的潜在机会。
深度版在核心版的基础上,包含详尽的行业或场景痛点分析、技术解读、落地案例详解及资料附录等,以供有深度研究需求的使用者进行深入探究。
▼ 专题推荐
继续阅读