完成几十份文书样本上传,即可进行模型引擎训练;现场通过组件的拖拉演示,几分钟快速完成了一个简单的模型配置……在2023年政法智能化建设技术装备及成果展(以下简称“政法装备展”)展台上,科大讯飞工作人员焦杨演示了这一看似复杂实则操作简单的真实案例。它的背后,科大讯飞人工智能、大数据及讯飞星火认知大模型等核心能力的助力成为重要“秘诀”。
在本届政法装备展上,科大讯飞重点发布了面向政法行业的数字法治监督解决方案,它可以通过对多源异构数据的归集治理、打造数字模型、挖掘监督线索、开展线索研判闭环等全流程应用,为政法行业的数字化转型提供有效的技术支撑、能力支撑与平台支撑,促进综合社会治理,上述案例正是这一解决方案实际能力运行的一个侧面展示。
“以‘数字革命’驱动新时代政法工作高质量发展,既是推动行业监督模式转型升级的重大机遇,也是建设数字中国、数字法治的有机组成部分。”科大讯飞副总裁、司法业务部总经理雍文渊表示,“我们创新打造的数字法治监督解决方案,将着力解决行业数据解析难、监督建模难、线索闭环难等核心问题,服务于法院审判监督、检察院法律监督以及纪委基层公权力监督,提供全流程、全周期、可视化、智能化的一站式服务。”
实现数据高质量归集管理,抓好数据“源头活水”
数据,是大数据监督建设的“水”和“源”。在科大讯飞司法数字化监督管理平台上,大数据中心是其中最重要的模块之一,它可以将各类多源异构数据进行标准化配置集成,根据数据属性进行主题化归集,形成涵盖所有司法业务及相关人员信息等一系列的数据库,支撑监督业务开展。
针对非结构化数据处理等常见痛点,科大讯飞通过集成底层能力平台和文曲星平台能力,可实现对这类数据进行高效感知识别和结构化解析,将篇章文书信息转化为建模分析所需的灿若繁星的结构化要素点。
“依托讯飞星火认知大模型的底层技术,我们可以通过小样本标注,即可实现高效训练和生产文书解析引擎,标注效率可提升6-10倍,制式文本的实体抽取和关系抽取准确率平均达到90%以上。”科大讯飞司法业务部副总经理、数字法治监督业务负责人王立人介绍,通过文曲星平台进行要素抽取形成要素结果表,效率有了显著提升,为可视化数据建模工作提供了高效支撑。
在完成数据的高效处理后,在数据资源管理页面可以针对底层的元数据,按照不同的业务属性进行分组和标记。至此,无序的非结构化数据经过清洗,变成了标签化、批量化的有序数据,实现“盘点数据资源,规范数据目录,发挥数据业务价值”的数据管理目标。
可视化建模赋能线索闭环管理,打造高效监督的“数字助手”
海量的数据并不能自然生出案件线索,只有依靠监督模型的建构和使用,才能将各种数据、数据库进行真正整合、共享、比对,实现从人工个案发现向自动类案发现的智能化辅助监督转变,将监督工作从“大海捞针”升级为“精准出击”。
在科大讯飞司法数字化监督管理平台的可视化建模部分,工作人员无需编码,可直接拖拉拽组件实现模型的快速配置。以民事虚假诉讼监督模型为例,对于数据量超过数十万的基本信息表和当事人信息表,进行简单的拖拽、筛选、分组后,即可快速筛选出多条有效信息,完成模型构建工作。模型新建完成之后,可以选择发布至模型超市供其它用户申请复用。这种创新举措实现了对模型创建、发布、共享等生命周期的可视化管理,可视化便捷操作也大大降低了模型构建门槛,提升了数字监督效率。
对于模型所生成线索的有效利用,是大数据监督工作的核心。在平台的线索管理模块,支持对模型线索进行分发、查看分析研判、成案反馈一整套线索闭环管理工作,从而通过平台完成从数据模型到业务案件的成果转化。目前,数字法治监督解决方案已在全国20余个省份开展应用与探索,在数据治理、模型建立、运营服务等诸多方面进行技术创新,已配合业务人员建立了几十余种监督模型,累计归集治理法院数据、检察数据、纪委数据、政务数据4亿余条,辅助支撑4000余条线索研判。
案件质量是政法工作的生命线,数字时代更要巧用数字技术严把质量关。此次发布的最新解决方案中,科大讯飞打造的案件监督管理平台将实现从业务数据的前置审核,到案件实时可监控、不达标可预警的全方位监督,保障业务数据的准确性并提升办案质量。
数字化正深刻改变着经济形态、社会形态、治理形态,数字革命正成为新时代大数据监督新的动力源。雍文渊表示,科大讯飞将基于数字法治监督解决方案不断优化模型结构、提升算法精度、挖掘隐藏线索,拓展大数据监督的深度和广度,以数字革命引领和助推司法工作现代化。