内蒙古自治区档案馆档案智能查询系统提升利用效率

来源:东方网    2022-08-15 14:12
来源: 东方网
2022-08-15 14:12 
分享
分享到
分享到微信

广泛应用新一代信息技术,加快全面数字转型和智能升级,是时代所需。去年年底,内蒙古自治区档案馆利用人工智能领域先进技术,推出基于语义工程的档案智能查询系统,帮助利用者快速准确找到目标档案,大幅提高模糊信息下的查档效率和精准度,得到利用者的广泛好评。

自治区档案馆馆藏档案逾600万件,涵盖历史档案、民生档案、文书档案等多个种类,档案起止年代跨度近400年。馆内原本采用的基于关键词的档案检索方式在查档时必须通过全宗号、文件题名、档号等字段进行检索,且不支持全文检索。特别是在目标档案原件为手写或电子化时未生成双层PDF文件的情况下,若档案题名中不含关键词,而查档者又没有精确掌握全宗号、文件题名、档号,那么即使查档者明知档案所含的关键词,仍然很可能一无所获。过去面对这样的情况,自治区档案馆工作人员往往只能动用“人海战术”进行逐页翻找。

为切实提升查档效率和精准度,自治区档案馆在整合档案资源的基础上,以档案查询智能化为突破口,引入人工智能领域的前沿技术——语义工程,利用该技术赋予机器的自然语言理解能力辅助档案查询,推进数字档案信息文档智能语义搜索服务。该系统在提高查档率和准确率方面拥有四大优势,即支持全文检索、支持手写检索、不依赖关键词检索、机器提炼线索,再利用线索快速找到所需文档,可通过深度分析文章语义以及文章和问题之间的联系,精准获悉用户指令,快速找到目标文件,解决了传统检索方式要求关键词与原文完全一致的痛点问题。

现在,来到自治区档案馆的查档者只需输入自己有印象的所需档案的相关词汇(只要全文中出现过即可),就能快速定位目标档案。此外,在不确定归档时间的情况下,该系统还可通过模糊线索全库匹配定位目标文件。如,输入档案所属单位名称,就能迅速找到所有涉及该单位的文件,极大地提升了查档准确率。针对历史档案和年代较久远的民生档案,该系统可利用自主研发的OCR技术,识别包含潦草笔迹在内的各类软硬笔手写体,破解手写档案开发利用难题,提升识别率和精准度。

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn