蜜度受邀参加中国报业技术年会 分享大语言模型如何赋能审校

来源:东方网    2023-10-13 15:00
来源: 东方网
2023-10-13 15:00 
分享
分享到
分享到微信

近日,中国报业协会主办的“2023中国报业技术年会”在重庆举行,全国报业媒体人及行业专家齐聚一堂,总结报业十年的技术创新成效,探讨技术驱动报业融合发展的新路径。蜜度智能校对事业部总经理张晓娟受邀参会,与业内专家学者及知名企业就出版技术与产业应用进行深入探讨和交流,并作《大语言模型赋能审校高质量发展》主题分享。

2023中国报业技术年会

张晓娟在分享中指出,随着数字出版时代的到来,校对除了要继续担负起纠正文字性差错的任务之外,还要承担起对编辑环节的监督、检查、补充、完善的职能,需要对稿件内容的导向、逻辑顺序、因果关系、数量计算等方面进行检查。在这样的业务需求下,蜜度运用行业先进的自然语言处理、知识图谱与图像识别等技术,推出智能审校工具和方案,可对错别字、多字、序号等文字标点差错类进行校对,地理名词、机构名称、常识差错等知识性差错校对以及涉及违法违规等具有风险的内容进行识别,实现中文文本错误和语义关系的自动发现与纠正处理。

蜜度张晓娟作《大语言模型赋能审校高质量发展》主题分享

张晓娟强调,人工智能的深度学习技术深入校对行业,改变了校对行业的工作方式,使得校对行业能够跳脱传统模式的局限。智能校对让机器可复用专家经验,弥补人工校对存在的视觉疲劳和效率难提高不足例如,涉及详细地域的内容校对必须核实,可能就需要在官方渠道上查询;时政类内容则需查找相关文件比对校对,这都需要耗费校对人员大量的时间和精力,校对效率难以提高。在智能审校工具的帮助下,校对人员可以将精力更加集中在对内容正确性、逻辑性等方面的审读。

AI智能校对平台——蜜度校对通进行智能校对

张晓娟介绍了蜜度运用大语言模型对审校行业的探索:随着自然语言处理技术的进步,智能校对工具现在能够更准确地识别错别字,并为其提供正确的替代选项,同时也能够更好地理解文本内容的语境。而对于更为复杂的语义理解如指代不明、成分缺失、表述不当、逻辑不清等常见句式杂糅问题,小模型很难解决。如今大语言模型时代带来的智慧涌现,让语言理解能力、逻辑推理能力都达到了前所未有的高度。

以国内首个校对领域的大语言模型——“文修”为例,相较于过往小模型,它不仅具备更好的文字差错校对能力、以模型驱动的常识检测能力、易混词细微语义的辨析能力,更重要的是,它具备了尊重作者表达意图的句子润色能力。这也意味着,从内容校对提升至润色服务,人工智能在提高语言文字应用能力又迈进了一步。在具体表现上,当句子出现语序不当等句式杂糅的问题,“文修”可以通过调节语法结构或纠正客观事理等方式进行修正,从而提高句子的逻辑性。

“文修”解决句式杂糅

张晓娟指出,作为蜜度多年数据积累和行业实践的成果,“文修”以大语言模型(LLM)为技术底座,通过新闻出版、媒体稿件、政府公文等专业领域的海量语料训练,能够在一个模型里同时实现多个校对任务,解决了过去较为薄弱的易混词细微语义辨析难题,并且在领域公认的测试数据集中表现优异。为解决模型部署的“最后一公里”难题,“文修”率先落地旗下智能校对平台蜜度校对通,以提供服务器版、SAAS、AI-Box本地化局域网部署方式给予产品落地的解决方案。

  蜜度校对通部署方式

目前,“文修”落地蜜度校对通,能够广泛应用于新闻出版、政务公文等多个垂直领域:在新闻出版中,辅助审校人员进行稿件发布前的校对审核,弥补新媒体内容语言不规范、语感不足等缺陷;在图书出版环节,则可以对大样文件和PDF文件进行审校;在政务办公中,将其部署在专网的服务器上,可在安全环境下提高公文的规范性和准确性,提高公文写作质量。

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn