我国7个数据标注基地已形成高质量数据集335个

我国7个数据标注基地已形成高质量数据集335个

来源:中国青年报客户端    2025-03-20 18:06
2025-03-20 18:06 
分享
分享到
分享到微信

中国青年报客户端北京3月20日电(中青报·中青网记者 贾骥业)我国7个数据标注基地已形成医疗、工业、教育等行业的高质量数据集335个;赋能121个国产人工智能大模型研发;引进和培育标注企业223家;标注从业人员达5.8万人;带动数据标注行业相关产值超过83亿元;数据标注总规模达17282TB,相当于中国国家图书馆数字资源总量的6倍左右。

所谓数据标注,就是对数据进行添加标记、说明、解释、分类和编码的过程,是提升人工智能算法、模型核心能力的关键环节。我国有7个数据标注基地,分别位于四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同。

据悉,国家数据局未来将进一步畅通数据采集、标注、人工智能应用产业链,重点推动工业、金融、医疗、交通、教育等几大领域的高质量数据集建设,促进数据标注产业高质量发展。

【责任编辑:张瑨瑄】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn