报名截止时间:2026年1月16日23时30分... 点击查看
行业发展
行业动态 地方动态
考生须知
扫码关注官方微信 预约考试公开课
当前位置: 行业发展> 地方动态> 详情
2026年3月数据资产入表会计、数据交易师考试报名公告
点击领取“数据要素×”人才发展系列教材
人才缺口在2500万至3000万中国数字人才培育行动方案出炉
加快数字人才培育支撑数字经济发展行动方案

杭州语料库发布首批50个高质量数据集!

来源:中国日报网

近日,在浙江省数据局指导下,杭州市数据资源管理局联合杭州市数据集团等单位,通过“揭榜挂帅”机制,正式发布首批50个杭州语料库高质量数据集建设先行先试清单 。

这项覆盖医疗健康、工业制造、交通运输、文化旅游等14个新兴产业领域的清单,标志着数据要素从资源化到资产化的关键一步 。

在工业制造领域,有聚焦智能质检的视觉数据集;在医疗健康领域,有涵盖疾病诊断辅助的医学影像数据;在教育培训领域,景联文科技构建的  5637万道结构化英文试题  《教育大模型英语知识数据集》也成功入选 ,展示了垂直领域专业化数据集的商业潜力 。该数据集针对教育大模型训练需求,系统整合了英语学科知识体系,覆盖听力、阅读、写作等多个维度。

这些数据集不仅体量大、质量高,更关键的是具有明确的应用场景和商业价值 ,能够直接服务于产业数字化转型需求。

“专业化、场景化、合规化是高质量数据的三大特征,”一位数据产业分析师评论道,“未来数据市场的竞争,将是质量与专业度的竞争,而非单纯的数据规模比拼。”

景联文的入选,反映了市场对深耕特定领域、提供深度价值数据产品 的服务商的认可。这种专业化路径可能成为数据企业差异化竞争的重要方向。

杭州的这一实践不仅仅是一次简单的数据清单发布,更是构建完整数据要素生态系统的关键尝试。从数据采集、加工、确权到交易、应用,形成闭环。随着这批高质量数据集逐步进入流通环节,它们将像种子一样,在各行各业生根发芽,催生新的应用、新的模式、新的价值。

【版权声明】
本文/图片用于同步时事新闻,依据《著作权法》第24条合理使用条款。
来源:( 杭州语料库发布首批50个高质量数据集!  )
发布日期: 2025-12-19
引用内容未替代原作品市场价值,如有侵权请联系删除:deo@deo.org.cn

杭州语料库发布首批50个高质量数据集!