中科天玑入选全球数字经济大会首批高质量数据集,彰显数据实力,助力数字经济发展。
在人工智能技术迅猛发展的大模型时代,数据作为核心生产要素的战略地位日益凸显。作为全国科技创新中心,北京市依托其丰富的数据资源和领先的产业生态,积极响应国家关于高质量数据集建设的部署,启动了全市行业数据集建设成果征集工作。经过权威专家严格评审,最终遴选出19项具有行业标杆意义和突出应用价值的高质量数据集典型案例,并于“2025全球数字经济大会数据要素发展论坛”上正式发布。这一举措不仅标志着北京在数据要素市场化探索中迈出关键一步,也为全国数据资源体系建设提供了可复制、可推广的经验范本。

中科天玑凭借其“全场景多模态跨区域城市社会认知高质量数据集”成功入选首批典型案例,成为本次评选中备受瞩目的技术成果之一。该数据集以“数据驱动城市治理革新”为核心理念,融合文本、图像、音频、视频四类模态数据,涵盖政策舆情、公共安全、突发事件、城市运行等多个真实场景,构建起覆盖经济、民生、社会治理、文旅、应急五大领域的高知识密度数据体系。这一成果的入选,不仅是对中科天玑在数据采集、清洗、标注、融合与应用等全生命周期技术能力的权威认可,更反映出其在推动数据从“资源”向“资产”转化过程中的领先实践。

尤为值得关注的是,该数据集基于中科天玑自主研发的“社会认知大脑”技术架构,实现了跨区域、多模态数据的深度关联分析,突破了传统单一数据源的局限性,为AI模型训练提供了更加立体、真实、动态的城市认知底座。这种“全息透视”式的数据构建方式,使得城市运行状态得以被更精准地感知与预测,为智慧城市治理提供了强有力的底层支撑。在当前各地争相布局城市大脑、数字孪生系统的背景下,这一数据集的建成无疑为行业树立了新的技术标杆。
从更深层次看,此次北京发布高质量数据集典型案例,释放出一个强烈信号:数据要素的价值释放正从“量的积累”迈向“质的飞跃”。过去几年,各地在数据归集方面已取得显著进展,但数据质量不高、场景适配性差、模型可用性弱等问题仍制约着其实际应用。而此次入选的19个项目,尤其是中科天玑的成果,体现出从“有数据”向“有用数据”转变的趋势。这不仅是技术的进步,更是数据治理理念的升级——数据不再只是被动记录的产物,而是主动参与决策、驱动认知的核心引擎。
展望未来,中科天玑表示将持续拓展数据在数字营销、金融风控、应急管理、智慧文旅、医疗健康等领域的应用场景,推动行业数智化转型从“数据驱动”迈向更高阶的“认知驱动”。这一愿景契合了当前AI大模型对高质量训练数据的迫切需求,也预示着数据要素将在更多垂直领域释放深层价值。随着国家数据要素市场化改革的深入推进,像此类具备高知识密度、强场景关联性的高质量数据集,有望成为数字经济时代的关键基础设施。我们有理由期待,在北京这一创新高地的引领下,更多兼具技术深度与社会价值的数据成果将不断涌现,真正让数据“活起来、用起来、值起来”,服务于更广泛的社会治理与民生改善。