来源:中国经济新闻网
6月8日,国家数据局正式发布《关于推进行业高质量数据集建设行动的实施方案》(以下简称《实施方案》)。这份文件不仅为“人工智能+”时代的核心燃料——高质量数据——制定了系统性建设蓝图,更在政策表述中首次纳入了“词元”这一前沿概念。
这标志着,自“数据二十条”确立基础制度、数据资产“入表”解决会计确认难题后,中国数据要素市场化改革正进入以“标准化产品”和“新型交易模式”为特征的深水区。
从理念到国策:“词元”写入顶层设计
“词元”首次写入国家文件,标志着数据交易完成了从资源到资产的范式跃迁中示范性的一步——获得了官方的命名与路径认可。这份实施方案在“实施价值释放行动”部分,明确提出了“探索词元交易等新型交易模式”。
文件更进一步地阐述了其愿景,即“构建以词元为基础,可量化、可定价的数据价值体系”。这一表述具有里程碑意义,它为长期困扰业界的非标数据定价难题,提供了一个标准化的价值计量单元构想。从政策文本的措辞来看,数据交易的标的正从庞大、模糊的“数据集”向精细、可组合的“价值单元”演进,这背后折射出对现有数据流通模式瓶颈的清醒研判。
传统的数据包买卖或项目制服务模式,难以支撑起一个规模化、高效率的要素市场。而“词元”作为一种可拆分、可计量、可追溯、可编程的价值载体,其核心价值在于能将千差万别的数据产品与服务,转化为可在市场中高效流通的“标准品”。
六大行动系统落子:构筑从数据供给侧到价值释放端的完整政策闭环
《实施方案》通过六大专项行动构建了一个从数据供给到价值释放的完整生态闭环:强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放,这六方面环环相扣,形成了一套组合拳。
在供给侧,政策极具前瞻性地列出了近20个重点与创新领域,要求加快建设行业高质量数据集。这不仅仅是简单列举,更是为“词元化”交易指明了最具潜力的垂直赛道,如智能驾驶、智慧能源等,这些领域数据价值密度高、应用场景明确,是标准化数据产品的最佳试验田。
标注攻坚行动则直指产业痛点,推动标注模式向“人机协同、专家深度参与”跃升。文件提出的“建立行业专家认证机制”,旨在将人类的领域知识系统地“注入”数据,这恰恰是提升“数据词元”内在价值与可信度的关键工序。
尤为重要的是,文件在管理服务部分,明确要“研究合成数据等新情况新问题”并“完善人工智能训练阶段数据使用规则”。这直接回应了AIGC时代最紧迫的数据版权与合规性质疑,试图为训练数据的合法来源与使用划定边界,为数据价值的合法释放扫清障碍。
启动“数据飞轮”:以应用反哺供给,打造自我强化的数据驱动增长引擎
《实施方案》中提出的“数据飞轮”概念,是理解未来数据生态运行逻辑的核心。它描述了一个“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的良性循环。这意味着,政策鼓励的不再是静态的数据仓库建设,而是一个动态的、价值不断增殖的活生态系统。
这一理念的落地,意味着商业模式将发生根本性转变。数据价值的实现路径,从一次性售卖转变为持续性的价值共创与收益分享。通过“词元化”交易,每一次数据被调用、每一次模型因新数据而优化所产生的增量价值,都可以被精准计量并反馈给数据提供方,从而激励更多高质量数据的持续供给。
文件中“打造集‘数据集生产加工和流通利用、支撑模型训练应用’于一体的数据赋能工场”的表述,预示着一类新型产业服务主体的出现。它们将是“数据飞轮”的运营者,负责将原始数据加工为标准“词元”,并确保其在生态中安全、可信、高效地流通与增值。
引导企业角色升维:从数据服务商到“词元化”经营者
《实施方案》为数据服务类企业锚定了新的角色坐标。文件鼓励“链主单位以联合体形式推动产业链协同共建”,意在引导龙头企业从数据持有者向生态组织者转变。“数据赋能工场”的提法则为企业描绘了新业务形态——从提供原始数据升级为提供“数据+模型+应用”的一体化解决方案。
最关键的是,“探索词元交易”和“构建以词元为基础的价值体系”两处表述,直接指向产品形态创新方向。企业可将数据能力封装为标准化的可交易“词元”,推动商业模式从项目制走向订阅制、从定制化走向标准化。
文件传递的信号清晰:未来的竞争力不在于拥有多少数据,而在于能否将数据加工为可流通的“词元”产品。从“搬运工”到“精炼师”,从“项目承包商”到“平台运营者”,角色的升维已是箭在弦上。
迈向万亿市场前的三重门:标准化、安全信任与生态共识的终极考验
蓝图已绘就,但通往“词元经济”的万亿级市场之路,仍需跨越三道关键门槛。
首当其冲的是标准化之难。如何为不同行业、形态各异的数据建立统一的质量、确权、计量与定价标准,是“词元”能否成为通用“货币”的基础。文件提出的“全国互认”目标,道出了其艰巨性。
安全与信任是生命线。政策要求“守牢数据安全底线”,防范“数据投毒与污染”。在数据要素高速流通的“词元”模式下,如何通过隐私计算、区块链、可信执行环境等技术,实现数据“可用不可见、可控可计量”,并建立跨主体的信任机制,是技术层面必须攻克的堡垒。
最深层的挑战在于培育市场共识。文件直言要“培育为数据付费的市场共识”。这需要打破长期存在的数据本位主义和数据“白嫖”心态,推动需求方,特别是政府部门和国有企业“将数据采买纳入预算编制”,发挥示范作用。只有当数据像水电煤一样,被普遍认可为需要付费购买的生产要素时,“数据飞轮”才能真正高速运转起来。
《实施方案》如同一份精确的导航图,标注了从“数据资源”到“数据资产”的每一个关键路口。词元,这个炙手可热的概念,正在成为打开数据价值万亿级市场的关键钥匙。
【版权声明】
本文/图片用于同步时事新闻,依据《著作权法》第24条合理使用条款。
来源:(“词元交易”首次写入顶层设计:数据要素市场化的“奇点时刻”到来?-中国经济时报-中国经济新闻网 )
发布日期: 2026-6-10
引用内容未替代原作品市场价值,如有侵权请联系删除:deo@deo.org.cn
