推广 热搜：迅达热水器长虹空调老板燃气灶美的燃气灶日立空调威能热水器怡和智能马桶万和燃气灶三菱空调尔中央空调

国家数据局：截至6月底日均Token消耗量突破30万亿，1年半时间增长300多倍具体怎么回事

更新时间: 2025-08-14 13:08 发布时间: 2小时前 2550

核心提示：8月14日上午10时，国务院新闻办公室举行关于“十四五”时期数字中国建设发展成就的新闻发布会。国家发展改革委党组成员、国家数据局局长刘烈宏介绍，2024年初，我国日均Token（词元）的消耗量为1千亿，截至今年6月底，日均Token消耗量已经突破30万亿，1年半时间增长了300多倍，这反映了我

8月14日上午10时，国务院新闻办公室举行关于“十四五”时期数字中国建设发展成就的新闻发布会。国家发展改革委党组成员、国家数据局局长刘烈宏介绍，2024年初，我国日均Token（词元）的消耗量为1千亿，截至今年6月底，日均Token消耗量已经突破30万亿，1年半时间增长了300多倍，这反映了我国人工智能应用规模的快速增长。

他介绍，截至今年6月底，我国已经建设高质量数据集超过3.5万个，总体量超过了400PB（1PB可存储约5亿张2MB大小的高清照片，400PB的总量相当于中国国家图书馆数字资源总量的140倍左右）。人工智能模型的训练也推动了数据交易需求的攀升，截至今年6月底，各地高质量数据集累计交易额近40亿元，数据交易机构挂牌的高质量数据集总规模达到了246PB。以北京数交所为例，高质量数据集占交易总量的比例从去年的10%跃升到目前的近80%。

他介绍，上海、天津、安徽等地正在试点“数据语料作价入股”等新模式，引导企业将高质量数据集折算为股权投入到相关企业。高质量数据集的发展需要数据标注产业的支撑，我们已布局了成都、沈阳、合肥等7个数据标注基地，助力高质量数据集的建设。

中文数据在国内大模型的训练性能提升方面发挥着重要作用。大家都非常关心中文数据在训练数据中的占比情况，经过一段时间的努力，国内多数模型训练使用的中文数据占比已经超过了60%，有的模型已达到80%。中文高质量数据的开发和供给能力持续增强，推动我国人工智能模型性能的快速提升。

下一步，国家数据局将通过体系化布局持续推进高质量数据集建设，加快打造具身智能、低空经济、生物制造等重点领域数据高地。我们也将推动全社会强化数据要素价值认同，加快推进数据要素价值共创，培育“为优质数据买单”的市场共识。

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯频道

推荐图文

推荐资讯频道

点击排行

• 戴司智能指纹锁全国24小时售后热线电话：如何操	• 人民日报评论：从“紧日子”里过出好日子头条热
• 创维燃气灶24小时人工电话实时反馈全+境+到+达	• 中控智能指纹锁全国24小时售后热线电话：如何操
• 千百饰保险柜全国24小时售后热线电话：如何操作	• 迈巍保险柜全国24小时售后热线电话：如何操作更
• 绿米指纹锁常规故障维修及处理全国2025排名一览	• 星月神智能指纹锁全国24小时售后热线电话：如何
• 希箭智能指纹锁全国24小时售后热线电话：如何操	• 浙安保险柜全国24小时售后热线电话：如何操作更