推广 热搜：全国客服热线迅达热水器长虹空调老板燃气灶美的燃气灶日立空调怡和智能马桶威能热水器万和燃气灶三菱空调

DeepSeek发布新一代AI模型：推理更强，使用成本降一半到底是什么回事

更新时间: 2026-06-18 23:06 发布时间: 9个月前 1790

核心提示：　　中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型（LLM），号称在训练与推理能力上有显著提升，并能以更低的成本运行。　　总部位于杭州的DeepSeek表示，该模型采用稀疏注意力（sparse attention）技术，使得API（应用程序接口）调用价格可降低一半。API是企业和开发者接入AI模

　　中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型（LLM），号称在训练与推理能力上有显著提升，并能以更低的成本运行。

　　总部位于杭州的DeepSeek表示，该模型采用稀疏注意力（sparse attention）技术，使得API（应用程序接口）调用价格可降低一半。API是企业和开发者接入AI模型的主要方式，按使用次数或调用量付费。

　　DeepSeek在开发者社区 Hugging Face 上发布文章称，这款新模型是其“下一代AI产品线的重要进展”。

　　随着国内外竞争日益激烈，中国科技企业正不断升级自研大模型。就在上周，巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

　　事实上，与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出，对于超大规模输入，完整的注意力矩阵计算成本过高，而“稀疏模式”可通过只关注部分关键输入，大幅提高效率。

　　DeepSeek在随新模型发布的论文中介绍称，该模型采用了 “闪电索引器（lightning indexer）” 与 “精细化的token选择机制”，确保注意力计算仅应用于最相关的token。

　　值得注意的是，华为云已在周一晚间发文确认，已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

　　目前，DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列，在人工智能分析平台的全球LLM排名中位列中国前两名，仅次于OpenAI、xAI与Anthropic等国际厂商。

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯频道

推荐图文

推荐资讯频道

点击排行

免责声明: 本站部分内容来自于互联网整理收集,因本信息而引起的争议和权益问题可联系(侵删联系hh313la#QQ.com)将在第一时间核实删除,谢谢

• 4月10日投资早报\|中信证券一季度净利润102.16亿	• 地方新闻精选 \| 南京力争“十五五”末常住人口
• 被“315晚会”点名销售假烟后，美宜佳与606家加	• 近代化的目的是为妇女争取权利，但过程中又反复
• 伊朗新一届领导层在美和平谈判前态度谨慎头条热	• 华尔街银行内部测试Anthropic公司的Mythos模型
• 【中国性格】全球跃进，得有“中国性格” \|鲍勇	• 原油：WTI录得2020年以来最大单周跌幅伊朗与美
• 哈塞特：Anthropic的AI模型在白宫引发“紧迫感	• “雪山救狐”爆火，全民创作时代真的来了吗？刷