搜索
APP下载
扫码下载APP
关注我们
XHS
小红书
抖音
Facebook
X
YouTube
登录
注册
首页
热点资讯
互动论坛
同城服务
人才网
实用工具
搜索
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
本地新闻
全网热搜
华人世界
时事评论
中外新闻
斯里兰卡资讯
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
支票转换
便民电话
话费充值
实时汇率
每日签到
我的任务
道具商店
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API ...
菲龙网编辑部7
有 745 人收听 TA
157909
主题
157926
回复
184592
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/753
东西问|香槟加子弹!特朗普最新表态,折射多重挑战,包含多重意图
0/704
东西问|短评:赢,麻了?
0/941
人这一辈子,一定要去一趟都江堰!
0/860
八旬侨眷追忆父辈归乡路:人可漂泊,心不能离根
0/785
特朗普又自嗨“胜利”,没人买账
0/667
(投资中国)国际数据公司:对中国市场前景充满信心
0/936
千年石窟的“国际会客厅”:云冈何以成为世界读懂中华文明的窗口?
0/752
伊朗公布打击清单,瞄向美国科技霸权“七寸”
0/876
张雪机车一战封神背后 中国机车正重塑全球产业格局
查看TA的全部帖子>>
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
时间:2025-9-30 14:02
0
982
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
智通财经APP获悉,9月29日,深度求索正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。模型引入稀疏注意力架构,针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价,有效降低开发者调用DeepSeek API的成本。
据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了一种稀疏注意力机制——DeepSeek Sparse Attention(DSA),针对长文本的训练和推理效率进行了探索性的优化和验证。
DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏注意力结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
为了严谨地评估引入稀疏注意力带来的影响,DeepSeek团队特意把 DeepSeek-V3.2-Exp 的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。
得益于新模型服务成本的大幅降低,官方API价格出现了大幅下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
华人世界
扫码添加微信客服
快速回复
返回列表
返回顶部