切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合 ...
菲龙网编辑部7
有 744 人收听 TA
155927
主题
155944
回复
182418
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/101
《灼灼韶华》这才叫演技,车永莉的嫂子没脸没皮,良心都被狗吃了
0/95
《围猎》今晚开播,王阳张宥浩俞灏明等演绎缉毒英雄群像
0/104
辱华、恋爱脑、粗制滥造不如“中国短剧”,韩剧终于走向了末路!
0/105
《灼灼韶华》大结局:直到宋萍出庭帮褚韶华脱罪,才知程辉最好命
0/93
陈好:撕掉“完美妈妈”标签,做真实、懂取舍的独一份妈妈
0/103
《欢乐家长群2》王晓晨刘芮麟聊三搭:希望下次尝试新鲜风格
0/101
郑晓龙又一部年代剧,30位实力派助阵,我断言:这剧一播出就会火
0/100
电视剧《阵地》:凸显精神意志在抗战中的关键作用
0/105
《双轨》未上线就饱受争议,有网友抵制:她演就不看
查看TA的全部帖子>>
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
时间:2025-8-22 09:53
0
471
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
新智元报道
编辑:桃子
【新智元导读】DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。
官宣了!
刚刚,DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。
新版V3.1采用了「混合推理」,一个模型,两种模型:思考与非思考(自主切换)。
相较于DeepSeek-R1-0528 ,DeepSeek-V3.1-Think推理速度更快。
最关键的是,V3.1具备了强大的智能体能力,不论是工具使用,还是多步骤任务,全部拿捏。
在软件工程基准测试中,DeepSeek-V3.1全方位碾压V3-0324和R1-0528。
在人类的最后考试HLE中,V3.1拿下了29.8高分,另外在数学、知识问答、编程等任务中,全面超越推理模型R1。
CoT压缩训练后,V3.1-Think在输出token减少了20%-50%,与R1-0528打成平手
在Hugging Face上,一共开源了两款V3.1 Base和V3.1,前者在V3基础上又进行了8400亿token的持续预训练,扩展了上下文支持。
项目地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
总的来说,DeepSeek-V3.1此次更新的最大亮点:
参数共671B,激活参数37B,上下文128k
混合推理模式:一个模型,即可同时支持推理模式和非推理模式。
更智能的工具调用能力:工具使用、智能体任务有了显著提升,多步推理能力强化,复杂搜索不在话下
更高的推理效率:回答质量上与DeepSeek-R1-0528相媲美,思考效率飙升,反应快如闪电
全面基准测试:实力全面碾压DeepSeek-R1-0528、DeepSeek-V3-0324
在API方面,deepseek-chat是非思考模式,deepseek-reasoner是思考模式,全部支持128k。
从9月5日开始,采用新的API定价
继OpenAI gpt-oss之后,DeepSeek终于做出了最强回应。
V3.1编程击败Claude 4,训练扩增10倍
HF模型卡中,给出了DeepSeek新模型技术的详细解读。
基于DeepSeek-V3.1-Base,DeepSeek-V3.1通过后训练优化完成。而V3.1-Base又是基于V3模型训练而来。
具体来说,它通过「两阶段长上下文扩展策略」构建,遵循了原始V3论文中的方法。
研究团队又扩展了数据集,收集了更多长文档,并大幅延长了两个训练阶段的规模。
32k扩展阶段增加了10倍,达6300亿Token,而128k扩展阶段增加了3.3倍,达到2090亿Token。
此外,DeepSeek-V3.1采用UE8M0 FP8缩放数据格式进行训练,确保与微尺度数据格式的兼容性。
在通用能力的基准测试中,开启思考模式V3.1,在MMLU、GPQA上拿下了亮眼的成绩。
数学方面,V3.1同样刷新SOTA,创下了最高分。
如上文所述,V3.1是迈向智能体时代第一步。它可以支持多种Code Agent框架,开发者可以自己搭建智能体。
在编码测试中,DeepSeek-V3.1-Thinking在Aider编码测试中,拿下了76.3%高分,远超Claude 4 Opus、Gemini 2.5 Pro(0325)。
在编码智能体测试中,DeepSeek-V3.1-Non Thinking性能碾压R1、V3。
此外,DeepSeek-V3.1可以支持Search Agent,在推理模式下可以使用。
当需要访问外部信息或最新信息的复杂问题,V3.1可以通过多轮工具调用流程,利用用户提供的搜索工具来完成。
基准测试中,尤其是BrowseComp上,V3.1实力粉碎了R1。
**Artificial Analysis基准,同样验证了DeepSeek-V3.1强大实力,仅次于gpt-oss。
在推理效率方面,V3.1也与OpenAI相当。
如今来看,DeepSeek-V3.1稳坐编程开源第一王座。
参考资料:
https://x.com/karminski3/status/1958429843558945015
https://x.com/deepseek_ai/status/1958417062008918312
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部