切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
蚂蚁百灵发布轻量级推理模型 Ring-mini-2.0,将逐步全面 ...
菲龙网编辑部7
有 744 人收听 TA
156147
主题
156164
回复
182648
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/67
谁说内娱现偶妆造土?《许我耀眼》的“场合美学”太权威
0/71
20分钟飙升至第一,热度高达19000!观众好评如潮,这部剧,爆了
0/74
赵露思凭《许我耀眼》打了翻身仗,不仅演技获好评,还带火了穿搭
0/62
《欢乐家长群2》:在笑声中思考 于共鸣中奋进
0/63
《大兵小将筑国防》第四集今晚热血续燃!
0/77
把所有人骗了!《沉默的荣耀》最聪明的人:不是谷正文,不是吴石
0/67
强烈推荐,五部正在热播的高分海外新剧
0/71
十月古装剧大战打响!五大顶流男神携新作来袭,你想追哪部?
0/66
热播剧陷口碑危机:鞋穿帮、抄袭风波、剧情注水,观众还买账吗?
查看TA的全部帖子>>
蚂蚁百灵发布轻量级推理模型 Ring-mini-2.0,将逐步全面开源
时间:2025-9-17 11:00
0
295
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
近日,据百灵大模型公众号,蚂蚁百灵团队发布并开源了Ring-mini-2.0推理模型。它是基于此前蚂蚁百灵发布的基础语言模型 Ling 2.0 架构,深度优化的高性能推理型 MoE 模型。它在总参数量16B、仅激活1.4B参数的情况下,即可达到10B级别以下dense 模型的综合推理能力,尤其在逻辑推理、代码与数学任务中表现卓越,并支持 128K 长上下文及 300+ token/s 的高速生成。
经过 Long-COT SFT、更稳定持续的RLVR以及RLHF联合优化,Ring-mini-2.0复杂推理的稳定性与泛化性得到显著提升。在多项高难度基准(LiveCodeBench、AIME 2025、GPQA、ARC-AGI-v1 等)中,在输出长度相当的情况下,Ring-mini-2.0性能显著超越10B以下dense 模型,甚至媲美更大参数量的MoE模型(如 gpt-oss-20B-medium),在逻辑推理方面尤为突出。
(Ring-mini-2.0性能表现)
据了解,Ring-mini-2.0继承了Ling 2.0 系列的高效 MoE 设计,仅激活 1.4B 参数,通过 1/32 专家激活比、MTP 层等架构优化,达到约 7–8B dense 模型的等效性能。得益于小激活、高稀疏度的设计,Ring-mini-2.0 在H20 部署下实现 300+ token/s 的吞吐,结合 Expert Dual Streaming 推理优化后可进一步提升至 500+ token/s,大幅降低高并发场景下 Thinking 模型的推理成本。同时,借助 YaRN 外推可支持 128K 长上下文,长输出场景下相对加速比最高可达 7 倍以上。
蚂蚁百灵团队表示将完整开放 Ring-mini-2.0 的模型权重、训练数据和 RLVR+RLHF 训练策略。凭借“小而优”的特点,Ring-mini-2.0 有望成为小尺寸推理模型的首选,为学术和工业界提供理想的研究与应用起点。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
菲律宾千岛诗社
汇率l历史
菲鹰网
国际新闻
天天菲律宾浪浪浪浪
郭彩荣
菲游不可
吃货天地
商家圈
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部