切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
腾讯开源推理模型!13B参数比肩OpenAI o1,1张GPU就能跑 ...
菲龙网编辑部7
有 744 人收听 TA
153628
主题
153645
回复
180013
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/55
长安没有荔枝
0/53
封神!Netflix王炸新剧、一口气狂更7集!
0/47
这不是电视剧,这是宣传片
0/50
电视剧《锦绣芳华》明日开播,杨紫李现主演,湖南卫视又捡到宝了
0/56
全程无尿点|这部悬疑冒险剧杀疯了
0/52
救命!这部暗黑喜剧把我吓到笑出猪叫!!
0/53
封神!这部剧太敢拍了!
0/56
全程高能的医疗韩剧,不看不要紧!
0/56
这一次,连央视也救不了,差评如潮、千篇一律被“高估”的张译
查看TA的全部帖子>>
腾讯开源推理模型!13B参数比肩OpenAI o1,1张GPU就能跑
时间:2025-6-30 09:32
0
70
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
智东西
作者 王涵
编辑 漠影
智东西6月27日报道,今日,
腾讯混元宣布开源首个混合推理MoE模型Hunyuan-A13B
,总参数80B,激活参数仅13B,是
混
元首个开源推理模型
,腾讯将其称为“
业界首个13B级别的MoE开源混合推理模型
”。
▲腾讯混元Github页面(图源:Github)
Hunyuan-A13B模型是
腾讯内部应用和调用量最大的大语言模型之一
,有超过400+业务用于精调或者直接调用,
日均请求超1.3亿
。与其之前开源的混元large相比,Hunyuan-A13B参数更小,但是性能和效果都有一定提升。
在官方发布的基准测试上,Hunyuan-A13B模型
在数学、推理、Agent调用等能力上超越
Qwen3-A22B、DeepSeek-R1-0120以及OpenAI-o1-1217
,甚至在长文本上能和Gemini 2.5 pro“掰手腕”。
在用户端进入Hunyuan-A13B模型主页后,可以选择开启“快思考”模式,“快思考”模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务,如不点击按钮,则默认为“慢思考”模式,可以输出更深、更全面的推理步骤,如反思和回溯等。
此外,在开发者方面,Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,开发者
只需要1张中低端GPU卡即可部署
。目前,Hunyuan-A13B已经
融入开源主流推理框架生态
,无损支持多种量化格式,在相同输入输出规模上,
整体吞吐是前沿开源模型的2倍以上
。
即日起,模型已经在Github和Hugging Face等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。
体验入口:https://hunyuan.tencent.com/
API地址:https://cloud.tencent.com/product/tclm
Github :https://github.com/Tencent-Hunyuan
HuggingFace:https://huggingface.co/tencent
一、激活参数13B,性能直追OpenAI o1
测试结果显示,Hunyuan-A13B在
数学能力、推理能力以及Agent调用能力上表现较佳
,在多个基准测试榜单中超越Qwen3-A22B、DeepSeek-R1-0120以及OpenAI-o1-1217。
▲Hunyuan-Large基准测试数据(图源:腾讯混元)
在长文方面,Hunyuan-A13B支持256K原生上下文窗口,
在PenguinScrolls和LongBench-v2长文数据集中超越DeepSeek R1和Qwen3-A22B,仅次于第一名Gemini 2.5 pro。
二、20T tokens预训练+MoE架构优化:腾讯混元A13B大模型核心技术突破
预训练环节,
Hunyuan-A13B训练了20T tokens的语料
,覆盖了多个领域。此外,在模型架构上,腾讯混元团队构建了
适用于MoE架构的Scaling Law联合公式
,可以进一步提升模型预训练的效果。
在后训练环节,Hunyuan-A13B采用了多阶段的训练方式,同时兼顾了模型创作、理解、Agent等通用能力。
▲Hunyuan-A13B后训练四个步骤(图源:腾讯混元)
对于时下热门的大模型Agent能力,腾讯混元建设了一套多Agent数据合成框架,
接入了MCP、沙箱、大语言模型模拟等多种环境
,通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升了Hunyuan-A13B的效果。
此外,腾讯混元还
开源了两个新的数据集
。其中,
ArtifactsBench
构建了一个包含1825个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力。
C3-Bench
则针对Agent场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了1024条测试数据,以发现模型能力的不足。
结语:腾讯混元构建开源AI生态
腾讯混元旗下图像、视频、3D、文本等多种模态基础模型已全面开源。未来,混元还计划推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,以适配企业与端侧不同需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。
值得注意的是,此次腾讯混元在开源Hunyuan-A13B模型的同时,还配套开源了ArtifactsBench和C3-Bench两大专业评测数据集,这一举措展现了科技大厂参与行业标准制定的积极姿态,体现了腾讯混元推动大模型技术生态共建的责任。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
娱乐新闻
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部