切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
周鸿祎的 “慢思考”快了OpenAI一步
菲龙网编辑部7
有 744 人收听 TA
146961
主题
146978
回复
173066
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/47
李云泽:保险业要加快由追求速度和规模向以价值和效益为中心转变
0/45
从4.5%降至3.5%!振兴银行存量存款利率下调,**能否单方面暂停“加息”
0/48
央行科技司:正在加紧出台金融业数据跨境流动合规指南
0/48
厦门国际银行北京分行助力北京市银行业协会举办声誉风险管理培训
0/37
理财公司掀起降费大战,部分产品费率低至0
0/37
回应被罚50万元,国开行:将严格按照监管要求落实整改措施
0/45
东莞万江举行2024年“百千万工程”政策宣讲会,搭建政企交流桥梁
0/38
21理财私房课丨市场涨、投资亏,这一导致逆势亏损的“理财刺客”需警惕
0/39
大家财险因财务数据不实再领罚单,今年前三季度亏损1.7亿
查看TA的全部帖子>>
周鸿祎的 “慢思考”快了OpenAI一步
时间:2024-9-21 09:38
0
312
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
撰文 | 懂懂
编辑 | 秦言
来源:懂懂笔记
「 AI领域卷大模型,从卷算法到卷参数再到卷价格,如今要卷思维。」
AI又一次迎来质变的进化:9月13日,OpenAI o1-preview落地,一时间引发人们对“Inference law(推理定律)”取代“Scaling Law(规模定律)”的热议。当大家深入探讨OpenAI o1的“思维链”时,才发现,这不是与两个月前周鸿祎说的“慢思考”是一个底层逻辑吗?
AI的发展,不仅要卷技术的领先,更要卷思维的前瞻。洞察趋势,预见到未来的方向,才能真正领跑未来。
“思维链”不谋而合“慢思考”
具有强大推理能力、适用于复杂任务的OpenAI o1,再次给业界带来震动。用OpenAI官方的说法:“这个模型在复杂推理任务上是一个重大的进步,代表了人工智能能力的一个新水平;因此,我们决定重新开始编号,把这一系列模型命名为OpenAI o1。”
言外之意就是,这是AI思维模式、发展路径的一次重大改变,预示着未来AI发展的全新路径。
过去的GPT系列模型虽精确且量大,但缺乏“思考”环节,因此难以真正理解复杂学科如物理学和数学。
这一次的具体变化归结为“思维链” (Chain-of-Thought, CoT)一词。o1 系列模型采用全新的训练方法,不再局限于模仿训练数据中的模式,而是通过强化学习和“思维链”技术,引导模型自主解决问题,主打推理能力。工作原理本质上是-思维链的自动化,把一个复杂问题拆解成若干简单步骤,从而有利于大模型解决复杂的逻辑问题。
OpenAI 创始人山姆·奥特曼(Sam Altman) 将 o1 称为“迄今为止最强大、最一致的一系列模型”,并将其视为迈向自主系统或代理的关键一步。
总结起来,“思维链”有几个特性:像人一样思考,自主推理,自动分解步骤,通过一系列模型协同完成。
有没有觉得“似曾相识”?没错,早在7月底的ISC.AI 2024大会上,360集团创始人周鸿祎就提出:“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力。”
他认为,快思考的特点是快速直觉、无意识,反应很快但能力不够强。GPT类大模型通过训练大量知识,主要学习的是快思考能力,GPT这类大模型可以做到脱口而出,但是质量不够稳定,甚至会“一本正经地胡说八道”,所答非所问。而慢思考则是缓慢、有意识、有逻辑性,需要分很多步骤,类似写一篇复杂的文章,要先列提纲,根据提纲去搜集数据,收集素材,根据素材进行讨论,再把文章写出来,还要进行润色和修改。也就是说,慢思考更像真正的人类一样去思考,先了解问题的意图,再对分步完成一项复杂的任务。
周鸿祎评价:“这一次OpenAI o1拥有了人类慢思考的特质,在回答问题前会反复地思考,拆解、理解、推理,可能会自己问自己1000遍,然后才能给出最终的答案。”
显然,“思维链”与“慢思考”是一套逻辑体系,不谋而合,只是周鸿祎无论从观点到实践,都早了近两个月。
这也将是产业的一个转折点。GPT当年很轰动,并引发了千模大战。但是卷大模型的道路上,普遍缺乏“思考”环节,有时不能正确理解问题,有时不能解答复杂的科学问题。
随着“思维链”与“慢思考”的提出,为AI的发展引入了新的底层思维逻辑,不仅在生成内容时进行计算,还模拟了“先想后说”的过程,更接近人类思维模式,标志着向通用人工智能(AGI)迈进的重要一步。
正如周鸿祎所说:“所以,以后比的不是多快能给你答案,而是给的答案完不完整,人工智能到最后还是要参考人类大脑的组成来构造工作模式。”
多模型协同:搭台子、建班子、练队伍
与过去一味地卷大模型不同,周鸿祎更关注的是如何让AI真正解决问题,真正给用户带来价值。两个月前,周鸿祎在提出“慢思考”的全新逻辑时,也拿了出全新的解题思路----多模型协同。
如何通过多模型协同来实现人类的思维模式呢?
首先是搭台子——CoE。
以前MoE(Mixture-of-Experts,混合专家)架构的稀疏混合专家模型都被认为是Transformer之后大模型下一个发展趋势。MoE模型可以只选择某一专家模型来处理数据,这使得模型在推理过程中更为高效,因为大部分专家处于未激活状态,从而减少了不必要的计算,即所谓的快思考。而在7月底的ISC大会上,360推出了CoE(Collaboration-of-Experts,专家协同)技术架构,可以让多个模型分工协作、并行作战,执行多步推理,不同模型之间可以相互补充、相互校验,确保面对复杂问题可以有更稳定的输出,解决“AI幻觉”的弊端。可以预见,未来CoE会替代MoE成为新趋势,开启多模型协同时代。
其次是建班子——大模型联盟。
由360牵头,百度、腾讯、阿里巴巴、智谱AI、Minimax、月之暗面等16家国内主流大模型厂商形成一个联盟,将这些企业的54款大模型产品接入CoE,协同发挥作用。其实,今年以来,大模型企业之间的合作、联手越来越多,只是360这次的联盟声势比较大,并且将一些互联网头部企业都囊括进来,在市场上影响比较大。
据悉,CoE技术架构不仅接入了“大模型”,还接入了很多十亿甚至更小参数的专家模型,这使得整个系统更加智能。CoE架构在实现“让最强的模型回答最难的问题”的同时,还能在回答简单问题时调用更精准的“小模型”,在获得高质量回答的同时,节约推理资源、提升响应速度。
第三是练队伍——加速应用落地。
有了技术架构,有了大模型,更重要的是要有应用,通过应用才能让大模型更好用,大模型的协同效果才能得到验证。360在加速产品的AI化的同时,在多个产品中都通过多模型协同实现产品的领先优势。
360AI搜索就是基于CoE技术架构,支持多模型协作重构了搜索的底层链路,是一种真正意义上的“AI原生搜索引擎”。 360AI搜索“深入回答”模式,首先是构建意图分类模型,然后打造任务路由模型对问题进行拆解,最后再构建AI工作流,整个过程会涉及7-15次的大模型调用,这才能让用户获得真正高质量的回答。
在CoE技术架构的加持下,360AI搜索仅用了八九个月的时间,就超越了Perplexity AI,蝉联全球最大的AI原生搜索引擎;并且依然势能强劲,以113%的月访问量增速,位列全球主要搜索引擎首位。
入驻360AI浏览器的AI助手(bot.360.com)的「多模型协作」能力,近期也成为了行业焦点。用户可以从国内主流16家厂商的54款LLMs中任意3款,分别做专家、反思者和总结者,直观体验LLM领域的“三英战吕布”。让3款LLM协作起来,组队碾压GPT-4o、媲美OpenAI o1。
由此可见,作为国内“AI教父”的周鸿祎,并不只是一个思考者,更是一个行动者。
他在洞察到大模型的诸多问题之后,给出新的路径;并且身体力行,通过搭台子、建班子、练队伍的方式,将这个路径给验证了。这才是真正难得的地方。
跑得快,更要跑对方向
自从OpenAI掀起大模型浪潮之后,周鸿祎非常活跃,在语言上和行动上都是。一方面,他在各种场合交流对AI发展趋势的见解;另一方面,迅速推动公司所有产品的AI化,两者相互促进。
而这次,在大模型前进道路上迈出的关键一步,周鸿祎和360不仅与OpenAI不谋而合,并且还快了一步,正是其在思考中实践、在实践中思考的结果。
如今,AI的发展还处于初级阶段。最近,“慢思考”与“思维链”理念的提出,对AI的发展带来三点启示。
第一,战略高于战术,格局重于技术。
大模型火了之后,传统互联网大厂、创业者都进来卷,但卷大模型的价值有那么大吗?从终局来看,AI 不是被动接受指令的工具,而是能够自主“思考”、决策和行动的智能伙伴。
周鸿祎在看到大模型强大的同时,也很早就看到AI幻觉的问题,并思考未来的发展方向。战略方向比具体的战术更重要,单点的技术创新是战术,而终局思维才是战略方向,这是其“慢思考”的来源。
跑得快很重要,但是更重要的是在对的方向上跑得快。如果一味地卷大模型,其实是对产业资源的浪费。
今天,“慢思考”与“思维链”也不是终局,只是在向终局的路上迈进了一大步。
第二,卷应用比卷模型更有价值。
技术创新与用户价值之间,往往隔着一道鸿沟,跨过这道鸿沟的企业比发明技术的企业更伟大。最早发明二维码的不是微信,但是微信是二维码最大的推动者。新能源电池不是特斯拉发明的,但特斯拉确是新能源汽车产业的先行者。
大模型很酷,但如何能为用户创造价值更重要。也就是说,卷应用落地比卷大模型更有意义。360的产品全面AI化,目的就是让小白用户可以简单轻松地体验到AI带来的好处。在应用的落地方面,360走得很快,特别是在多模型协同上领先了OpenAI两个月。
学习、办公是最常见的应用场景,为了推动应用了落地,360还推出了AI办公,是一个一站式学习办公工具,用户可以体验到AI图片、AI文档、AI音视频、AI PPT等超过200多个AI能力,几乎覆盖所有学习、办公所需。
第三,独行不如众行远。
AI的实现,是一个非常复杂的系统工程,不是单个企业可以实现的。在业界有一个共识,未来AI的竞争是生态的竞争。单个OpenAI可能很强,但是通过协同作战,中国的大模型可以用全新的思路弯道超车。
经测试,基于CoE架构集各家所长的混合大模型能力就超过了GPT-4o。该混合大模型在翻译、写作等12项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分;而且除了代码以外,其余11项指标均优于GPT-4o。特别是在“逻辑推理”、“多步推理”、“诗词赏析”这类比较具有中文特色的问题上,CoE的领先优势更加明显。
目前,360“多模型协作”在测试中,已经打败并远远甩开GPT-4o,媲美o1-preview,这就是联盟的力量,生态的威力。
【结束语】
AI发展初期,从大模型来看好像中国落后一步。如果跟在别人后面延着人家的轨迹追,差距只会越拉越远。以终局思维重新审视AI的发展路径,技术创新的同时更要路径创新。“慢思考”与“思维链”的巧合,是中国AI发展赶超的新契机。
冷眼旁观 麻辣点评 深入分析
真诚邀请您关注
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部