“在通往AGI的路上,已经没有任何阻碍”,这句话来形容o1的意义,并不夸张。如此跨越式的突破,国产AI真的做好准备了吗?我们深入技术本质,去追根溯源。
OpenAI联合创始人、科学家Greg Brockman,在博客中剖析了o1的底层逻辑。他写道:OpenAI o1是我们第一个通过强化学习训练的模型,在回答问题之前会深入思考。模型进行系统 I 思考,而思维链则解锁了系统 II 思考,可以产生极其令人印象深刻的结果。
所谓系统 II 思考,指的是人脑依赖逻辑和理性分析,进行的慢速复杂推理。可以与负责快速直觉决策的系统 I 相互配合,来实现更好的模型性能。 360集团创始人周鸿祎则表示,OpenAI o1遵循的可能是“双系统理论 Dual Process Theory”,核心在于两种系统并非独立而是协同运作。由此推测,其内部构建的更加智能的模型或许是 GPT和o系列结合思维链的融合系统,前者用于“快思考”,后者实现“慢思考”。而CoE(Collaboration-of-Experts,专家协同)架构则集合了数量更多的大模型和专家模型,是通过思维链和“多系统协同”的方式实现“快思考”和“慢思考”。
熟悉国内AI的读者可能发现了,“慢思考”这个说法怎么这么眼熟呢?
没错,如何提升机器的认知智能是AI界长盛不衰的话题,而“慢思考”这个创意也并非OpenAI独创。早在今年7月底举办的ISC.AI2024大会上,周鸿祎就提过,360将“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力,把多个大模型组合起来解决业务问题”。