百川智能发布Baichuan2-53B闭源大模型,开放API进军To B领域
9月25日消息,百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。这也是百川智能自4月10日成立以来,发布的第6款大模型,平均每28天推出一个大模型。据介绍,Baichuan2-53B不仅数学和逻辑推理能力提升显著,还通过高质量数据体系和搜索增强极大降低了模型幻觉。作为首批通过备案的大模型企业,百川智能此次还开放了Baichuan2-53B API接口,正式进军To B领域,开启商业化进程。
大模型的数学和逻辑推理能力一直是业内的关注焦点,也是评价一款大模型是否领先的重要指标。在Baichuan-53B的基础上,Baichuan2-53B不仅重点强化了以上两个维度的能力,并且对整体能力进行了全面升级。其中,逻辑推理能力提升100%,数学能力提升31%,语言理解能力提升29%,文本创作提升18%,知识问答提升9%。
幻觉是大模型落地应用必须跨越的鸿沟。通常而言,解决这一问题有两种方式,一种是不断增加模型的数据规模、提升数据质量;另一种是通过调用搜索等外部工具让模型能够获取实时信息。
Baichuan2-53B在两个方面均做了大量优化。高质量数据构建方面,Baichuan2-53B独创了一套数据质量体系。以低质、优质为标准将数据进行分类,确保Baichuan-53B始终使用优质数据进行预训练。
信息获取方面,Baichuan2-53B对多个模块进行了升级,包括指令意图理解、智能搜索和结果增强等关键组件。这一综合体系通过深入理解用户指令,精确驱动查询词的搜索,最终结合大语言模型技术,优化模型结果生成的可靠性,实现更精确、更智能的模型回答结果,减少模型幻觉。
在高质量数据体系和搜索增强技术的加持下,Baichuan2-53B有效降低了模型幻觉。百川智能使用FacTool评测后的结果显示,Baichuan2-53B的综合得分为140.5,在主流基础大模型中仅排在GPT-4之后,处于国内领先水平。
除了能力全面升级,Baichuan2-53B 还开放了API接口,企业和开发者可以通过API将Baichuan2-53B集成至他们的应用程序和服务中。据介绍,客户只需要简单的配置和集成即可接入,同时其对OpenAI的接口高度兼容,客户可以快速迁移,极大降低模型的部署和转换成本。(一橙)
页:
[1]