放弃超大基础模型,李开复瞄向模型落地“最后一公里”
记者 孙奇茹
2025-03-18 11:41

3月17日,零一万物对外发布了万智企业大模型一站式平台。创始人李开复也在线上沟通会上现身,透露了“AI六小虎”之一零一万物转型的最新进展:不再做万亿参数以上的超大基础模型,而是将着力打通基座模型到垂直场景的“最后一公里”。

近几个月来,DeepSeek 作为性能媲美 OpenAI 顶级模型的国产开源模型,已经成为“中国智造”的新旗帜。然而,经过开年“DeepSeek 冲击波”,中国 ToB(企业级)市场需求正经历前所未有的高涨,产业链条上的失衡问题也日益显现——从通用大模型到企业业务场景的落地过程中,部署、微调、应用搭建等能力的缺失成为关键瓶颈。

例如,当前企业算力基础设施、模型部署等方面的软硬件积累参差不齐。在基座模型部署方面,零一万物整合了 DeepSeek、Qwen、Yi 等国内领先的多款模型,推出了“安全部署”方案,能实现本地化推理与私有化数据隔离,防范数据外泄风险,保障企业核心业务信息安全,并满足金融、政务等对数据合规性、服务稳定性要求极高的特殊需求。

完成模型部署后,如何安全、稳定地将先进模型能力转化为企业生产力,成为企业必须面对的核心命题。一键生成企业专家Agent(智能体)、构建企业专属知识大脑、专业微调让DeepSeek进化更懂行等一系列技术手段推动下,高大上的模型就能与企业的具体业务实现紧密结合,形成看得见摸得着的现实生产力。

“我们认为,未来的大模型的行业竞争将不再单指模型性能的比拼,更关乎从中台到应用的能力,即模型能否快速响应场景需求、基于中台构建行业应用。”李开复说,

据悉,去年5月,零一万物内部对Scaling Law 的边际收益递减进行推演,最终决定放弃训练原定万亿参数的超大模型 Yi-X-Large,而转为训练更轻量化、更具商业落地前景的 MoE(混合专家)模型 Yi-Lightning。今年1月,该公司与阿里云成立产业大模型联合实验室,补强自身超大参数模型的布局的同时,正式宣布聚焦参数适中、性能领先、推理速度快、推理成本低的轻量化模型,以产业大模型发力商业落地。

市场教育与基础模型能力到位的当下,模型能力与市场需求之间出现了技术鸿沟。中国大模型行业已进入“产业深水区”,亟需成熟的企业级解决方案,来推动大模型从通用能力向垂直行业深度融合。李开复称,零一万物将继续开放自身的能力,打通基座能力到垂直场景的最后一公里,推动大模型从炫技走向新质生产力。

来源:北京日报客户端

记者:孙奇茹

如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。版权侵权联系电话:010-85202353

打开 APP 阅读更多
相关

    请点击右上角···分享

    北京日报客户端
    记者 孙奇茹
    2025-03-18 11:41

    长按二维码
    查看文章详情

    长按海报点击保存图片