“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态”。10月17日下午,中国工程院院士邬贺铨在度小满金融大模型前沿发展论坛上表示。
目前各行各业都在开发对应的垂直领域大模型,金融行业的大模型也已经出现。邬贺铨认为,金融大模型的发展需要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。
对于金融大模型的落地应用途径,邬贺铨建议,一方面,可以从可控入手开发应用,例如智能客服、智能运营、写文章、写邮件等安全的领域出发。另一方面,可以从人机混合智能切入,例如在初期阶段先让金融大模型与传统模型共存,经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景,丰富大模型的场景迁移学习能力,或加入反事实的数据来测试,改进AI的学习本质,提高模型的泛化能力。也可以在金融大模型训练或微调时通过有监督学习思维链的模式,通过专家介入诱导它一步一步地进行思维推理。
邬贺铨以度小满为例,称其选择金融大模型切入是一个很好的基础,是大模型跟行业大模型相结合的好机会,“当然,这里边有很大的创新要求,在金融上对可信度、精准度要求是很高的。”据悉,未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。2023年5月份,该公司开源了国内首个金融行业大模型,已经有上百家金融机构申请试用,目前正在与百度云共建基于文心一言的金融行业解决方案。
不过,邬贺铨认为,金融大模型的发展目前仍面临着三方面挑战。第一,金融行业对数据安全性、隐私合规性都有着严格的要求。尤其是在风控方面,对时效性与精准性要求严格,而一般的基础大模型透明性、可信性、专业性不足,很难直接迁移为金融大模型。第二,金融大数据在成本与质量上的平衡问题。由于金融行业内的数据难以共享,因此金融大模型的数据规模远远不及通用语料,导致金融大模型难以产生“智能涌现”的效果。第三,本地私有部署需要自建算力设施,对软硬件产品有严格的信创要求,而且参数规模大则算力成本高。
“此外,还需要建立专门的监控系统,例如微软专门构建内容管理系统,它与语言模型协同工作,并使用特定算法检测和监控可能发生的服务滥用或有害内容生成情况。”邬贺铨说。
如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。版权侵权联系电话:010-85202353