专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:主页 > 科技 > 互联网 >

度小满CTO许冬亮:金融行业是大模型落地应用的高潜场景,但有三大挑战需解决

导读:

8月24日消息,昨日,在“北大光华-度小满金融大模型技术与

8月24日消息,昨日,在“北大光华-度小满金融大模型技术与应用论坛”上,度小满CTO许冬亮表示,金融行业是高价值行业,数字化基础好,高度依赖数据和技术,也是大模型落地应用的高潜场景。

清华大学人工智能研究院常务副院长孙茂松指出:“大模型基于其所构建的向量空间,很可能打造出崭新的智能信息处理基础平台,进而变革各行各业的基本生态。大模型必然会导致相关产业重新洗牌,金融大模型正在重新定义金融科技。”


对于金融科技公司而言,金融大模型属于兵家必争之地。孙茂松表示,“金融科技公司对于金融大模型的态度决定了自身的境界,也决定了这家公司在日异激烈的竞争中能否赢得下一个五年,乃至下一个十年。”

据度小满数据智能部总经理杨青透露,度小满轩辕大模型2.0版本将在10月份发布。2.0版本在对话和金融理解等场景下的能力大幅提升。在增量预训练和指令微调阶段,该版本加入了海量金融数据,对金融问题回答更加专业、准确;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能够处理更长的金融报告、研究和分析。

今年5月份,度小满开源了千亿级中文金融大模型“轩辕”,开源以来已经有上百家金融机构申请试用。

现阶段,如何在金融领域发挥大模型的能力,许冬亮认为还有三个挑战需要解决:

第一个挑战是通用模型能力不能满足金融场景需要。首先是通用大模型本身精度不够,当前大模型原生的幻觉问题、可控性问题和可解释性问题都限制了生成内容的准确性和可控性,而金融又是一个对精准性、可控性要求很高的行业;其次是通用大模型金融知识的缺失;再次是大模型更新迭代困难,金融是高时效的,模型必须能够实时跟踪金融市场的变化和趋势。

第二个挑战是大模型如何高效植入现有业务场景。一个团队既要懂业务场景的know-how,又要理解大模型的使用方法,而且还需要具备比较强的工程能力,这样才有可能选择出适合应用大模型的场景,高效的将大模型嵌入到实际业务流程。

第三个挑战是大模型应用于金融业中产生的安全合规和隐私保护问题。金融本身是一个高合规要求的行业,大模型又是具有颠覆性的新技术,我们对它的风险还没有完全了解,随着大模型落地的不断推进,如何平衡大模型落地收益和潜在合规风险,会是一个越来越突出的问题。

如何解决大模型在金融行业落地应用的这些难题,许冬亮认为每家机构独立去解决这些问题既是不现实的,也是不经济的,科技公司和金融机构在金融大模型上的合作非常有必要。

大模型训练需要大数据,但是金融数据非常宝贵。许冬亮具体解释,“大模型训练非常依赖底层的生产资料,也就是数据,但金融行业数据的分布实际上比较分散,通用智能化数据主要集中在科技公司手上,金融数据则分散在各个金融科技公司手上,而对于金融机构而言数据是核心竞争力也不太可能进行分享,其他还有监管、数据安全、隐私保护等因素存在,所以注定未来这个行业高质量数据的分布也会是分散的状态。”

许冬亮向网易科技记者表示,未来从合作模式上来说,应该会是科技公司提供不同类型的通用大模型,金融科技公司在通用大模型的基础上提供金融行业大模型,将领域内的知识、know-how进一步整合,以私有化的形式部署到金融机构内部,而不是以云端API的方式提供服务,科技公司和金融机构未来会是深度合作的模式。

对于金融行业大模型的应用实践,中国农业银行研发中心大模型研发负责人耿博表示: AI大模型面临算力需求大、训练和推理成本高、数据质量不佳、隐私和安全问题等挑战。目前,大模型和场景融合是一个不断演进、探索的过程,数据是大模型的生产要素,基础设施是大模型的入场券,场景应用是大模型的驱动力,AI大模型未来发展将趋于通用化与专用化并行。

光大信托数据中心总经理祝世虎则认为,大模型是生产力的提升,在金融行业的落地路径要依靠大合作和大创新。通过大数据的整合、大算力的合作,在垂直领域精调模型,以小规模算力打造轻量级推理模型。在大创新上,目前大模型在金融领域的应用主要集中在智能客服、智能运营、智能办公等领域,后续应该更多的应用于风险管理、资本管理和监管科技等几个方面。(一橙)