不赚钱的金融大模型:从“两张皮”到“一盘棋”
作者丨千山
出品 | 51CTO技术栈(微信号:blog51cto)
大模型很时髦,但大模型不赚钱。
归根结底,大家有共识:一则看好大模型不等于立刻就要用上大模型,大模型的供需两端依然存在着难以逾越的鸿沟;二则即使大模型未来会成为产业变革的关键变量,但谁也不知道,大模型的应用何时会真正从非核心环节的试点进阶为核心业务场景的刚需。所有人都是摸着石头过河,没有先例可以借鉴。
因此吆喝者多,获益者少。观望者多,落地者少。
我们知道,金融产业一贯是新技术的早期采用者,不仅有着良好的数字化基础,而且很早就开始了在AI方面的探索,可以说是AI产业化的“优等生”。因此有人觉得金融是大模型落地的首选。但事实上,金融与大模型之间,“两张皮”的现象同样屡见不鲜。
一、技术焦虑下,错位的诉求
今年3月,以彭博发布BloombergGPT为标志,这个号称专为金融行业打造的500亿参数大语言模型,拉开了金融大模型混战的序幕。随后,国内不少金融机构、金融科技公司纷纷落子大模型:
- 5 月下旬,度小满推出国内首个千亿级中文金融大模型“轩辕”;
- 6月28日,恒生电子发布金融行业大模型LightGPT;
- 8月28日,马上消费发布国内首个零售金融大模型“天镜”;
- 9 月8日,蚂蚁集团发布工业级金融大模型,同时对外开放Fin-Eval金融AI任务评测集;
- 开源金融大模型领域,FinGPT、貔貅(PIXIU) 、聚宝盆(Cornucopia)也次第而来。
有研究数据显示,截止至今年9月,国内参数在10亿规模以上的大模型数量已有116个,其中金融行业大模型约18个。
别看金融大模型提供方你追我赶、一派热闹,但行业用户依旧保持着相当审慎的态度。
根据恒生电子的调查,尽管金融行业整体对大模型的关注和参与意愿比较高,但真正落地比例较少。在受访用户中,8%处在立项阶段,17%处在测试阶段,迄今为止约70%的金融机构对大模型仍处于调研阶段。
供求双方的“脱节”主要体现在:两者身处的语境不同,诉求错位。
当模型提供商在汇报自己的大模型参数规模,语料的丰富性,tokens的大小,以及一堆评测结果时,行业用户对此往往兴趣寥寥,他们更关注的是大模型到底可以用在哪些地方,有没有成功先例,一定要用大模型吗,小模型为什么不可以等问题。
对于大部分大模型提供商来说,在这场竞逐中,现阶段能不能成为赢家还是次要,先拿到入场券才是至理。因此,我们看到了形形色色的自研大模型或基于大模型打磨的产品与服务。简言之,先上牌桌,再论胜负。
对于金融组织来说,无论是头部机构还是成长型机构,在技术焦虑的驱动下,普遍对大模型接纳良好,不过具体到实战还是存在诸多挑战。
首先,“由谁主导”。金融机构覆盖了较多的企业类型,银行、保险、证券、基金等等,不同类型的机构需求也不同。以银行为例,掌握大量的私域数据,而且合规风控较为严格,在此前提下进行大模型应用探索,必然以自身为主导,而不是将主动权让渡给技术公司。比如,此前在交行发布的2023年半年报中,就明确提出“制定生成式人工智能建设规划,组建GPT大模型专项研究团队”。
其次,“如何选型”。对于金融机构来说,到底是选择通用基础大模型还是行业大模型;是以私有化形式部署,还是调用API接口来获取服务都是需要权衡利弊的问题。如果与第三方合作私有化部署大模型,那合规与数据安全相对有保障,但成本不菲;如果选择MaaS模式,通过API调用来获得大模型服务,成本将显著下降,但相应风险也会随之提升。
再者,“如何准备”。大模型要训练,训练的语料从哪里来,如果用自己的,是否做好准备,如果用别人训练好的,又该如何应对不同场景的“质”和“量”的要求;数据方面,尤其是私有数据如何部署,才能满足合规性;算力方面,需要多少算力支撑,算力紧张怎么办;预算方面,要投入多少钱。这些都是需要做到心中有本账的地方。
最后,“如何运营”。大模型的应用要产生实效是不可能一蹴而就的,上线仅是第一步。如何让场景驱动下面的垂直应用开发不断提升成熟度,切实发挥效能提升作用;如何让私有数据、公有数据,以及海量实时数据形成数据闭环,乃至进一步形成数据飞轮都是关系到大模型持续发展的关键问题。
恒生电子董事长刘曙峰表示,在大模型实际落地过程中主要存在模型选择难、算力供应不足、应用成熟度不足等问题。他谈到,在一定的角度来看,大模型的应用不仅仅是技术能力的问题。长期发展来看,大家的技术能力可能会趋同,此时关键的是应用新技术的速度、新技术场景的建设和客户运营能力的建设。
新技术的率先应用的确可以带来红利,但这种红利是建立在场景之下,业务切实带来增长的基础之上的。目前来看,由于供需双方都还处于摸索阶段,生活在两套话语体系之中,金融行业的大模型落地还远远未走到这一步。
二、笼中的行业,幻觉里的大模型
金融与大模型的“两张皮”现象不只存在于供求双方之间,还存在于行业需求与大模型本身的能力之间。
理论上讲,大模型可以在金融行业找到很多不同的应用场景,比如智能客服、投研投顾、信贷风控、智能营销等等,但找到场景,对症下药,试点成功,是否就能规模化推广,然后彻底起飞呢?并没有那么简单。
一方面,金融业在数据治理、行业监管、信息安全方面有其行业特殊性。
以银行为例。农行安徽分行副行长徐伟对记者谈到,在实践中银行应用AI大模型可能会遇到以下挑战:
1.数据质量问题:大模型需要大量的高质量数据进行训练。目前银行大模型所要用到的数据在质量、一致性、完整性、准确性方面还有待进一步提升,这会影响模型的学习和性能。
2.行业合规性和监管问题:银行业需要遵守各种法律合规性和监管要求。在使用大模型进行风控、投研等任务时,需要确保模型的算法透明、可解释,能够被审计和追溯,同时符合相关法律法规要求。
3.用户隐私和安全问题:银行涉及大量的用户信息和交易数据,在使用AI大模型进行客户服务、风控等任务时,需要保护用户隐私和数据安全,防止信息泄露和数据滥用。
4.算力需求问题。大模型对算力要求高,各个应用的训练、推理需要大量资源和算力,目前无法支撑全场景使用。
在徐伟看来,正是基于以上问题,“现阶段大模型较为适合在对内服务、辅助支撑、内容生成等场景试点,而在监管相关、准确性敏感型场景、数据敏感型场景、直接面客场景的使用是受限的”。
另一方面,正是由于金融行业对准确性和可控性的要求极高,现行大模型的训练机制下,难以完全消解的幻觉问题成为了大模型应用落地过程中的重大障碍。
大模型有时会生成错误且具有误导性的结果——通常被称为“幻觉'。随着AI模型的完善和学习,这些失误在某种程度上是意料之中的,甚至在某种程度上可以被视作是其创造性的衍生品。但在精度不容妥协的金融领域,其影响是严重的。因此,现阶段大模型能力不足以参与到关键业务流程的决策,即使是在非核心业务场景的应用也需要结合人工审核。
九章云极DataCanvas副总裁于建岗对记者表示:当前大模型的训练机制其实很难完全消除幻觉问题,只能用各种方法来缓解,甚至于用其他的方式(模型或者rule)来后期消除,所以目前很多的应用更多地是把大模型作为copilot来提供。不过对于未来,他依旧保持乐观态度。
“大模型是新事物,本身也需要一个发展进步的过程。随着大模型技术的发展,相信在训练方式甚至于transformer上都会有革命性的变化。另外,我们一直认为未来应该是‘大模型+小模型’的时代,就是说大模型能够在规划和逻辑推理方面提供很强的能力,对于一些需要精准结果和预测的应用依然可以用小模型来提供, 这样相结合的方式能够在一定程度上解决当前的问题。”
三、场景之下,通往未来的两枚拼图
纵然大模型在金融行业的落地充满了挑战,但是不可否认,金融业在AI应用的积累上是有先天优势的。基于机器学习的风控、营销、投研决策,早已是金融机构推进数智化转型的重要组成部分。
相比传统AI,基于大模型的AI让大家看到了一种通用型的AI能力的赋能,即能够以类人的思维来处理很多复杂的推理、逻辑、规划、任务执行的能力。大模型也的确能提供很好的增益。其学习能力、理解能力、内容生成能力、预测能力都在为金融领域开启一扇新大门:在海量数据场景下为金融机构提供更全面、更深入的市场洞察、分析预测,更复杂的风险管理、客户服务。
当前,越来越多的金融机构愿意尝试将其应用在特定的业务场景中,其中智能客服是被普遍看好的领域之一。比如,美国互联网保险公司Lemonade推出了基于GPT-3技术面向用户的销售机器人玛雅(AI.MAYA)。
传统的智能客服机器人对用户来说并不陌生。但由于智能化程度有限,经常会出现面对复杂问题无能为力或答非所问的情况。在此背景下,大模型技术的出现为智能客服的进阶带来了希望。
依托海量参数,大模型有更好的自然语言理解和内容生成能力,结合人类反馈强化学习,可以实现更拟人、更安全、更高质量的任务反馈。加之更强大的学习能力,可以更好地泛化到未见过的数据上,在面对新问题时能够更好地适应和解决。
另外,投研投顾也是热门场景之一。有来自券商的内部人士表示,他们对大模型在投顾场景的应用很感兴趣。以往AI投顾机器人的回答比较生硬刻板,如果大模型可以在合规准确的前提下更贴近用户需求,那无疑将让投顾服务体验更上一层楼。
近日,蚂蚁集团发布的支小宝2.0和支小助两款大模型落地产品同样聚焦在客服及投研领域——前者面向投资者,可以提供行情分析、持仓诊断、资产配置和投教陪伴等专业服务;后者为从业人员在投研分析、信息提取、专业创作、商机洞察、金融工具使用等环节提供服务。
据官方介绍,支小宝2.0的金融意图识别准确率达到95%,能够理解用户情绪,主动进行多回合的高质量对话,甚至因人而异调整沟通风格。回答用户提问后,还会自动“反思”准确度、自我纠偏。
如果说大模型为金融业描绘的“未来已来”画卷是恢弘而神秘的,那么智能客服和投研投顾两大场景就像这幅卷轴里最清晰的两枚拼图,为我们稍稍勾勒出了解码未来的一点轮廓。
当前金融大模型已经在个别业务场景表现出了不错的潜力,一方面提升原有AI功能,变得更通用、强大、高效;另一方面,提供新功能,为降本增效、改善用户体验提供更广阔的想象空间。未来,要让它发挥更大价值,仍需让应用场景从零星试点走向规模化应用,让AI原生应用从非核心场景走向关键业务场景,彼时,大模型才能迎来真正起飞的高光时刻。
四、乾坤未分,笑到最后者笑得最好
“这是一个最好的时代,也是一个最坏的时代。”
在这个不确定性成为常态的时代里,大模型的兴起让所有人措手不及,有人兴奋,有人质疑。向来不吝于尝试新技术的金融行业也被裹挟其中,一路向前。
这是一场技术实力的较量,也是一场商业生态位的较量。
技术上,重新定义人机交互方式和专业应用程序,在大模型基础上进行AI原生应用的开发;业务上,推进大模型落地,把握其对于业务形态和逻辑范式的革新,实质性改善用户体验,实现效率质的飞跃;生态上,预见既有的基础设施以及管理体系的颠覆,在大模型生态中形成从上到下的能力,在技术趋同之际打造自身的护城河。
大模型时代,乾坤未分,玩家众多,前方也许群星璀璨,也许一枝独秀。但能脱颖而出的,必然是敢为人先的冒险家,也必然是长期主义的践行者。