首页 > 综合时讯 >

第四范式副总裁柴亦飞 场景中规模化生成AI应用的实现路径

发布时间:2024-11-15 09:32:09来源:
导读 一些在AI应用上比较领先的金融机构,在今天确实做到两星期做完AI应用场景,从建设到上线的过程。这是基础能力的支撑,在这个基础上,我们才...

一些在AI应用上比较领先的金融机构,在今天确实做到两星期做完AI应用场景,从建设到上线的过程。这是基础能力的支撑,在这个基础上,我们才能真正做到N个场景快速规模化的落地。大会以“科创引领智能新时代”为主题,聚焦科创板、5G、智能制造等新兴产业创新热点6月12-14日,为期三天的“2019全球新经济年会”在上海长宁世贸展馆顺利举办。本次大会由上海市经济和信息化委员会、上海市商务委员会、上海市长宁区人民政府指导,上海市长宁区青年联合会、亿欧公司联合主办。6月14日,金融科技峰会隆重召开,与会嘉宾在“开放银行”、“场景金融”、“产业互联网”等方面的思维碰撞为科技创新企业探索金融科技赋能、落地银行业带来了极具价值的参考。

第四范式副总裁柴亦飞在会上发表了精彩演讲。以下是演讲实录柴亦飞:各位下午好!非常荣幸有这个机会来给大家讲一讲我们在人工智能,特别在金融行业落地的这些年工作中的经验和一些思考。

在座的各位不一定每个都知道为什么我们公司叫第四范式,这是图灵奖获得者Jim Gray的演讲,科学发展的四个范式:第一个范式就是实验科学,比如说我发现苹果掉下来,我钻木头发现能够生火,我就把这个实验的现象记录下来,这叫实验科学。第二个范式叫理论科学,我今天根据观察记录的现象,总结成几个规律或者定律,这是一个理论。第三个范式,人们拿着这个理论大的计算能力上做理论的推演,我们叫计算科学,类似今天非常典型的天气预报都是计算科学很好的例子。第四个范式,是数据科学时代。今天有这么大的数据,从数据中找到规矩,不像是牛顿三大规律,而是机器在海量数据当中找到非常多的规律,人们认知世界发展到第四个范式的阶段。所以我们叫第四范式。

牛顿总结了三个规律,在今天真实复杂的社会当中有非常多的规律要被总结出来,而且也需要被总结出来。在这个过程里面,为什么物理里面有爱因斯坦,有牛顿总结这么多规律,在金融科技这个领域还没有这样一些规律。其实也是因为今天大家做这个事情的时候不是按照理论科学,牛顿的方式思考。或者今天从事这个行业的很少是科学家。

今天有机器学习或者人工智能帮助大家通过技术的手段,在海量数据里面总结出几千万条规律里面,我们认为第四范式从2015年开始和很多的金融机构合作过程中,就是在尝试用机器的手段,从各个金融机构已经积累的海量数据里面揭示这样的规律。为什么我们认为金融这个行业可以做这个事情,具体来看几个例子。

我相信在座的大部分,都了解人工智能或者机器学习的技术,不管是在中国还是国外,最早落地大规模使用的行业是互联网,国外就是以谷歌为首的互联网巨头,在国内也是一些互联网巨头开始做这个事情。在这举两个例子,一是非常火的千人千面的内容推荐。千人千面的内容推荐的是什么事情呢?以前有非常多的资讯是专业的编辑团队决定什么样的资讯合适推荐到什么样的读者的手头。我在这个资讯上有几百个标签,我们对潜在读者几百个标签中去做一个匹配。

到机器的时代,是不能用简单的几百个标签来定义一个人因为全国有十几亿的人,如果有一百个标签,我认为全国只有一百种人吗?肯定不是。今天在用机器学习或者人工智能做这个事情的时候,我们对人的刻划,它的标签维度会从几百个,几千个变成几百亿个,几千亿个,这样一个维度才真正做到用几千亿的维度来刻划人,所以每个人其实都有不同的标签,甚至每个人在不同的场景下都有不同的标签。做这样一个状态之后,我们才能真正的实现新闻的千人千面的推送。

今天依赖于做这些规则的人的数量、做这些人的精力和时间的投入,是不可能把无穷无尽的场景都穷举出来,并写成一个规则,这样非常细分场景的信息和规律都是通过机器从非常海量的数据里面挖掘出来。

搜索也是一样的,比如说搜索“干洗”这两个字,整个搜索引擎的结果该给各位推的什么呢?是干洗机或者干洗店?在座99%搜索干洗的时候,希望找的是干洗店。非常少的情况下,如果搜干洗情况下,上一个搜索的关键词是店铺租赁,是地段,我有可能关注的不是想要找干洗店,而是开一家干洗店,所以搜干洗的时候,就是在哪可以租到一台干洗机,这些规则是以前靠人想的。不管是国外还是国内的互联网,非常深的AI和机器学习的技术应用之后,看到了一些效果,这是为什么从2014、2015年,我们坚信用这样一些技术来改造或者来提升更传统的一些行业这件事情是可行的,而且有非常大的空间。

举几个例子,这些例子是这些年给金融机构做具体应用场景落地中比较典型的例子。一方面是关于传媒营销个性化推荐的,典型的两类银行做的营销,一类是更偏向信用卡的分期或者是讲的消费贷款等等这样一些场景。我们可以来观察这些C端持卡人或者客户,办信用卡分期不管是账单信用卡分期,还是现金分期,还是单笔交易分期,都在考虑什么东西。我今天买的是什么样的东西,来决定我有分期意愿的几率有多大。比如说今天同样花五千块钱,如果五千块钱请大家吃一顿饭,花五千块钱买苹果的手机,这个分期的概念非常之大。我今天购买产品,可能是苹果的产品,这个人本身的月收入是多少样的水平,其实也跟他的分期的意愿差别相关性很高。我们有大量的特征观察,从这些特征里面找到最有可能的分期,给他们推分期,甚至可以找到什么样的人应该推6期,还是12期,还是24期,什么样的人可能有刚需,我可以就不给他打折,这个分期利率就是标准利率,有的可能打一些75折,65折,甚至6折的标准利率,扩大整个分期业务的规模。这是分期跟相关分期的人工智能推送。

因为在银行AUM相对比较低,比如说一万或者几千块钱的规模,如果客户愿意购买我们的理财产品,那么有非常大的概率把存在别的银行的钱搬到我们银行,提升这个客户在我们银行的AUM的规模,这是今天有很多的机器学习来做理财产品推荐的场景。

理财也是一样的,我们在很多银行做理财的时候,也是去关注银行里面AUM资产规模相对低的客户,给他们推什么样的理财产品,能够有比较高的成功的概率,而且在这个概率基础之上,

在这些客户里面,相对来讲睡眠状态的长尾客户、不活跃的客户的占比还是比较高的。我们发现用不同的营销的手段,促活的手段,个性化的匹配到我们目标的睡眠客户身上,对他们做促活或者提升的方式的效果还是非常好的。

长尾客户的挖掘,特别像四大行或者特别大的头部股份制银行,他们今天的客户的规模都是亿级规模,或者大几千万级的规模,有一家四大行做了这样一件事情,他们线上的渠道就是手机APP渠道去做睡眠客户的唤醒,用机器学习的方式,比传统方式提升5倍以上。在传统的触达渠道,比如说发短信,或者远程运维的客户团队去给他外呼电话,类似这样的工作至少提高100%以上客户激活的成功率。这是在营销和客户经营和个性化推荐的这一端,很多银行从2015年开始做了很多的探索和尝试。

风险端,这是很多机构做的工作,包括做差异化的催收今天有很多的金融机构做催收相对比较一刀切,我发现逾期开始发短信,如果五天以内客户不还钱就打电话,如果再过一段时间不还钱,我就上门催。上门催的是非常高价值的客户,因为他实在太忙了,你给他发一个短信可能没法看,打电话可能开会没法接,上门其实人家有很强的还款能力。有一些老外的客户,等你给他发短信,人家早就跑路了,手机号都换掉了,五天之后催,都催不到钱。很多的银行开始做一些事情,一上来就判断哪些客户有很大的机率是老赖客户,根本没有还款的意愿,或者在很多的时候是共债的客户,欠好多家的钱,如果我们最早发现,第一时间去催钱,会有很大的几率催回来。还有高价值自愈的客户,给他温柔的提醒,可能五天十天以后,他会把这个钱还上,甚至你可以赚到一些额外逾期利息,这是个性化的催收非常大的空间能够做的事情。

在一些银行在尝试用深度神经网络CNN技术来做这个工作,能够大幅度降低人力,比如说一家省分行,之前四大行应用到上海的分行,可能一下子减少一百个,这个在劳动力资源的节约上有非常明显的提升

对头部大银行非常典型的例子是做文字识别。文字识别这件事情其实已经是一个很多年的解决方案,但是现在一个比较大的问题是在于传统的解决方案识别都是印刷文字,就是手写文字识别率在2017、2018年是一个比较难的问题。像头部国有四大行,可能在一个省分行去做手工录入文字碎片工作的团队都有一两百个人,或者两三百人。。欺诈也是一样的,有很多的信用卡的交易欺诈,信用卡申请的欺诈,都在用神经网络或者机器学习。

一是客户引擎就是怎么能够高效获取用户,而且能够非常高效留存这些客户,因为客户是所有经营的基础。

二是变现的能力通过AI方式在单客户上尽可能挖掘出足够高的价值。这是两个客户端,即开源的部分。

三是节流的部分OCR,自己内部通过运营效率提升大幅度的降低成本。

这三大方向是各家金融机构合作时会去思考的。大的全貌下AI平台要做什么事情,这是五年工作中要做的思考,给大家做一些分享。

一个“1”是指今天银行所要发力打造核心竞争能力的差异点

我们认为有两个方面,。有一些银行提出的是第一零售银行的战略,有一些银行提出一亿战略,在这样的战略驱动下,在战略所落地的大场景追求的是极致信任,在极致信任需要三个核心能力:

一是高维今天要对这个模型做极致优化,这个维度从原来几千几百上升到几百亿几千亿,这是第一个。

二是实时指今天给客户所有的交互的动作的决策是一个实时的决策,今天刷卡或者做交易在毫秒级发现这个交易有可能是欺诈。客户在浏览网站或者是用手机APP的时候,在毫秒级发现这个客户有可能存在金融服务需求,在毫秒级对他做响应。

三是闭环闭环是非常重要的,因为AI是一个持续迭代和优化提升的过程。不管是上线什么样的模型,都不是一次性工作,上线之后回流数据持续反馈对模型体系持续优化和提升。我们怎么能够保证这个模型是高效闭环的状态,这也是我们要追求的场景极致效果的非常重要的能力的保障。这是我们在做“1”这件事情。

另外一个事情是做“N”,指的是今天大银行能发现的跟AI的结合点不是十个,不是二十个,我们看到很多大的银行在从业务条线和科技条线搜集AI应用场景需求的时候,搜集回来的场景需求都是两百个,三百个。今天怎么能够以规模化的方式很高效的实现这件事情?

如果今天讲是六个月能做一个应用,一年做两个,那如果做两百个应用做到什么时候去?十年都做不完。怎么通过基础能力的建设,把做六个月的场景变成一个月做六个场景。

这些场景所需要的支撑就是来自于整体的完整的端到端的AI应用建设全生命周期的支撑能力,这件事情也是今天各家金融机构,特别是在AI采取动作比较早的金融机构在做的事情

上面是“1+N”的场景,我今天举的例子,银行例子比较多。保险也是一样,保险从定损、货保、核赔、保全很多的场景都跟AI深度的结合;包括证券业是做投研,投顾,做产品的营销和个性化的服务,都有大量的场景。。而且在做这件事情过程之中还有非常重要的事情,一个关注点是以前我们讲做AI应用需要的是十年、八年的模式才能做,今天从业者的供应量是非常有限的,不管是谷歌还是第四范式今天做的事情,如何通过更自动化的机器学习建模的能力,帮助原来传统不是AI从业者的同事未来都能够变成AI从业者,原来只是做一些普通的IT开发,甚至原来做业务的同事都能够变成一个AI应用的建设者的角色。

版权声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。