去搜搜
头像
【圆桌第31圈-专享笔记】同盾科技联合创始人张新波:大数据如何变革金融风控
2017-09-13 16:17

【圆桌第31圈-专享笔记】同盾科技联合创始人张新波:大数据如何变革金融风控

文章所属专栏 活动实录

虎嗅注:虎嗅会员第31期圆桌主人张新波,是同盾科技的联合创始人&CTO。2013年张新波从阿里出来和同事一起建立了同盾科技,短短四年就拿到了三轮融资,风控云服务上线客户超5000家。在大数据风控领域中,通过联防联控的概念大幅提高了风控效率,也让安全性得到进一步的提高。


整个分享,张新波准备翔实、思路清晰,介绍了大数据做风控的各类手段,配合有真实的操作细节和例子,从各个环节详尽的解析了相关风险。  


全文11509个字,建议阅读时间25分钟,值得拿小本本记笔记哦~ 


从2009年开始,我到阿里一直从事风控行业,算是经历了一些国内风控行业的变化。大数据行业的兴起,对传统金融行业和金融行业的风控,带来很多改变。至于说是否能够称得上变革这个词,有待商榷。

 

下面我会分大概四个部分:

第一部分,会介绍大数据风控的背景。

第二部分,会介绍现在常见的欺诈现象,以及相关问题。

第三部分,介绍如何去做相关风险的分析和防范。

最后简单介绍我对大数据风控的一些看法。

 

诈骗团伙呈现专业化、团伙化趋势

 

随着移动互联网技术的普及,人们开始习惯在网上直接发生金融行为了,离钱越来越近,出现的欺诈问题就越来越多,也变得越来越严重。之前可能只是灌灌水,发发垃圾广告,现在在网上如果做欺诈,就可以直接骗到钱。这种投入产出比是相当高的,于是就吸引了大量的地下黑产从事这些行业。

 

类金融行业是欺诈的重头戏

 

查看2015年的数据,虽然数据有点老,但这个数据还是有一定的代表性的。11个行业欺诈的分布主要还是发生在信贷、类金融行业中,银行信用卡、P2P小贷等欺诈比例是最高的,因为它离钱最近,造成的欺诈损失也是最明显的。

 

另外就是营销欺诈,就是所谓的“薅羊毛”。在前几年电商O2O特别火的时候会有大量的补贴,有些人做启示卷20块钱一张,一分钱做推广,各个渠道进行推广。因为很便宜,马上就被职业的“羊毛党”把营销费用捞走了。对公司来说,花了很多的钱,并没有达到应有的营销的效果。而现在的诈骗甚至变成了专业的谋财的手段,并不是说像“薅羊毛”一样,赚个几十块钱就完了,有些是直接的灰色利益产业链,直接进行诈骗活动。

 

欺诈的团伙化

 

根据我们分析的线上的数据,大概有十来个疑似团伙。其中可能涉及到的成员将近5000个。现在我们从线上的数据分析,疑似欺诈团伙的有大概100万左右。少则有六七个人,多的真的就有上千个人,其中关联到了各种各样的数据。这种团伙的特征,也越来越明显。

 

欺诈的专业化

 

另外还有分工的专业化。像虚假号码的产业链,包括发卡商、刷码平台、开发者以及到下游专门做欺诈的,现在分工都非常非常细。而在某个产业链中又会有分工,比如QQ的产业链,包括写木马的、分发木马的、盗号的等等,产业链内分工也非常细。现在整个地下产业链, 分工非常细了,也非常专业。

 

风控的突破口:数据共享

 

随着信息技术的发展,我们想要高效、低成本的服务客户,面签的成本就非常高。于是行业内就逐渐出现了专门的风控系统,能够帮助相关业务,实时的检测风险。这种模式,更多的是在公司内部或银行内部的专属的系统,大多都是在自己的数据集里面做分析。而对于欺诈者而言,也许他在其他的平台上做了一些欺诈,但第一次来到我的平台的时候,只能等他进入到我的平台之后,才能够采集到他的一些用户的行为,很难及时的识别他是否存在风险。

 

其实之前在行业内,也有很多的黑名单联盟、安全联盟希望通过行业间的数据交换,共享相关信息。但是可以看到市面上这种方式都不奏效,虽然不能说完全失败,但效果不是特别明显。数据共享的壁垒是非常高的,共享的成本也非常高,在大公司内都很难做到数据的完全的共享,更不要指望不同行业,可能还是竞争对手,来互相共享数据,那确实是比较困难。

 

另外,现在很多风控系统,随着大数据技术的发展,也用到了很多相关技术。比如Spark,(Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架)甚至人工智能的技术、机器学习等等。虽然用到了很先进的技术,但数据没有本质上的变化,仍然是基与公司自己的数据做分析。所以即使技术手段再高,那也只是在自己的数据集里边做分析。

 

当业务部的行为数据和其他的样本,没有积累到一定的量的时候,即使技术再先进,也不能把风控提高到比较高的水平,这是传统风控面临很大的挑战。彼此的信息不通,也没有做有效的联防的机制,带来的问题就是欺诈者很容易在不同的平台用相同的方式得逞,很容易逐个击破。

 

欺诈的源头是信息泄露

 

欺诈的源头,主要来自于大规模的信息泄露,像Evernote、雅虎、国内银行的两百多万条的个人信息的泄露,这是分支机构的行长卖个人数据导致了信息的泄露。有个网站叫HackerNews,上面专门有一栏是数据泄露的专题,可以看到差不多隔几天,就有一起数据泄露的问题。包括很多的知名网站,其实都存在着数据泄露的问题。数据泄露是导致后续出现的很多欺诈的源头,有了这个数据之后,欺诈者更容易伪造身份做相关欺诈。

 

在信息泄露下滋生的各种欺诈行为

 

恶意刷量:在金融行业的理财网场景中,首先要在各种渠道去做推广、分发,此时就存在着各种恶意刷量的装量。有些刷票程序会到半夜自动安装APP运行个两个小时,等天亮之前再自动卸载,用户完全不知道已经完成了恶意刷量。或是伪造真实的用户激活信息,很多小游戏的弹窗广告,大约70%都是恶意刷量,行业术语叫金强广告推广。这种恶意刷量会将每天大量投入的营销费用都被消耗掉,真正有用的却很少。

 

在推广出去之后,到注册登陆这个环节又存在各种的垃圾注册。除垃圾注册之外比较常见的还有各种虚假注册、虚假号码或者小号。在各种打码平台上,花两块钱就可以买一个手机号,注册之后可以薅50块钱。两块钱就可以套现50块钱,收益还是蛮高的。

 

黄牛票:营销抽奖环节, 刚才提到了各种的“薅羊毛”、“刷红包”、“外挂签到”、“秒杀”、“黄牛”等等方式。如果是很火的演唱会的门票,在开抢一瞬间就会被黄牛把票全抢走,大量的真实的客户想买买不到,只能买黄牛转卖的高价票,非常影响网站信誉。

 

网站违规言论:关于留言评论, 是最早一类的安全的问题,早在十几年前论坛的时候,就存在很多这种问题,比如现在各种色情和政治类的垃圾广告。虽然现在监管也比较严,但很多的网站还是没有办法,像去年特别火的直播,有些人就会利用直播平台实时的弹幕,发广告或者一些色情的东西,给直播网站带来非常大的风险,如果被监管部门看到这些网站就会被关掉了。

 

伪冒借贷:现在的信贷竞争非常激烈,需要去各个渠道进行引流,目前还存在成本高、激活率低、陌客等问题。 而这部分引流过来的客户,可能存在贷钱申请的一些欺诈,尤其是用虚假资料伪冒的贷前申请时的欺诈。 之前说到大量的数据泄露,前段时间报道过花200块钱就可以买到一套非常全的真实身份信息,包括身份证、工作单位、驾驶证等等。 欺诈者拿到信息后,去借贷平台上直接借贷,各个信息都是真实准确的,又是第一次进行申请并无欺诈记录,很容易把钱骗走,直接造成网站的坏账。

 

中介代办:很多借贷者信誉是比较低的,申请者的资料已经被中介做过美化,甚至做过一些篡改。提高信誉值,贷出更多的钱,这个也是比较常见的中介代办问题以及过度授信问题,或者说是风控没有做到位。

 

信用恶化:信用恶化一般有两种情况。一种是借贷人没钱换不起;第二个种可能是,他在很多平台上都借了钱,当到了还款催收的时候,他只能还清部分平台的欠款,从而引发信用恶化。也有忘记还款的,当然还有直接失联,使用虚假号码或关机的。

 

催收困难:还存在暴力催收的问题。新闻也做了一些报道,因为催收行业,国内是蛮高端的行业。以前国内催收公司非常多,基本都是带有涉黑性质,从而引发了一些问题。很多平台是用人工电话催收的方式,其成本也非常高。

 

典型的恶意风控案例

 

暴力破解、撞库、账户盗用这都是典型的利用泄露数据进行恶意犯罪。在交易支付环节,还存在虚假交易、刷单、盗卡、盗刷等,其实是银行信用卡行业非常严重的问题。再比如各种恶意的套现,线下的POS机的恶意的套现现象非常多,虽然官方打击过很多次,但也很难避免。

 

用户盗用:被盗的用户的银行卡的四要素泄露了,欺诈者会从不同地点IP,多个不同的设备尝试登陆。欺诈者也对防范的策略特别了解,可能也会通过你的设备去做一些行为的关联分析,可能就会不停的尝试换设备换IP,或者换其他的信息,试图去绕过检测的机制。

 

撞库:一天之内用户登陆次数非常多,且大部分是高风险操作,那就很可能是撞库。正常的用户登陆都会采集到用户的真实的设备信息;如果是撞库,基本都是写的程序,所以不可能去搜集到真实的设备信息,通过这些用户特征, 可以判断是撞库的场景。

 


这个是撞库的一些具体的数据分析,可以看到第一行的数据,IP上使用的帐号是22200个,它关联的IP个数也是这么多。这说明他在不停的尝试新的帐号,他的登陆地也是分布在不同的地区,可能是通过代理的行为,试图绕过相关的风险检测。个人用户一般都是家庭宽带,或者移动WiFi,4G的一些出口的IP,而很多攻击者会租用机房的服务器,跑他的写的一些程序,就会有很多机房出口的IP。

 

盗卡盗刷: 通过充话费这个方式来做套现的,给了不同的地区手机号做充值,但是发现他充值的卡号、手机号分布在不同的地方,像北京、东北、山西等。盗用了账户之后,里面如果有一些钱,可能提现不是特别方便,他会通过其他的方式转移掉,然后套现。

 

短信轰炸:这个大家不一定熟悉, 有一些网站在注册的时候都会让你填手机号,然后给你发短信验证码。有些网站如果做的不好,发短信的接口就会存在安全漏洞,可能会被别人搜集到,写个程序调你的发短信的接口,不停的用你的平台发短信。像某些电信欺诈,骗老爸说儿子出事了要打钱,老爸答应后要打电话验证,发现那边电话打不通了,可能就是通过这种方式,通过下发大量的短信把手机搞死机。很多网站也存在这样一些漏洞,通过程序自动大量下发短信,影响或消耗了网站本身的费用,成本也是非常高。

 

贷前申请欺诈:在贷前申请填写资料时可能会出现相同的设备ID,但填写的是不同的人,或者是不同的地方的IP地址,但设备信息基本都是相同的。这个就是比较典型的中介或疑似中介的申请的方式,或是去偏远的农村搜集一些真实信息。去年曝光医美分期,给50块钱的好处费就骗走了,做医疗的借贷。

 

贷后监控:在最开始贷钱申请做扫描时候,没有发现风险,于是这个网站就给他放了10万块钱,过了一段时间之后,发现了这个人出现了法院执行的信息。之后又发现了他又在其他的平台有借款的行为。由此可知,这个人信用恶化其风险就变得非常高了,后续需要及时的采取措施,尽量去避免损失。

 

打破信息的孤岛

 

一开始讲到,这些网站信息是不通的,都是孤立的。即使有些网站他的用户量比较大,它也是比较大的布道而已,信息的不通畅使得欺诈者有机可乘。想真正的解决问题,就需要打破信息孤岛。 之前我们在阿里去做风控,也有这样困惑,阿里作为一个电商巨头,技术非常强大,但很多欺诈还是不可避免的发生了,因为他也没有和其他的行业做数据共享。新的欺诈者到阿里这个平台上之后还是可以通过,模型再好也很难在早期的时候把它识别出来。

 

我们就需要换一个思路,一定要打破信息孤岛,才能够有效的提升风险防控的效果。不在于你的技术多高超,或是数据分析能力多强。最重要的是要把数据能够连接起来,通过全局的跨行业的关联分析,才能够有效的识别各种欺诈的问题。

 

我需要打通不同的论坛、社交、电商、支付、小贷、金融、银行等等,不同行业的数据。这些不同的行业, 它都有IP、设备,邮箱、姓名,身份证等数据,其中有共通的纬度的信息,然后通过设备ID或其他方式把不同网站不同行业的数据关联起来。只要跟我们合作的客户,设置了我的设备指纹,那欺诈者不管是在哪家网站上登陆,我都可以采集到他唯一的设备ID。这样我就可以把不同行业的不同网站的数据,通过这个设备关联起来,就能做到全局的关联分析。

 

通过纬度建立全局的关联之后,就可以做全局的关联分析和计算此时就能够比较有效的发现这种欺诈的问题,比如在某金融公司欺诈后已经被发现了,再到银行或者其他新平台,我们便能非常及时的发现其诈骗行为。另外,我们也跟第三方的数据源建立了连接,包括公安的身份认证、法院、移动的数据等等,能一站式的帮助客户解决各个场景的风险问题。

 

在风险发生的每个节点做风控

 

我们全流程的解决方案从开始初筛,到注册登陆、贷前、贷中、贷后、催收等等整个流程中,都会提供相应的解决方案,帮助客户识别不同环节的风险,从而把风险控制到可以接受的范围之内。

 

第一,是事前预警,很多“羊毛党”会在很多“薅羊毛”的论坛上去交流,会在论坛中预先发布活动消息,泄露数据消息,甚至包括含有数据的附件。若只做事中防控, 有时会因为信息有限或数据有限而比较难以发现异常行为。所以做事前的监控分析,会把常见的“羊毛党”论坛、欺诈的信息交换论坛等,全部监控起来。也可以让客户自动的去设定一些监控特征,然后自动定时监控,查看论坛上是否有该公司的信息,然后及时预警并告知相关信息,之后就可以制定风控策略,从业务规则上做相应的设定和防范。如果有些网站发现已经赶上撞库了,经过一些事前分析后,观察类似的撞库是否在其他平台也存在,从而那通知其他客户,提前做防范。

 

第二,事中遏制风险,主要通过黑名单的对比,以及根据规则和模型用户的行为特征, 做实时的分析发现相应的风险。这是我们现在风控系统中主要用到的手段。同盾提供的服务,基本上主要是在事中的监控中,基本是客户实时调取数据,在相关方面数据中给客户反馈结果。这个过程通过一些规则、模型做实时的计算,发现是否存在这种风险。

 

第三,事后分析,当然事后可能已经晚了,已经产生欺诈了。但有时在实时的事中的时候,由于性能、数据完整性的问题,会比较难以发现到底是不是欺诈。事后沉淀数据后,有了更多的手段,便可以做一些事后的分析排查,主要是通过复杂网络或关联关系的分析,来排查是否在问题。比如刚才提到贷后的监控的预警,这个我们叫情报系统,监控的有些论坛上,交流大量泄漏的银行会员数据,从而拿这些数据在银行网站进行撞库或其他的操作。

 

风控中常用的工具和手段

 

决策引擎:通过比较灵活可视化的配置系统,配置各种的不同的用户监控规则和策略。包括一些机学习的模型,做事中的防范,这就是我们用到的决策引擎。决策引擎还可以做决策流,不是简单的通过一条规则,是有流程的,面对不同的客户群体和业务场景,需要不同的流程处理。这种在不直接改变线上的情况下做规则测试的模式,我们叫做冠军挑战的模式。

 

决策引擎是比较通用的系统,它底层需要依赖很多基础数据。像设备指纹技术,设备指纹是我们做全局的联防联控,最核心依赖的技术。很多的时候,换账户或者换代理IP, 成本是相对比较低的,但是换一台设备的成本是比较高的,换电脑或者换手机,这个成本比较高。当然也有的专门以此作弊的,通过电脑来操控许多手机的情况也是有的,但相对来说,成本会高一点,当然我们也有检测这种作弊方式的手段。

 

识别设备ID:设备ID是生成设备的唯一的ID。即使换帐号、代理IP、换浏览器或是做将电脑做改动,还是能够识别出来是否是相同设备。就如刚才提到,真的换电脑成本是比较高的,做技术的可能知道,如果在Web端可以模拟浏览器的行为,伪装成真实的客户。像市面上主流的大概有一二十款的安卓模拟器,在电脑上我们可以模拟很多不同的设备。我们就可以通过识别它的特征,辨别到底是不是真实设备,设备是不是被rut掉了,或者是否存在特殊的更改。有时需要通过设备的关联评判风险,相同设备上面在不同平台出现了借款的行为,风险是比较高的。如果大于5个以上的关联的平台,不良率会有明显的上升。

 

IP画像技术: IP是作为反欺诈最古老的技术,以前做用户的行为特征分析靠的是cookie或IP地址,那时候没有设备指纹的技术,只能通过观察IP上是否有很多不同的账户,不同的异常行为等等。 后来欺诈者变聪明了,常用位置等都能通过代理IP绕过去。我们对这些IP做了大量的深度挖掘,把IP分成了八大类,家庭宽带、公司的办公网、移动4G、公共的wifi、机房的出口等等,细分后有明显的好处。

 

如果过去5分钟同一个ID上出现了多个账户,就是设定的规则或者模型有一些变量,是用到了相同IP上,就可以判定这个是高风险的。但是手机用到的IP是运营商提供的公共的IP,同一个IP上可能有大量不同的真实的用户,如果还设定了这样的规则误差就很高。或是有些IP它是机房的出口,作为个人的消费者的IP地址竟然是机房的出口IP,那存在风险的概率就非常高。

 

通过这种细分类别,就可以有效的降低误差或是提升人的识别准确率。在看这个IP之前,先查看这个IP上出现过的用户行为时间,是否有过欺诈、盗号或是“薅羊毛”的行为,那这个IP的分值可能就会比较高,风险就比较大。

 

建立数据关联网络:我们线上大概是200多亿的数据的调用量,然后我们把这些所有的数据之间的关联关系全部都分析了一遍,相同的IP地址、设备、手机、E-mail等等,我们都将这种关联数据建立了关系。通过这些关联关系的分析和建立,可以把整个数据构建成一张特别大的网,输入任何数据都可以找到相关关联关系,也可以做用户的团伙的分析。

 

举一个真实发生的例子,以前我们认为,可能有十多个平台已经不得了了,而这个人申请了大概是半年的时间就有700多笔的借贷,覆盖了大大小小100多个平台,最高每天申请25笔贷款,涉及到13个平台。涉及到P2P网贷、消费金融、小额贷款、担保公司、银行、第三方服务、互联网金融等不同行业的平台。从IP和手机归属的特征来看,IP大部分出现在重庆,当然这些数据网上是查不到的,因为数据肯定不会公开的。最后通过复杂网络的工具分析后发现它是个比较大的团伙。

 

内外两部分的数据结合:除了通过标准化的产品帮助客户识别风险之外,有些客户也存在合规的问题。像银行的部分数据可能是受监管的,不可提取,如果不与第三方合作,他就像以前那种老模式,即使再提升IT能力也不能把风控做好。他需要跟外部第三方的平台做合作,我们就跟他做一些联合的数据,银行的数据可能抽取十个变量,我这边给你贡献五个变量,通过15个变量,就可以把这个模型的效果提升很多。很多客户自己的KS值只用自己的数据可能只有20%几,加上我们的数据贡献之后,他的KS值可以提升到40%,甚至到50%,效果会有明显的提升。这个是现在我们也跟一些大客户尝试的比较多的合作模式。也就是说,要把外部不同的数据有机的连接起来,才能够提升风控的效果。

 

讲一个我们合作的消费金融平台的案例。我们的运行效果是将它的审批效率从30%提升到60%以上,这就需要我们帮助客户去做风控。以前的信贷风控会有很多人工介入,审批中周期很长。在竞争越来越激烈的情况下,很多公司推出了分钟级就可以放贷,包括像微众银行15分钟可以放贷,甚至还有一些推出秒贷的,秒级就可以放贷,那就完全依赖机器的算法,并且依赖大数据的风控的技术。

 

现在风控面临的挑战和机遇

 

第一是开放。以前很多公司,尤其是传统的金融机构,像银行的交易数据,必须部署到银行内部,不允许数据外流。随着现在的互联网金融时代的来临之后, 这种模式越来越难以适应社会的需求了,如果只是把同等这套系统原封不动的搬到银行里面,可能效果也不能得到明显的提升,所以说需要转变思维模式,有一个开放的心态接受新的一些事物。

 

从2013年刚开始创业的时候,与银行合作想调用云端的服务是不可能的,最近从2015年开始银行逐渐转变了,尤其是受到像支付宝、微信等互联网公司的挑战,他们转变的速度现在越来越快。很多银行现在也接受了云端的模式,尤其像直销银行,网上的信用卡申请,消费金融的业务,也直接从云端做对接了,心态变得越来越开放。这样也大量的提升了他们的效率,降低他们的成本。

 

第二是专注。我觉得风控还是门槛相对比较高的行业,尤其是数据的门槛。近些年互联网金融也挺火的,有些原来做风控服务的,看到客户一年净赚好几个亿就眼红了,也要去搞个小贷公司去给放贷,放贷这个收益确实非常快。但是每家公司, 都有自己的专长,同盾的专长就是技术能力比较强,服务做的比较好。在金融的放贷业务方面同盾也有很多数据,即使同盾做放贷也能够把这个业务做的很好,能够把风险坏账控制到很低,但是真正的擅长的东西是技术,不是做业务,如果不能够专注可能最后连风控都可能做不好。

 

第三是用户体验。以前银行就强调安全,要转一笔账需要插个U盾、搞个插件、装个控件,并且以前很多只支持IE6的浏览器,IE的新版本可能都不支持,用户体验非常不好。现在越来越追求用户的体验,当然安全也是必要的,但是尽量对用户不要造成干扰。

 

我们自己的安全也是一样,要想安全就要设置很多预防手段、检测机制,那就让大家工作变得很不爽。本来可以直接打开电脑就能办公的,但是我还先连个U盾再输个密码,还要做个双因子验证。花了很长时间才能登陆,这个对用户的体验来说是很大的伤害,把风控做好,就是你能够无感知的做好安全,尽量减少对用户的干扰。这个就需要非常强大的后台数据的建模和分析能力,这样你在后台都把事悄悄做了,有风险才会弹个验证码,才会触发二次验证,99%的客户在没有感知的情况下就可以体验到更好的服务。

 

大数据是人工智能的基础

 

关于大数据的思维方面,以前传统的思维模式,更多是通过总结专家的规则,风控的人员不断积累经验。大数据时代之后,有很多特征不一定是人工就能想象出来,需要通过数据分析,才能自动发觉特征变量建立模型,从传统的机械思维转变成数据的相关性分析。

 

最后是人工智能时代的机遇, 之前60年代火了一阵,之后一直没有真正的发展起来,一直到最近几年,移动互联网来临之后,大量的用户的行为数据都在网上可以方便的搜集到了。大数据的技术也成熟了,以前一个网站有个几十万,上几百万的访问量已经很厉害了。我可能有几十台服务器已经很厉害了。搞一个DB2的数据库,可能有几千万,甚至上亿的数据,都已经很大的数据量了,到大数据的时代之后,数据比以前10倍,100倍的膨胀。

 

从统计学的规律来看,当数据足够多的时候,才能够覆盖到足够多的场景,尽量减少样本偏差,然后随着海量数据的处理能力的提升,人工智能才有了基础。其实我理解的人工智能就是比较傻的穷举模式,像阿尔法狗下围棋,每人各下一步棋,只要把所有的可能都算一遍,就能找出最优下法。以前机器的计算能力没有那么大,只能看到有限的步骤,现在的计算能力强了,有大数据可以把所有的可能性全部求解一遍,所有的可能性全部跑一遍看看,到底哪个可能性好,我就用哪个,人工智能建立在大数据的基础之上。

 

另外在人工智能时代, 大家很强调地域学习算法,这就是一种架构和工程能力。如果算法很厉害,模型建的也很好,每一步验证效果都特别好。但是放到线上之后,能否有比较好的工程能力,能够把模型在线上应对比较高并发的请求访问,其运行的性能、稳定性包括模型的可维护性、便捷性是不是能够做的足够好,我觉得这个是考验架构和工程能力的。只有把算法、数据分析能力、工程能力结合到一起,才能够把人工智能的技术真正的能够应用的好。

 

 

问答环节

 

Q1:请问同盾有没有针对的B端的方面的相关研究和规划?

 

张新波:借贷给小微企业或放贷的,我们也是有相关业务。其实C类,相对来说,搜集到有限的数据比较准确,C类的数据它的行为数据大部分网上,比较好做预测。B类客户有一个难点,涉及的数据很多。企业到底它的信用好不好,涉及到工商、税务、运营的数据等等很多数据。

 

第二个就是中小企业信息化水平比较低,小微企业的借贷需求最高,但是建IP能力最弱,又没有系统化,数据采集不到,所以做放贷时难度就相对来说比较高。现在,只能搜集到有限的数据,比如工商、法院、企业主,高管、个人的数据结合在一起做综合的判断。尤其我们会结合C端的个人数据查看个人,老板是否有过多平台借贷,或有过逾期的行为。因为覆盖面比较广,大部分都能够找到,最终做出判定。

 

Q2:随着合作方或者渠道越来越多,数据量越来越大,数据的质量会存在的瑕疵就会越多,现在的风控是如何去针对这种数据质量做甄别处理的?

 

张新波:因为合作的客户,总是会有良莠不齐的这种存在的情况,我们总结了几个方面。

 

第一,我们会从商务层面先去拜访。跟他合作之前,商务去上门拜访,观察公司的业务是正常开展的业务,还是皮包公司,甚至可能是想转卖数据的公司,进行相关的核实,是有真实需求的客户存在,确定正常开展业务的公司。

 

第二,我们在对接的时候,我们的服务团队会跟着去,与对方的团队做紧密的配合,告诉他如何做对接,不同的场景应该传什么样的字段,怎样使用我们的服务。

 

第三个,就是我们会用线上的数据做监控和分析,观察客户的数据是否存在异常行为。如果客户忽然发现,某天的借贷量远远超出正常水平,那可能是他有异常数据,需要这个数据做分析确认和数据的清洗处理,大概主要总这三个方面吧。

 

Q3:我们收集数据的时候,无法控制某些非授权类的数据,应该怎么降低这类数据的风险?

 

张新波:我们大部分数据是客户授权过来的,只有部分数据是需要我们查的,像法院公开或是网站上公开,失信的名单、网贷的黑名单等,这些是我们需要自己去查的。还有一部分是授权查取的业务,比如在去借贷的时候,如果没有其他资料可以提交的,就把你的社保的帐号提交给我们,我帮你自动去把社保的数据抓下来,来做分析,这个是需要C端的用户直接授权的。我们与每家客户都需要签关于数据的保密协议的,从商务上也会去做一些约定,我们肯定不能给第三方的。

 

Q4:现在国家的政策对个人隐私和个人信息的保护越来越严格。您觉得大数据的红线到底怎么去界定,或者未来红线会在哪?

 

张新波:两高的法律条款出台以后,我们也研究了一下,主要强调的有几点。第一点,不能在用户没有授权的时候,私自采集用户的隐私数据。我觉得核心的就是,你是否给予用户知情权。第二你是否用在非法的场景当中。如果搜集到数据去做电信欺诈了,那这肯定是不允许的。但是你搜集到这个授权的数据是帮助这个用户的,我觉得问题是不大的。

 

Q5:现在大数据风控的公司并不多,拼的是谁的数据多。但是从三五年这样的周期来看, 大家的数据都非常多,我们怎么比其他的平台领先一步?

 

张新波:我觉得一家公司拼的不仅仅是数据的多少,应该是能否赢得客户的信任。第一是产品能不能帮客户解决问题。第二是技术能力能不能给客户提供持续稳定的服务。第三是数据量是否足够多,能否覆盖到客户的需要的场景。第四是服务的能力,因为2B的业务比较复杂,所以非常强调客户的服务能力。主要体现在两点,第一是客户有问题要有人及时解决,第二是能否帮他持续的做策略、模型的优化、提升效果等。除此之外,我觉得还要看这个公司是否能专注的做这个事情,将你所在的专业领域做到比竞争对手更好,相信客户还是愿意跟最好的公司合作。

 

Q6:在后端的资金方,比如未来银行的管理重点会是欺诈还是风控?或者在整个的产业链中,最终会在哪几个点上会有亮点?

 

张新波:反欺诈是风控其中的一个方面,像现在做消费分期或者现金贷的资金方,它的资金来源就是从银行或者大的机构来的资金, 他关注点可能是不太一样的。这种面向2C的,他更关注的是欺诈风险、个人风险、信用风险,这点是他需要通过间接的风控的手段,来提升风控效率和能力的。至于资金端,说白了是对企业放贷,有些大型消费金融平台,授信可能是几十个亿的大金额面向企业放贷。我觉得起码不是我们现在风控系统能够解决的问题。更多的是需要通过一些线下, 传统的风控的手段,去评估这个企业到底靠不靠谱,业务到底做的好不好,这个风控系统要比面向2C的风控复杂很多,还是需要大量的专业人士通过个人的经验做出判断,单纯的靠继续学习模型解决不了的。

 

现在有些银行给企业放贷,并不是评估平台本身的风险是多大,有很多模式都是资金方直接参与到你的风控里面。个人的2C到消费平台上去借款的时候,直接把数据搜过来,自己做风控,直接对终端的客户做风控评估,这样加强了直接风控能力。之前如果不看2C,直接对2B也是比较难的。将终端客户的行为都搜集过来,直接在放贷的时候实时的风控,风险可能相对再降低一些。

 

Q7:张总可以分享一下如何面对2B的企业客户的经验么?你们是如何达成合作关系的?并到后来一步步发展壮大的?

 

张新波:2B的企业不像2C需要做大量的市场宣传和推广。2B需要一家客户一家客户去谈的,    不是产品好就自然有人使用的。我们最开始创业的时候,没有人是做商务出身的,都是自己去当销售一家客户一家客户跑。最开始的时候,我们想跟银行合作,我们觉得技术也比较好想卖给银行,即使跑了很多趟,银行也很难接受初创公司的产品,虽然你有一点带着阿里的光环,但是没用,有些银行客户我们跑了一二十趟,最后也没有谈下来。

 

最后我们选择了从中小客户开始做拓展。尤其是从SaaS服务开始。一开始我们找了一些关系比较好的,免费使用我们的产品,不用再招工程师花半年时间把它开发出来,用的过程当中自然会提很多需求,于是这个产品会不断地配合客户做快速迭代,不断验证我们的产品和模式。之后,积累了一定的数据,客户慢慢发现有效果了,就会更加愿意跟你做合作。

 

从0到1的冷启动的过程,我们持续了大概一年多的时间。2015年互联网金融火了,互联网金融因为技术力量比较薄弱,而且特别迫切的需要帮助他解决用户问题。刚好我们产品经过一年多的锤炼,也基本深比较成熟了,有这个契机之后就赶上这拨风潮。然后业务迅速的发展起来,有了几百家客户后,网络效应就体现出来了,越来越多的客户愿意进行合作。


本内容未经允许禁止转载,如需授权请微信联系妙投小虎哥:miaotou515
如对本稿件有异议或投诉,请联系tougao@huxiu.com
评论
0/500 妙投用户社区交流公约
最新评论
这里空空如也,期待你的发声