当前位置:100EC>>浅析:看清本质最重要 P2P借贷不能迷信大数据
浅析:看清本质最重要 P2P借贷不能迷信大数据
发布时间:2013年12月19日 19:10:17

(电子商务研究中心讯)  业内在讲到互联网金融,尤其是P2P的时候,特别喜欢提到大数据,大数据可以帮助投资人降低风险,果真如此吗?来自P2P Lending Advice的一篇文章认为,迷信大数据是一个误区,因为P2P借贷中的很多问题大数据可能无法解决。

  以下是这篇文章全文,由网贷之家翻译。

  大数据并非无所不能,你需要了解下面四个关于P2P借贷中大数据的重要因素。

  要素1:大数据只能代表过去的表现

  任何一个曾经通过中间商出售过(或尝试出售)共有基金,股票,债券或其他投资的人都听到或看到过这样一个主题“过去的表现不能代表将来的结果”,确实如此。我们从历史记录中获得的借款人的重要信息,比如支付记录,FICO信用分和负面信息,只能代表他们过去的表现如何。如果他们曾经按时偿还了贷款,并不意味着他们也会按时将钱还给我们。但是这增加了偿还的可能性,特别是如果没有重大变故(如失业或生了重病等)的情况下。没有人知道未来会发生什么,这些信息并不具有预见性,它们只能反映过去。

  要素2:贷款资金池可利用数据少且有时间局限

  拿Lending Club来说,从2006年一开始到2012年11月,他们发布的贷款总量第一次达到10亿美元。仅6个月后,在2013年5月,他们的贷款总量上升到了20亿美元。而在2013年11月,在他们首次达到10亿美元贷款总量的一年以后,他们发布的贷款总量又攀升至30亿美元。(相关文章)这意味着,在不到一年的时间里,他们完成了现在贷款总量的2/3。有些人会说,从这些历史记录中,我们并不能获取有意义的信息,但更多人会认为我们获取到的最有意义的信息是早期支付违约的可能性。贷款资金池的长期数据中我们真正能用得着的很少。

  我们的贷款投资组合最大的敌人是早期支付违约(在支付期前6个月内出现的违约)。我们现在有价值20亿美元的贷款在至少6个月后才能看出谁支付晚了,谁早期支付违约了。另外,由于被发布的贷款时间限制,很难从中获取所谓的有意义的数据。

  要素3:大数据各个孤立的因素是相互支撑的

  数据的应用性很大,以至于你可以搜索星期四一天,加拿大地区,借款人的信用分有750,用于债务合并的贷款。大数据的一个所谓的好处是你可以利用它研究任何有意义或可能有意义的变量。这些变量中,我们在这里讨论的包括FICO信用分,负面评价,公开呈报,所在的州,拥有的住房,工作的时间等等。这些信息是好还是坏呢?好处显而易见,我们可以研究那些我们觉得重要并且能够降低我们风险的因素。

  存在的问题

  大数据处理的问题是这些变量都是分开的,如果把这些变量放在一起,我们能获得很多有意的信息,一旦分开,这些变量就贬值了。

  比如说,信用分依赖于我们之前讨论过的许多因素,包括偿还记录,负面评价,公开呈报,资信调查,有效的信贷循环以及债务与收入比。当我们筛选信用分时,我们已经综合考虑了这些因素,如果进一步考虑孤立的变量,实际上是多余的,甚至有害于筛选条件的质量。因此,如果我们选择的条件包括信用分较高且没有负面评价两项,尽管我们已经知道没有负面评价会提升信用分,但我们依然重复计算这些因素而不是考虑其他信贷因素,这其实是多余的。

  要素4:相互关系并非因果关系

  科学家和研究员对这个短语比较精通。意思是,如果2件事物是有关联的,这并不意味着他们之间一件事情发生就会导致另一件事情也同时发生。这里讨论的一个很好地例子是,我关于以州来筛选贷款的帖子。我们之前讨论了加拿大地区违约率最高,同时它还拥有迄今为止最高的贷款成交量。如果你仅凭违约率最高,就将它从你的投资策略中筛除,那么就意味着加拿大地区所有好的贷款都被你拒绝了。这就好比倒洗澡水把婴儿也倒掉了。

  信用分也是一个很好的例子。我们会很自然地认为公开呈报会减少借款人的信用分,也确实如此。然而,影响的大小取决于何时何事。5年前的个人评估不能作为对借款人6个月前情况的判断依据。6个月内的公开呈报对借款人信用分的影响比较明显,其他方面的对借款人信用分和我们对其支付能力的看法影响较小。

  总结

  你不仅不需要一名优秀操盘手的数据资料,并且如果你没有那更好。因为当我们面对所有可用的大数据时,我们很容易陷入一些我们都可能陷入的误区。如果我们能铭记以上所有要素,当我们分析数据时,我们将会比P2P借贷领域里的其他投资者更胜一筹,同时能更清楚地意识到我们贷款组合中存在的风险。(来源:搜狐IT 文/张睿 编选:中国电子商务研究中心)

网经社联合A股上市公司网盛生意宝(002095.SZ)推出消费品在线供应链金融解决方案。该产品具有按需提款、按天计息、随借随还、专款专用、循环信用贷、全线上流程操作等特点,解决消费品供应链核心企业及下游经销商/网店因库存及账期造成的流动性差“痛点”。》》合作联系

网经社“电数宝”电商大数据库(DATA.100EC.CN,注册免费体验全部)基于电商行业12年沉淀,包含100+上市公司、新三板公司数据,150+独角兽、200+千里马公司数据,4000+起投融资数据以及10万+互联网APP数据,全面覆盖“头部+腰部+长尾”电商,旨在通过数据可视化形式帮助了解电商行业,挖掘行业市场潜力,助力企业决策,做电商人研究、决策的“好参谋”。

【投诉曝光】 更多>

【版权声明】秉承互联网开放、包容的精神,网经社欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源网经社;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至NEWS@netsun.com,我们将第一时间核实、处理。

        平台名称
        平台回复率
        回复时效性
        用户满意度
        微信公众号
        微信二维码 打开微信“扫一扫”
        微信小程序
        小程序二维码 打开微信“扫一扫”