我的朋友怎么用大数据赚钱

这个决策过程是需要写代码的。

7 月初举行的第一期“约起来@与硅谷精英聊行业痛点:美国大数据商业化变现”。内容整理下来因为已经超过 2 万字,我把它打散成三篇,今天先来听第一位嘉宾 @Dropbox 研发经理 Zheng Shao 的分享。

我主要分享两个案例。第一个是有关 P2P 贷款,这块国内现在很热,然后我是 Lending Club 用户,我在它平台上做投资,实际上你很快会发现:不同技术背景的人,在这个平台做出的收益率不同。也就是说,你大数据处理能力越强,你可能获得的收益率就越高。

首先,这家公司是从硅谷出现,所以它很多投资其实是“工程师”在做,然后它就把很多第三方“贷款”数据都公开,因此这些工程师就可以拿到数据去做分析,然后得出最优投放决策。

这个决策过程,是需要写代码的。我两年前写了一些,然后按代码建立的 Model 进行投资,收益大概可以比 Lending Club 上平均收益率高出 2%。它平均收益率在 10% 左右,我大概是 12%。

收益率怎么增加 2%?

那这个收益率是怎么增加的?整体上要在 P2P 贷款做大数据分析,需要对这方面的“建模”过程比较了解。流程上讲:你要把你一些直觉性思路变成 Feature;然后再把它 Building 到一个 Machine Learning 的 Model 里去;然后去 Tracking 这些 Feature;然后根据结论做决策。对,这个具体“模型”主要是私人用,公开就没效果了,但有两个 Feature,其实可以分享一下,即为什么说大数据对“借贷”有关系。

第一是:有些人借贷时他会说,借钱目的是为把信用卡贷款还清;然后你在公开数据里,会看到他“共欠款多少”以及“他准备借多少钱”这样两个数据。那如果他跟我说:他是为去还信用卡欠款,但同时我发现:他信用卡欠款和从我这边借钱的两个数字不匹配,那我就会认为:这个人可能不可靠。

数据统计结果,这个“Feature”是正确的;还有一个“Feature”是这样:美国有些人付不起药费,因为没有医疗保险,然后他到这个平台申请 Medical Assurance,说我要借钱。

然后,我用大数据统计出的结果:所有这种类型借贷,它风险其实是相当高的,如果一个人只投资这种类型的贷款,那么他不仅不一定赚钱,还可能亏钱。

这里:Lending Club 没有把它利率定得特别高,我猜:公司也有一些“社会责任”考虑,因为它作为一个企业,不能特别歧视这种贷款。这种类型贷款对社会整体是有帮助的,但如果你是一个理性投资者,出发点以挣钱为目的,你可能就不会投。所以这就是通过大数据分析得出的两个结果,就是说如果你不要让这两种类型借贷在里面,你整个收益率会提高,而其中第二个效果会比第一个效果更明显。

Lending Club 优势

我分享的另一点就是:大数据有可能的一个应用前景就像 Lending Club 平台,它最大优势其实是:把整个“价值链”分成很多块,自己只做其中一块,让别人参与做其他,然后一起实现价值变现,而每个环节都可以获利。

它自己这块是收集数据,定价、定利率,把它放上去;而用户环节是在所有 Loan 里做选择。这是两个切开的东西,但我知道可能有些最简单“P2P 模型”它是这样:用户上去后也没太多选择,就是很简单的 A、B、C 选项,然后用户开始选 Risk 最低、Risk 中等、Risk 高的等等。

(插问:中国理财方面前两天看到一个报道,多数人对“理财产品”选择还是基于数字驱动,比如这个利率是 8%,那个是 7.9%,那我选 8%?)

这里有个原因是因为在中国,平台它有很多数据没有公开,比如如果它 P2P 平台告诉你 10% 收益,但历史上它到底做得怎样?是不是每笔交易都可以公开?不一定,有可能只是告诉你部分信息。但美国这边平台可能是把每笔资料都告诉你,所以这种数据完全开放对产业链的细化和发展都有很大好处。

第二个案例:Square Capital

还有一个案例是 Square 的大数据愿景。Square 在美国其实就有点像中国的“阿里巴巴”,它主要是为中小企业服务,然后去年他们推了面向中小企业的贷款服务,叫 Square Capital。

基本原理是这样:因为 Square 基础服务是你们中小商户用我 Reader 收费,然后我可以从你那,获得你每笔交易财务状况,包括销售、成本等,那这些数据其实就可以帮 Square 做判断:它是否决定给一些向 Square Capital 申请贷款的中小企业放贷,因为它之前获得的那些销售数据已经相当是部分企业的“信用纪录”。

Square 而且还有一个做贷款后的“还款优势”,就是因为这些商户向到店里买东西的消费者收钱都通过 Reader 来收,所以这些商户可以“每次”(分期付款)都通过这个工具直接还,这是一个很好方式。

中国大数据面临问题

中国大数据发展到现在最大问题可能是:每家公司都以自己数据为重,就是不共享,不愿做商业上合作。这方面,美国想法可能简单很多,基本就是市场行为;然后不完全免费,但企业之间合作相对更容易。

现在情况就是:整个大数据环节发展很快,我觉得大数据最重要一个东西就是要有一个“生态环境”,因为它价值最重要是把所有数据放一起,做“关联性分析”,如果每个人只有一小片,那么其实谁都发挥不了大数据最终价值,这个是我自己最深感受。

我在国内好像看到过贵阳有一个大数据交易平台,不知道现在情况怎样。可能还刚刚开始,这个事由政府来做有好处,政府有很好资源,可以一下打开,所以我觉得贵阳做这样的事是有帮助的,但要把它落实,现在看他们数据总量还很少。

-------------------------------

“约起来@与硅谷精英聊行业痛点”栏目赞助商:活动家 App

“活动家”是一个会议门票交易和会议经纪交易平台。聚合各行业商业会议,解决用户找会议难、报名支付手续繁琐、会议主办方邀请嘉宾入驻邀约困难问题。

(本文版权归硅发布所属公司所有,未经授权,任何组织、机构或个人不得对作品实施转载。)

热门文章HOT NEWS