北大未明天使投资集团合伙人Elizabeth Xu:硅谷大数据创业公司趋势

大数据

我们今天会讲这几件事情,我自己的背景,大数据的特征、隐私权还有大数据的大炒作。我 个人认为大数据是芳心未安,所以我的题目是大数据的黎明 ,我们刚刚开始,有很多东西会出现。我今天会讲一些在 美国大数据的应用,还有投资热点 。今天我要讲玩数据、玩技术和玩钱,有多少人感兴趣玩数据、玩数据还有玩钱,举手?我想大家在这边总是要玩一个的。还有我们会分享一些大数据的新的公司。

我先讲一下我自己的背景,我本人是北大毕业,当时学空间物理,之后学大气物理。到了美国之后我学了一个计算机的硕士,又学了一个物理的博士,之后就开始在IBM做经理。再下面我去一家公司叫R,这家公司也很有意思,这家公司是除了中国之外,和亚洲的一些国家之外,全世界的地层,是岩石、沙地,地表的数据,还有一个是钢结构还是木结构的,为什么知道这些东西? 他用这些数据来建模,建模帮助保险公司给你计算你的保险值。 另外在保险公司重组的时候,在保险重组的时候重新计算,我们有200多个精算师,再加上300多个员工,我当时是负责整个全球的产品的开发,这是非常早的时候在那边做了。后来我到一家公司叫V,那是我第一次接触到P,怎么根据这个人的背景情况,根据他过去的P情况来给他推荐旅馆、机票,以及各种各样的产品,所以这家公司也非常有意思。后来我就被A挖去做他们的G,A是在美国一家比较大的D公司,它这个公司是从D的C到D的H,加上D的M,就是说我用了某一方数据的多少,然后我应该付它多少钱,另外我给我的客户提供多少数据,我应该收入多少。所以这个公司并不只是数据,而是一个数据平台。我到这个公司帮忙建立这个平台的时候就会发现,只是死的数据没有多大价值,必须要把这种过去的数据和我们的及时的数据联系起来,把所有的使用者的各种各样的背景全部联系起来,才有最多的价值,所以我们在A的时候和很多的公司合作,他们都用我们的数据,虽然他们说,因为我现在已经离开A这样讲,当时在Facebook做M的时候,他们就用M以点带面,用M的方式把整个公司的内部的数据整合,利用A的H的数据和他们的及时数据把一些匿名的人都可以找到他们真正的姓名。但是A也很狡猾,他不会给你真正的人的姓名,因为有隐私的问题,还有一旦数据离开你的手就不值钱了,所以给他的一定是属性。我在那边负责的是他们的整个数据平台的研发,所以做了很多数据的东西,玩数据、玩技术玩得很开心。去年年底的时候我离开了A,现在专职做大数据的各种各样的产品的投资。对于我个人来说投资是一个非常有兴趣的事情,我是属于第一个吃螃蟹的人,我就跟他们讲说我的Iphone已经用了八支了,特斯拉,我们开车飙车,所有的最新的东西都要用一下,当然衣服也要穿得最时髦一些。所以说我的性格来决定我不怕,有人说我投资一定很多钱,我觉得做投资并不是要钱,而是要胆量,要一种气魄,我希望大家真的想做投资不要想太多钱,要想一下这个是不是可以改变这个世界,是不是可以使我们的生活更好。

我跟大家讲一下我的背景,为什么我会做投资,为什么我会做数据,为什么我会玩技术!

这一张跟大家分享一下,这边坐了很多女生,我想用这个PPT鼓励所有的女生,因为我在美国得到这个奖,这是美国的主流社会白人才可以得的奖,我得到DVP这个奖,真的非常的容幸,在座的所有的女士只要你敢做,只要你认真做,你只要投入,一定会成功的。

这个是我自己对自己的一个总结,用英文写一本书,现在在亚马逊上,我在美国的公司做了很多年,我希望把我自己的经历传输给大家,因为我想华人在美国的话,创业的人毕竟是少数,主要的人还是在公司里做,我希望他们从这本书里得到这种,在公司里上升的一种秘诀,所以这一本书跟大家分享。

现在我们讲大数据。我想这个图对大家来说都是非常非常的熟悉的。就是说在2003年之前,我们产生的数据,现在我们一年或者半年,或者几个月就可以产生,所以我认为大数据洪水是已经来临了。我们至于是被大数据的洪水淹死,还是能够建一个非常好的船,或者建一个非常好的飞机,或者建一个非常好的飞船能够驾驭这个洪水,所以究竟您能不能活下来,就看您对大数据将来的趋势是怎么预料的,如果您觉得这个大洪水是很小的话,你可能做一个小方舟待在里面就可以了。如果洪水是越来越大的话,那我们是不是要做一个飞船了?

这个大数据就是大数量、高结构、多速度,价值在哪里呢?刚才我们两位都讲了, 数据要整合,数据要有速度、数据要实时。

那这个图我非常非常喜欢,到处都是水,但是没有一滴可以喝的,这是一个非常现实的一种情况,我们现在的很多企业,99.9%的企业都是这种感觉,到处都是数据,不知道这些数据的意义是什么,所以数据到处能得到,难得的是从中间搞到智慧。我希望在座的中间大家, 不光看到数据,而且要看到数据之中的智慧。

这一张图也是大家非常清楚的,社交媒体数据、企业文本,究竟怎么把这两个东西整合?

但是新的数据来源,大家都非常非常清楚了。现在apple出现,各种各样的车上的数据,我特斯拉换轮胎,轮胎被扎了,我出来的时候说你们干嘛开我的车,他说我没开你的车,我说车轮胎被扎之前不可能开120迈的,我说你怎么知道的?我说你看看车上的数据,我知道你开过什么。所以现在车上来的数据,我现在在中国可以知道我的车在哪里,这种数据已经说无所不在。而且每个人的电话,各种各样的通信都是一个数据来源,新的数据来源是源源不断的,而且每个人、每个公司都要去用这个。大数据的增长趋势,这张图有人问我真的假的?我说 大数据一定是真的,就看你怎么去理解。

大数据的定义我跟大家定义一下,有一句话特别想跟大家分享一下, 需要新的处理模式,才能具有更强的决策力。 所以我们做投资的时候就在找什么是最新的处理模式。

在我们做 投资的时候有一件事情非常要注意,就是大数据的隐私权 ,有一家公司叫A,他被高德买了,高德被你们买了,所以L是你们阿里的一家公司,L刚开始的时候,他的创始人是一个谷歌的人,他来找我,我们就在讲H的事情,后来他和A做这种合作的时候,我建议他们建一个APP,这个APP就是叫做P,P就是说可以看到你全家的人,或者你的朋友在哪里,像这种想法我跟他讲特别重要的一件事情就是隐私权,你不能够说我走在哪里,整个这个APP都来C,所以隐私权是一件非常重要的事情。

在我的公司里,我们曾经见过一个APP,就叫做M.com,就是一个P,因为在SM我们C1600个A,加上搜索的,所以在很多很多年里面,我们都知道你结过几次婚,你的太太叫什么,你在哪里住,然后你的小孩子在哪里上学,诸如此类的非常非常详细,我们就在开玩笑说你该干M,不用送I,我就会自动收纳,因为我知道你的M,就是说这个数据,对于人的隐私是一个非常大的威胁。所以A有一个O叫做Q,所以说阿里我建议你们大家也对这种P也要非常的注意,因为C有时候就会突然间发觉你怎么拿我那么多东西。昨天我跟车品觉说,数据在卖或者在使用的时候一定要装一个磨砂玻璃,一定要把隐私的东西去掉,一定要满足这样的S。这个在中国没有建立一个完全的S,在美国政府关系、法律要求,企业的行业自律,比方说A,就是我们当时自律的事情,公司的治理,有多长时间一定要P,这些事情都是一定要做的。当时我们在A做A.com的时候为了给大家提供最大的透明度,如果你用你自己的B,用自己的搜搜会进去看到我们公司C你们的D,当然这个D不会用于最精确的D给你,我们用一次比较精确的D都要付钱的,所以你就看到最基础的,最基本的,大概一百多个同时可以看到,而且你自己可以改,所以大家都改了很多,很有意思的数据。我当时开完了之后,大家还是对P很感兴趣的。

数据安全我要讲一下,因为最近在美国数据的安全成为一个非常大的热词,他们居然被侵害5、6个月还不知道,现在美国很多公司做数据的安全方面的,比方三个星期之前去一个大展,因为我自己的公司,投资公司在美国的PP,是美国最大的孵化器,我们前段时间做一个小的公司的大展,其中有个公司做了一个指环,这个指环进入公司的时候他才能烙印,如果没有带指环,他根本不能打开他自己的机器。所以美国用这种东西来结合来保证你的数据的安全。所以这个数据安全是非常非常重要的。在美国如果你泄露数据的话,是会有刑事处分的,一件非常可怕的事情。所以大家对这件事情都非常的注意。

很多人都在炒数据,究竟这个大数据怎么变现?究竟这个数据价值在哪里?大家说新的黄金、新的交易,你可以给它所有的名字,但是它不变成公司的真正的利润,这个大数据没有价值的。我不知道今天神闲在不在,我们两三个星期之前在硅谷吃饭,我们就在说 大数据,数据实际上就像红酒,及时的数据就像冰,红酒是每年都要藏酒,一定要把最好的酒、最精华的酒藏起来 。但是只是藏酒,或者只是苏醒本身并不是最好的价值,最好的价值是把最好的酒、最合适的酒和冰配在一起,所以这才是数据最好的价值。

我们在过去的时候,因为我们 在做投资就要看,过去我们都用使用这些数据,关系数据库、数据仓库、统计、建模,这次我们要看的数据,就是说我们看的技术的话要从哪几个不同的方面来看,我们就看是不是处于很大的量的数据,看这个APP或者这个系统可以处理种类繁多的数据。我们还要看这种APP是不是可以和各种各样的数据的种类可以相结合,所以这些东西都是对我们来说一个非常重要的考虑的因素

那对于企业,企业的最大的挑战就是说从传统的这种企业资源规划和顾客关系这种很小量的数据到一个无限量的大数据。那大家对这种东西应该怎么样做?是不是说我有很大的量的数据,我就要花很多的钱呢?我给你举个例子,这个例子可能也不是说很恰当,你像M,当时想做咖啡的广告,它花了一百个M;可口可乐当时想做它的品牌,它没有花一百个M,它花了多少钱?成为全球第一品牌,只花了50万,它怎么做的呢?它把这50万分成五个小组,这五个小组分别用十万块钱做一个不同的项目,有一个项目做得非常成功,就是叫做H,你们到y2上看,它就把自己和社会的事件联系起来,把它整合在一起突然间就火了,然后使它花了50万美金做的效果比M的一百万的效果还要好。所以它怎么做的呢?并不是随便做一个就好了,它是用它的大数据来分析它的顾客喜欢是什么?顾客人群是什么?用什么样的方式让大家觉得可口可乐是很好的一件事情。所以它并不是随便做的一个想法,而是一个非常贴近实际的情况加上创意的创作,最后成功了。所以在这个企业的时候,就要想一下我用什么样的方式来应用这个非常宏大的数据,或者怎么样用最少的钱来使大家得到最大的利润。

我们简单讲一下大数据的应用。我其实在我们介绍之中讲到了大数据对保险业务的利用。那我现在讲一下医疗保险。有一家公司叫做凯撒,凯 撒做的非常好的就是有人用了数据,凯撒本身又是医院,而且又是个保险公司, 我和他的CIO交谈过一段时间,他在讲说他们最大的目的就是说人进了医院之后最好不要让他回来,不是让他死掉,而是让他非常健康。他根据每个人的每天的吃药和过去的生活的情况来匹配做一种个性化的保险产品。对他们整个的保险的这种是非常好的匹配。做医疗保险的想跟我分享的话可以讨论一下。

电子商务我都知道,我曾经讲过催单,对于电子商务来说,催单在什么时候最合适?在这种情况下,在什么时候要催单?这个Email的C是什么,就S是什么非常非常重要。有的公司说这个人经常星期一早晨、中午看Email,所以在星期一的12:50发一个Email来催单,所以各种各样的应用都有。

这个也是非常有意思的事情,今天时间有限,不跟大家更多的分享了。这种数据的平台刚才卜鹰在讲,最终我们做的平台一定是要做到DS、MS,然后给所有的第三方提供这种S,让他们并不只是用你的D,并不只是用你的M,而且用你这个I来建一个非常有用的APP。然后来J这么多的I。

这件事情也是社交云计算和移动,这三点是最热的,所以一定要把这三点要结合起来,这样才会产生最大的效益。

我们现在讲一下投资。 其实投资我们要从问题来看,太多的数据缺乏分析能力,所以这种精算的工作会越来越多,难以跟上数据上的速度,所以及时很重要,隐私、数据的存取,数据的存取我们最近投一些公司就是做快速存取这种IO的公司。 公司内部整合我稍微讲一下,我刚才讲一下Facebook用M的方式来做,N以新客户的方式来把整个公司的数据来整合。另外孤立的系统没有数据的管理平台,一般的企业都是有这个很大的问题,所以对阿里的话,做一个内部的整合的一个系统,然后各个部门的数据的互动是非常非常重要的。但是99%的公司都做不到这一点。

在哪里投资?其实你看一下就一目了然,其实就是这几个方面。

这个Landscape我稍微讲一下,底层已经是非常的清楚了,一般情况下大家投资在哪里呢?投资在N的方面,然后小的公司一般投N,大的公司就会投IS,还有DS大公司,阿里就可以投DS。然后这种L这种对于小公司,对于很小的投资商是一个投资的热点。NS也是一个投资热点,对于很多SP来说,他们看的数据都是零散的,所以这个是非常重要的,因为人的脑子一般很难把非常分散的数据变成一种形象的形态。

这是2012年的投资热点,现在已经变化了很多。过去没有人投A,现在已经很多了。所以这种投资热土每年都在变。

按行业的这种大数据的投资,就是说企业内部,究竟他们有没有花钱做?这是2012年的数据,现在更多的企业会花更多的钱来做大数据的投资。

这十大趋势我简单讲一下。隐私、数据、搜索、互联网、大数据的云服务,这些东西、这些应用都是非常重要的对我们来说,对我们投资者来说。

核心技术,我归纳一下 核心技术基本上就这四点,就存储、机器学习、存储和个性化的推荐, 核心技术的表现就是这种技术的M,看到很多不同的App应用。我举几个例子吧,这就是大公司,我刚才讲了一下,谷歌的话他们花了上千个人做机器平台。脸谱公司它了很多的精力。Kaiser是和它整个保险业的大数据的方式来减少它的保费的花销,也是非常好的。Data.com做的不成功。有的做的很成功,有的不成功。谷歌最后可能还是一个很大的赢家,我想在中国的话,阿里应该是赢家之一了。亚马逊也是花了很多的金钱在做,我跟他们也谈过,他们新设立的一个VP Data,管整个的数据,他们也是想在M、K上花很多的力气来做。

这些是新兴的公司,比方像Splunk,本来是一个很无聊的公司,但是它后来了很多C、L,突然间从一个很老的公司变成一个很新的公司,它现在在进军数据的方面,这是很重要的。Inside.com,Chimate.com就是建房子,我也建了很多。

这几个是我们最近投的公司。百川广告,是很有意思的一个公司,它是非常聪明的一伙人做的,它也没有M也没有S,这个公司的技术是非常非常好的。Honeycomb是做快速存储的公司,因为我是他们的投资者,也是我们北大的一个校友一起做的,所以我们在一起。PipaHR,非常有意思,它刚开始是做D的,做D做的不是很好,但是它做了一个非常好的MH,所以现在改成做HR方面,把你自己的S,一个R和I做M,它最近已经好了,我们当时看没有觉得很好。在我们开始决定投它的时候,和它结束的时候,大概有两个月的时间,突然就好了,所以我们觉得这可能是投了一个很好的公司。Whowa也是一个北大校友创作的,这是他第三家公司,前两家公司都卖过了,这几家公司都是卖过很多公司或者上市公司的老总重新开的。它是做E,但是它很有意思,比方我们今天800人来这边,它把800人输进去,自动把你在各个社交网站上的东西挖过来整合一下,你就可以看到每个人的内容。我就建议它说你把跟谷歌B放在一起,我可以戴上眼镜之后看到品觉在这边,你小孩怎么样什么的,这个是非常有意思的公司。如果大家感兴趣其中的公司即刻义和我们互动,我时间基本上也就这样。今天非常高兴跟大家分享。因为我觉得大数据真是芳心未安,有各种各样的应用,当你开始用各种各样的S的时候,你会发觉你可以看到你年迈的父母,你可以帮助配置他自己的各种各样的情况,你可以做智慧家庭,你可以看到冰箱里有没有牛奶。我可以知道我家谁进门了,谁到那边敲门了,我都知道,但是在 将来我们世界真是一个数据的世界,然后我们发觉可能将来你的衣服都有传感器,将来是一个数据的世界,但是大家不要只看见树叶,要看见森林,这个森林就是数据的智慧,希望大家在玩数据的时候,玩技术的时候,玩钱的时候一定注意数据本身并不值钱,值钱的是数据的流动、数据的整合和数据的智慧。 然后今天我的分享就到这里,谢谢大家。

End.

我来评几句
登录后评论

已发表评论数()