主题:中关村大数据日RONG系列论坛之七
大学大数据大责任高峰论坛暨数据创新(清数D-Lab)
时间:2015.12.13
主持人:各位大数据产业联合会的会员、各位领导、各位来宾、各位老师、各位同学,大家早上好。我是联合会的秘书长王霞,也是今天的主持。去年的10月26号,大数据产业联合会宣告成立,在过去的一年中,我们跟数据科学研究院一起做了几十场论坛、小的沙龙活动、大数据日,包括我们即将跟大数据硕士班的同学举行的第二次联欢。这些活动目的都是为了怎么样促进大学和产业界之间,产业界和上下游之间怎么增加沟通、互动,大家一起做出更多的事情。今天的论坛叫大数据大责任高峰论坛,大数据时代有一些技术已经发展得不错了,有另外一些事情,关于安全、隐私,大家能够最大限度地共享数据,能带来更大的价值,同时也要对数据做一定的,这些问题现在在我国从法律、实践层面都在一个摸索的状态,所以我们今天特地邀请到在大数据治理方面颇有研究的张茉楠博士,我们邀请到了大数据先锋企业清数D-Lab,一起和我们探讨一下,在这个时代我们从政策、法规、伦理、应用技术,当然还有大学的学者一起讨论,怎么样持久地进力良性的大数据的发展,能够让大数据更好地促进经济、社会。
今天这个日子是比较好的日子,叫12.13,12.13另外一个解释是一爱一生,所以希望大家对大数据的爱、对大数据联合会的爱能够保持一生,谢谢大家。
今天其实也是我们联合会成立一周年的庆典,感谢各位来这里为我们庆生。联合会成立一周年,除了教育方面的论坛、会员活动,除了促进会员之间交流的项目对接、资本对接,我们还做了一件什么事?今天大家就要共同另外一件事,这件事是数据创新要揭牌成立,说明大数据经过一年的孕育,要生一个宝宝了。
我们现在有请启迪创业孵化器有限公司董事长张金生为大家致词。
张金生:尊敬的韩老师、王霞师姐、各位大数据联合会的会员、各位嘉宾,非常高兴今天能来到这个地方和大家一起共同大数据论坛和清数D-Lab揭牌仪式。我来自于青花科技园,科技园作为服务社会的大学,已经成为了世界上最大的载体科技园。科技园在聚集、聚合、聚焦、聚变的“四聚”发展模式下,已经成为创新创业的高地,已经成为创新培养的摇篮,已经成为科技重要的。在未来,科技园要着力打造一个专业化的孵化器,今天启迪创业孵化器和大数据联合会共同发起大学大数据创新的发起仪式,这是我们在创新创业培养、在科技的、在创业企业的孵化方面,迈出重要的一步。
随着大数据创业万众创新如火如荼地在中国的大数据上进行,企业的创新、人才的培养越来越重要,我们也感觉到我们对创业企业越来越重要专业化的帮助和扶持显得尤为重要,今天科技园、启迪创业孵化器和大数据一起,在大数据研究院的支持和帮助下,为大数据企业的创新、人才的培养做一点力所能及的事情,我们感到非常高兴。
科技园经过21年的发展,在全国已经形成了非常广泛创新创业的载体,我们在全国几十个城市有我们的网络,我们累计孵化的企业已经超过了两千多家,我们孵育的企业在资本上上市的已经超过四十多家。我们相信在未来,我们在大家共同的帮助下,在各方力量,尤其是大数据联合会会员的帮助和支持下,我们对于创业企业的帮助、对创新人才的培养,尤其在大数据创新创业方面的支持和帮助显得更为重要,让我们一起共同,在接下来的时间里,大数据创新在中国的创新、创业,中国的数据方面,在大数据的创新方面能够起到一定的作用,谢谢大家。
主持人:谢谢张总。下面有请清数D-Lab主任邱东晓为大家揭晓数据创新是什么样的。
邱东晓:我是数据院联合会的邱东晓,也是大数据创新,我们称之为清数D-Lab的负责人。大数据生态需要一个和信任的创新平台,既有得天独厚的资源和影响,数据院和联合会也聚集了一批有情怀、能力的人士。天时、地利加上人和,经过联合会共同的努力和数据院的支持,清数D-Lab现在成立了。
前两天在准备开幕的时候就在想怎么开始介绍清数D-Lab,就想到了这么一块牌,二十年在在五公里的地方树了这样一块牌,中国人离信息高速公向北还有一千米,从互联网时代过来的人都知道。所以我们就在校园门口也树了一块,我们写着向左100米,大数据等着你。咱们这次离大数据、互联网近多了。
和上次是一样的,时代同时同样在,我们就要负起我们的责任。大数据、大责任。我们的定位或者说是助飞大数据产业。这意味着我们的角色是产业的服务员,正如行业长常说的,我们其实是大家的垫脚石,包括在座各位以后就像长征火箭一样起飞,我们其实是垫脚石、发射台、助推器,我们要服务于学校的教学和科研,也要服务于企业的人才,我们也要服务于公共部门的数据和数据创新,清数D-Lab其实是大家的大数据实验室。
我们工作的主要内容是什么?先从大数据发展三个挑战说起,人才、技术、创新。昨天我们在大数据的时候听到每一个嘉宾都提到了大数据人才的缺乏,我认为一方面是因为大数据发展快,人才供不应求。另一方面,培养大数据复合型人才其实是一个复杂的过程。对此清数D-Lab和联合会一起配合做两件事,一件是为大学和企业开发各级的大数据课程,要引进企业的数据进行教学。这里各位联合会的伙伴都要提供帮忙。第二是提供活动,就是让不同背景、不同专业的人在一起互相学习、互相帮助,所以人才就来自于这个屋子。
第二个挑战是数据分割,我们经常听到同一个企业、同一个地方的数据不能互通,这里面其实是有政策、标准、技术、人为等各种原因。今天我们的论坛也会涉及到这个话题,我们认为数据融合有几个阶段,就像现在数据分立的阶段,我们要做好各种数据、各种标准,这个在国家和企业层面,清数都有开始合作,还有很多事情要做。下一个阶段实际上是部分的数据连接起来,我们要做的是帮助企业的业务创新,要形成局部突破。在这方面希望我们能以实验室的本事,收集更多足以做实验的数据,方便大家在做创新、突破。第三个阶段是数据大融合的阶段,这个阶段会导致产业的融合,我们希望这个平台能够在人才输送、横向融合、技术创新,甚至在资本的里面都能给大家做好服务工作。这个数据融合也不是一步到位的事情,实际上我们认为是愚公移山的过程,我们要有这个心理准备。和连接是大趋势,这个过程是曲折的,但是胜利是一定的。
第三个挑战是技术挑战,技术落后,我们经常听到一个说法,大数据技术不是问题,其实主要是为了强调大数据思维。大数据应用,有点像小煤矿,煤矿背着箩筐挖了一矿煤,大数据没什么。实际上不是这样的,有环保、衍生品、质量等问题,甚至还要考虑雾霾的影响。这些说明了大数据实际上是高技术。我们昨天开会也提到这个话题,实际上大数据还早着呢,院士有提到,在分析基础、计算模式、物理算法、判断标准上,大数据还有很多要提高的地方。对此,清数D-Lab要做到技术创新的职能,针对大数据生态和产业链关键环节,我们要重点攻关、孵化、推广,从收集、储存、分析、应用,我们要形成学校和企业的合作。我们也要引进国外的人才和技术,这样才能够形成一个达到国际领先水平的技术突破。
以上谈到的三点:人才、数据、技术,其实是相互关联的。业界有的在人才方面特别出色,有的在数据上特别出色,有的是在技术创新也形成了一个各式封闭的系统。我觉得这三个东西其实是没有办法的,解决这个完整的东西,他们是互相关联的。清数D-Lab是、信任的创新平台,在这方面我们都能起到积极的作用,因此能为大家带来更多的价值。
为企业做才和数据的准备,在创新方面就有了基础。我们要特别指出,这里的创新不单是指技术,我们是提到了技术创新,那是因为技术创新是一个根本性的创新,商业模式或者应用服务模式的创新也是重要的成功因素。打开思和视野企业才有飞跃,现在比较有影响的企业,某种意义上也是数据服务的提供上,在亿到百亿的规模。因为大数据本身是个工具,是一个使能者,要做到千亿级的规模或者更大,要跟传统的产业结合。但是清数D-Lab我们希望能够带来更多的跨界、跨行业的交流,相信在这个过程中,在合作的企业中会有千亿的企业出现,大数据时代一定会带来这样新的企业,这样的整合也一定会发生。所以我们现在就要抱团,现在就要一起成功。
我们一定会成功是因为有大家,这里要感谢众多的合作伙伴,在这里都谢谢大家。我们也欢迎更多的伙伴加入,一起发展。清数D-Lab在园内学研综合楼B座八层,请大家莅临指导。致敬一下乔布斯的创新,One more thing,我们的清数D-Lab是DATA这四个字母组成的,我们以DATA为数据,是因为认为DATA是我们必经的时代,数据本身不是目的。我们的是数据融合一定会到来,清数D-Lab为什么存在?是应用数据,人类,我们的和理想总结起来就是大道之行,数据大同。
互联网二十年过去了,未来二十年大数据,未来二十年的历史,我们一起来写,谢谢大家。
主持人:下面做一个游戏,大学数据研究院韩亦舜院长和启迪孵化器张金生董事长,有请二位。
(揭牌仪式)
主持人:下面进入环节,有请大学数据科学研究院执行副院长韩亦舜老师为我们做大数据、大挑战、大责任的。
韩亦舜:比我更专的人有的是,实在是职业所在,又是我们自己的事。
大数据时代是我们无法回避的一个话题,最近参加这类活动比较多,很多人问跟我有什么关系,这个关系挺大的,而且这个时代可能带来的变化非常之大。我们遇到了很多挑战,意味着很多责任。所以这次论坛真的是我起的名字,大数据、大责任。
因为工作的原因接触了很多人,讨论了很多话题,所以觉得这个事应该拿出来好好说一下。我给我的题目起的名字叫大挑战、大责任。11.11的时候谁参加过剁手党,买过东西?我们来看这两张图,一张是春运,一张是十一黄金周。为什么这个时候拿出这样一张图来看?(图片双11来了),有联系吗?有什么联系?一个是时尚的网上采购,一个是那么拥堵的线下,但是实际上我们应该想一想,这就意味着资源的不均衡利用和商户的不当得利。春运的时候大家都希望用最短的时间回到家,但是最后导致社会资源的不均衡。十一黄金周、春节都会有这个问题,其实到大数据时代有同样的问题。据说11.11狂欢购物节之后,最后的比例之高,很多人有购买下降,会导致资源不均衡。在那几天商家忙得不得了,最后服务器和带宽的需求量都会下降,还有一个是社会上物流的比例、使用率会下降。这些其实并不一定都合理,早期还可以,但是我觉得我们这些从事大数据的人有责任来思考,当我们把一个本来可以用虚拟的方式做得更好的时候,我们是沿用了一个传统的方式,做得依然跟传统的事情一样,资源不均衡利用,是一个很的事情。
说第二个,大量冗余的数据一文不值。我之前跟很多人聊过,这个可以是新愚公移山,太行山挖山不止,挖一点会少一点。但是数据山不一样,你从这边可以刨出金的东西,那边可以出银的东西,再从另外一边刨可以出其他稀有的,但是山还在,而且会越长越高。今天我想提出另外一个思考的角度,在座的是不是大家手上都有跟别人几乎一样的数据?每个人都从网上扒一点数据,每个人都存了一大堆别人那里也有的数据,这个其实我们。用着方便是一方面,但是是不是大量冗余造成社会资源浪费?有些时候我们觉得我们花了钱了就有理由浪费,或者别人没出钱,不能管我。所以我们有没有可能把大家共用的数据放在一个地方,让大家随时可以用。所以智叟忽悠愚公每天堆山不止的话,是坑你的。数据在于挖山不止,在于利用,包括现在很多的数据没有充分利用,是一种浪费。
数据中心怎么建?这张图够高大上、够代表高科技了吧?它会幻化出什么?我随便找了一张图,但是我想说的是可能会出现科技地产,究竟有多大的意义?其实金坛中国各地都在争要盖数据中心,但是据我所知,普遍的设计量和实际装机量,实际装机量不足设计量的10%。一方面本身就是设计和实际装机差别这么大,这里面有一些问题。中国定的绿色能源、绿色数据中心的标准是1.5,这个数值直接影响到每据中心运营的经济指标和能源能耗指标。但是我知道在一些发达国家,像Face book、Google的数据中心指标要能够控制在一点零几,今天我们建立的数据中心都面临着怎么样不成为新的能耗大户,所以今天在抢建数据中心的时候要考虑一下,会不会成为下一代能耗大户,甚至对水的资源、周边其他的都可能有这样的影响,千万要注意。
数据是挑战机会,这张表是英国一家公司做的,他列出了如果作为,应该有一些标志性的数据,的开支、预算,我们现在有一些把预算能够单列出来,但是开支不行。这里面第一个列的是英国伦敦把超过250英磅的开支全部向,这个其实是我们执政自信的表现,我们告诉老百姓钱花在哪儿了,让老百姓监督。很不幸,到了2014年,中国排名从2013年的36降到了57,中国一直在进步,这个没有错,但是可能在这个纬度,我们中国落后的,我们走得比别人走得慢。
最后,生产力的前提是生产关系的变革。前不久我们请的校友讲过一次中美创新的比较,其实他讲到一个很关键的是,中国比较多的是所谓商业模式创新,美国比较多的是技术创新。说明技术不容易,有很多的机变。在中国更多的技术都被生产关系所,所以我们可能更多的需要去关注打破生产关系对生产力的,才能出新的能量。但是不要以为这件事只是的事,我更多愿意让大家思考,是不是我们手上每一个人都有我们不经意中就把某些生产力给了?如果有,大家回去检讨、改变,争取把所有能够出来的生产力都出来。
讲下一个话题,大数据、大责任。我的数据,你的责任。这里说的我不是我个人,而是数据拥有者,你指的是采集人。有人跟我探讨数据的权属怎么定,我今天仅仅是做一个引领性的思考,我觉得数据可以比较简单地划分为跟人无关的数据和跟人有关的数据。比如说自然界的,天气、海啸、地震、石油等,这些跟人没有太多直接关系的数据,谁采集谁就可以拥有。但是跟人有关的数据,谁采集的时候就要注意了,这个数据是我的。
那么我想告诉大家,我们每天都会遇到各种各样要点的同意,大多数情况下都接受了。如果你拿苹果手机,你愿不愿意把这个屏幕给别人,然后就点同意了。这个背后,当我跟数据采集者之间建立这种关系的时候,我们之间应该有一种契约,我的数据给你是因为你向我提供了特定服务,如果你不加说明、不加处理就把我的数据让给别人,这应该是不合理的,至少不是在我情愿的情况下,这个我们大家都记在心上,采集别人的数据你要想好,你要对别人的数据负责任。
数据,责任。我随便找了几个图,这是比较典型的外滩踩踏事件的情况,所有的信息应该合理加以利用,现在更多地是强调要保障数据安全,但是实际上这个背后蕴藏着很大的,对社会的一种新的不负责任。就是说这些数据不加利用,对我们社会也是有害的。所以怎么样把的数据用好是的责任。
个人的医疗健康信息,我们每一个人应该有一个自己的空间,在这个空间里属于你自己的个人隐私。但是当你走到街上的时候,你还说那个数据你要拥有、有权删掉不一定合理。还有讲到个人的健康数据,我们应该换位思考,每个人当医生的知识、技能叠加在病人的情况下,得到成功或者失败的病例时,其实这是人类的财富,我们不应该以个人的隐私加以。所以怎么界定什么叫个人的数据?当你在一个私密空间里的时候可以考虑你的隐私,但是当你真正走到社会上去的,完全强调个人的隐私而不是你的数据可能会对社会产生的社会价值、对人类的价值时,这样的隐私概念也未尝见得。
严格立法,数据、数据造假这件事是要负法律责任。今天我们在很多地方都有这个情况,就说我们的数据就是假的。我觉得数据给我们的机会是让我们把这个世界看得更真,如果有人造假,就是重新干扰我们认知世界的技能,所以不应该允许数据造假,哪怕数据不是那么漂亮,只要真实都是有需要的。相反,漂亮的假数据都一钱不值,而且还影响我们认知世界。提倡每一个人在过手数据时,在自己填写数据时一定要真实才有意义,才有经济意义和社会意义。
最后讲,其实传谣的事不用多说,我不说更高,只说责任。你不应该在大数据时代,由于发生变化,由于互联网,我们会的一个千里之外的人,我希望大家在经手传东西的时候,最好多一点思考。千万不能够轻易地就把一个不靠谱的东西大肆宣传,并不是说每个人都有权认证,但是将来有一天,如果你在传的过程中还添枝加叶,这就会比较复杂了。
所以大数据是今天比较高大上的一个事,但是并不直接意味着代表先进的生产关系,代表我们可以随意地用,只要带着大数据,我就可以数据,不是。所以我希望今天在座采集数据的人,真的管好自己。我觉得就相当于美国有存货的地方,我把东西交给你你应该保存好,你如果没有保存好,你的保安部够格,最好别揽这个活。所以要想大数据,最好是有哪个金刚钻,才揽这个瓷器活。谢谢大家。
主持人:韩院长从比较高见的角度讲大数据世代友哪些挑战,另外从数据管理、治理、利用产生价值的过程中,个人的责任、企业的责任、法律的责任、社会责任和方面的责任,谢谢韩院长,我想肯定会给大家带来很多的思考,因为关于责任这个问题其实是最近大家讨论得比较多的,想让数据产生,就一定要有好的治理结构、好的办法管理。
今年8月份,我们出台了促进大数据产业发展行动纲要,表明我们中国把大数据提高到国家战略的层面。从国家战略层面的角度来讲,数据怎么治理对我们国家数据主权或者数据强国应该是什么样的意义?下面有请张茉楠博士。
张茉楠:因为一直以来都知道是中国最高等的科技学府,是创新的前沿阵地。但是实际上这一段时间以来,我发现我们的数据科学院不仅仅是科技高地,更是意见领导的高地。刚才韩院长谈到的我非常,当下举国掀起大数据发展热潮的时候,能给我们提供这么、冷静地思考,尤为难能可贵。未来中国的发展大数据不仅仅是一种运动,更多的是怎么让中国的数据产业、我们的数据科学更加、文明,更加有责任、可持续,我觉得这也是我们数据科学院未来肩负更大的责任。
今天我的主题是数据主权与跨境数据治理的问题。今天的主题是大数据、大责任,我的思更多的是大责任、大数据。整个儿通篇逻辑从强调责任、主权和我们现在的权益所着眼的,跟大家分享一下我们的一些研究和观点。
从我的理解角度来讲,其实大数据并不单单是一种技术创新,一种科技的文明。其实他从更大的角度来讲,我认为他是对我们人类社会生产方式、生活方式,乃至于整个儿社会治理架构重组。从这个意义来讲,包括现在数据层面上,数据主权已经成为国家新的数据典型代表。另一方面,我觉得在大数据时代,首先要强调价值,价值是我们大数据发展的根本。围绕价值来看,现在的数据背后数据主权、数据治理、数据责任以及数据文明与数据伦理问题,我认为是未来我们去创造整个儿社会大数据发展的核心。
在这样的情况下,我觉得我们去探讨这些问题本身就,肩负着这样一种时代的社会责任。今年《大数据行动纲要》出台之后,包括未来“十三五”规划当中,数据主权是一个关键词。数据主权更多强调的是权益和归属制,但是我认为更多的是站在人类发展的文明,特别是中国要从原来农业文明、工业文明更好地迈向信息文明,实际上是对文明层次、社会哲学层面上的一种提升。
不能说 的秘密,总结为七大方面的来源。第一个是“扒”。第二个是“偷”,这是调侃的,更多的是企业在没有真正归属的情况下利用这些数据。第三是“授”。第四是“换”,通过互联王交换来的数据。第五个是“建”。第六是“包”,数据周期让下游去做产业数据。第七个更极端的是“吹”,本身没有数据,但是实际上吹大了也有人信,所以从这个角度来讲,我们又回归到责任本身。大数据时代,我们真正的社会文明是利他主还是利己主?在现在的框架之内,我们要想一个问题,谁拥有、谁监管、谁控制大数据的利用?这样数据归属权的问题,我觉得都是不可回避的。
今天的主题是数据主权归属到底是谁的?现在从全球范围来看,大量数据聚合产生体量级的变化,带来非常大的问题,整个儿社会数据资料越来越方便、便捷,但是数据治理和数据管辖的问题是不可回避的。另外一个层面,因为大量的数据是在不同主体之间所产生和流动,本身个人的数据、企业数据、的数据亦或是公共的数据,这个归属权最终要归属到哪个集体身上?这个常激烈探讨的话题。所以我认为很多国家,像美国、欧盟等一些先进化的国家,已经把数据主权上升到战略层面和社会发展主流的层面。
我把主权分为三类:国家、企业、个人,这三类的数据是有不同的属性含义。
举个例子,在不同部门涉及到不同的议题,这就涉及到数据的生产者、过手者、交互使用者,这样一来,责任主体自身的责任是很难认定的,在这样的过程当中,我们如何规范这种责任常突出的议题。从美国现在发展的趋势来看,比如说美国总统顾问就提出来这个问题,在技术轨迹转向载机、使用和储存的过程中,原有的隐私框架正在发生改变,无论你的数据是个人、社会、国家,最关键的还是来自于数据的拥有者本身,也就是每个个体。所以美国在最新的大数据产业发展当中,也提出对个人数据隐私的。
其实这种数据主权跟我们原来所说的资产的含义有非常大的差别。比如说有多层的含义:数据管理权、数据控制权、数据人格权、数据财产权。在数据包含各种各样的种类主权之下,涉及到社会和契约层面、身份认证、、法律架构、意识形态与价值,所以整个儿是社会文明的包容。从这个角度来讲,数据主权和数据责任是治理和社会治理需要关注的重大话题。
因为现在整个儿社会的基础设施在发生变化,原来用的是钢筋水泥,现在所有的数据上网之后,现在很难界定数据归属的问题。从控制层面来讲,数据鸿沟的问题,已经产生了非常大的影响。
这是我们现在做的相关研究,从全球层面来看,数据资源分配严重不平衡。中国是现在全球增长最快的数据大国,数据增量几乎排全球第一位。但是现在全球的主服务器13台,其中有10台都设立在美国,所以美国实际上掌握在全球互联网资源和数据资源分配的核心地位。从未来的情况来看,我觉得既然是一个打破原来的数据霸权和数据垄断的格局,需要全球去建立这样一个多中心而非单一中心的治理机构。希望在未来全球的互联网资源分配上,能考虑更多的平衡和主权的问题。所以我们这样的也是能够更多地回归到互联网逻辑设计的初衷,强调数据和数据平等。
现在大家都在关注美欧《安全港协议》,体现非常大的一个问题,国家与国家之间数据主权常激烈的。美欧之间的《安全港协议》和美国自身的《爱国者法案》有非常大的冲突。因为《爱国者法案》是强调美国能够更加自主地获取在美国运营商之外的数据,对于其他国家来讲,他的数据能力和数据掌控能力是远远落后于美国的,在这样的框架之下,也是为了美国可以更好地或者占有欧盟的数据提供了便利。所以对未来涉及到个人隐私和跨境数据主权未来带来了非常大的挑战。这是今年10月份时,美欧终止《安全港协议》埋下的附笔。未来更多有能力的国家提出占有数据,也就是说得数据者得天下。最新的TPP协议中,国将来不能这些国家里的企业将数据存储于本地数据中心。在这种情况下,那些真正有真正数据强国和数据技术能力的国家,可能会掌控更多的数据资源。这样数据主权在国与国之间的竞争会成为未来非常重要的矛盾和挑战。
第二大方面,融合是我们未来的一个趋势。但是我认为在数据治理中还是存在这样的悖论,共享与安全保障不可能完全达到平衡,在这样的情况下,既然我们要推动数据共享,我们如何构建一个可持续发展的大数据生态系统?我认为最关键的就是要建立信任平等、的数据文明,有数据的价值体系。这个可能也是未来大数据发展价值的风向标。
G8签订了《G8 数据宪章》,我认为数据正在从时代。但是这两个不是同一个含义,第一是占有数据,有什么样的能力。单一第二个是占有数据有什么样的责任。在未来大的发展趋势之下,真正地数据的责任,一定是责任社会。
在整个儿全球数据当中,各个国家非常明显的例子是与立法是先行的,比如说美国在1966年开始就确定了《电子信息法》,接下来2001-2002年都建立了数据和数据立法的基础。但是从中国的情况看,我们这方面还是空白的。比如说现在尽管已经有了数据法律方面的研究和探讨,但是在国家层面并没有做一个顶层设计的考虑。
另外,在中国掀起的数据的热潮,首先没有确定数据主权的情况下,这个数据是否可以交易买卖?认为很多企业和部门应该把责任放在第一位,我们在追求社会市场经营价值的过程中,是不是完全一味地追求利润最大化而数据生态。如果我们没有尊重数据产权、隐私权和整个儿社会的公平之下,我们这个数据交易是不是存在真正合理的社会基础和法律基础?我觉得都是需要我们探讨的。所以我们现在也正在研究有关数据法律和数据立法的研究,我希望尽早能在国家层面上指定的数据保,确定每个数据拥有者的责任和我们所有的。
在国家层面上,这种数据安全成为国家层面的非传统安全的核心,包括美国、欧盟、日本都制定了三观在大数据时代的战略,美国网络安全、采购战略都是从国家最顶层确定大数据时代国家主权和社会安全真正的体系,但是从中国目前来看,尽管已经有了我们的网络安全战略,但是在我刚才谈到的,从框架、治理框架、社会的价值基础方面,中国还是空白或者远远滞后的。
最后一个问题就涉及到跨境数据治理的问题。随着数据的融合和数据的流动,大量数据不仅仅是存储于国内或者在国内所拥有,包括跨国公司、个人主体走出去涉及到跨境数据治理的问题,治理的问题就涉及到责任怎么分担?比如说原来的数据主权属于一个国家领土范围之内的,但是随着数据的跨境流动,这些服务提供商是遍布全球的,怎么去界定这样的数据责任划分?也是我们未来的一个挑战。再比如说像基础设施的问题,全球互联网的基础设施都是没有公益的,全球如何治理的问题也充满挑战。
比如说现在的跨国公司未来都会成为一个全球化的公司,这个过程中可能就会涉及到跨境数据治理的挑战和难题。比如说有些国家出于对本国产业的或者本国跨国公司的数据主权,在涉及到数据安全和管控方面会有很多的冲突和相应的框架。对于中国的很多企业或者跨国公司,法律治理方面或者数据治理方面是不是需要现在加以考虑?我觉得这对于我们现在很多的企业也是一个重大的挑战。
现在全球层面上已经有了这样一个涉及到数据隐私和数据的框架,包括APEC最近提出的CBPR就是针对数据企业和企业主体全球范围内的数据具体传输区域性的规则。提到的包括避免、通知、收集等,对现在整个儿区域范围之内的数据传输活动有一个很好的规范。截止到目前,APEC国中8个发达国家和13个发展中国家已经加入到这个框架当中。但是我们并没有从区域层面上加入到这个框架之中,所以我们希望中国能够尽早地承担数据责任,尽早地加入到CBPR这个框架之中。
我觉得不负责任的状态最大程度上了人类的恶,但是从人类自身的角度来讲,我还是相信人性本善。所以就需要我们有更大的义务和责任加强对数据时代的责任管理,所以隐私只能通过信任获得,最后的结果就是信任越多,责任越大,所付出和收获的也会越多。所以我觉得今天我们数据科学院确立大数据、大挑战、大责任这样的时代背景,是为中国从工业化文明向真正的信息化文明提供了一个非常好的价值风向标。所以我们作为一个参与者也希望能够加入到责任分担的过程中,谢谢大家。
主持人:下面有请业界大数据行业的翘楚,他们要跟我们分享一下在不同的领域里,大数据到底能够给我们带来什么样实际的价值。下面有请蚂蚁金服副总裁&首席数据科学家漆远。
漆远:刚才邱主任提到非常有意义的技术、人才、产业创新,三个非常重要的方面结合起来。今天我主要从技术的角度讲一讲大数据背后有什么技术,讲一讲云计算和智能。今天我一个朋友发表的一个文杰,怎么学习战略?从很小的数据学习。很多问题不是刚才提到的数据大量,企事业是我们怎么把数据用好,模型怎么预测等,其实有很多真正的问题。
下面简单介绍一下阿里巴巴在蚂蚁金服的一些努力。首先我觉得从计算机课题的角度看,我们看到一个很简单的曲线,横轴是时间轴,纵轴是每一次计算设备的变化带来的用户的变化。每往上翻一倍,就是10个Malnme的增长。第二个是互联网时代,用户数量在增长。到2011年英特网、计算机、手机、MP3、电子手表,这是一个很大的改变。这里面很多政策层面的问题。
从大数据背后有很多商业模式产品的创新,以前叫IT时代,我们可以做各种应用的日志、操作日志,做完之后把数据提取出来看报表。今天我们做什么?今天我们要做的是DT的时代,通过大量的金融数据、消费习惯、行为分析等等,希望通过这个数据产生一个价值,能够服务到用户。
在金融行业,其实金融就是一个数据的行业,所有的都是围绕数据来谈的。从数据衍生出支付、理财、保险、融资、金融云、征信服务等等,这一系列的背后都是基于数据。大数据真正赋能服务变成随时随地可及的服务,传统金融有用户,要和很多的网点、ATM、POS机等等打交道,有时间和距离上的。今天互联网金融,用互联网的技术、大数据的技术来达到一个低成本、个性化、随时随地可及的服务,真正把用户作为一个中心。
有一本书专门讲长尾经济,长尾经济在金融上非常明显的反映,传统金融是美国当年立下汗马功劳的一个百年老店发起的,服务的对象主要是中小企业、大型企业,美国的金融行业常发达的,但是今天在互联网方向,中国的发展在某种角度比美国还要热,某种角度上是我们占了一个机会,现在的相对银行业还是比较弱的。我们希望更好地服务到以前金融业没有服务到的地方,小微企业、普通个人、中小企业、中产个人,能做到这个背后真正支撑的就是大数据和云计算的技术。
今天在蚂蚁金服集团,我们已经有超过四亿的支付宝活跃用户,超过四亿的支付宝实名认证用户,80%是无线用户。下面这个数据作为中国人挺自豪的,日交易笔数已经超过了Master card,其实美国人生活Master card、VISA是最常见的,如果有一天说支付宝的日交易量已经超过了Master card常自豪的一件事情。一直都说中国是在复制,但是今天这样一件事情还是挺自豪的。
今天有两项技术:云计算、大数据及人工智能。今天讲一下云计算,简单讲一下在阿里巴巴和蚂蚁金服的云计算。底层从服务器讲起,有阿里云计算,然后是上云服务,最后是云生态。和传统有区别,传统要自己做机器、系统软件、应用软件。本身云服务就是蚂蚁金服的定位,希望通过金融云做一个助推器,帮助很多中小企业或者金融企业做一个发展,下面会讲到微贷,专门贷给老百姓的。
讲到大数据,其实说有了数据就有了金山,阿里巴巴坐在金山上吃馒头,这是我们内部的一句话。就是说数据没有真正地用好,数据怎么用好?我们要用户数据本身的安全,但是另一方面,怎么从数据带来真正的价值,从数据做一个创新?这里面我们就要讲人工智能。在今天的阿里巴巴,其实行业里有一个比较流行错误的,认为阿里巴巴是网上卖东西的公司,我今天有机会说阿里巴巴是一个技术的公司。我们非常自豪地说,我们在云识别上有着世界最先进的云识别技术,这是去年建立第一个阿里巴巴专业云识别系统。今年双11,客服94%通过智能机器服务到,以前双11的压力非常非常大,所有的客户走到一线加班加点,今年到晚上六点已经没有什么电话了,为什么?大量采用人工智能技术。我们的技术和Google CTC的技术差不多,我们走的是另外一条线,当时认为是不可能的。另外是深度学习、语音、图象识别,有很多的应用,像广告、搜索、推荐,我们这个核心特别好的是风险控制。
这是对阿里云非常简单的介绍,从2009年王监国从微软去了阿里巴巴,在2010年做了一件比较牛的事情,就是系统。在2013年做到五千集群结点。都讲Google特别牛,但是我们是中国企业第一个做到五千个结点的。到了2014年,能够处理100个Petabytes数据。
今年10月的时候,阿里已经破了四项世界记录,这是微软设计数据服务的大赛,就是算集群的数据处理能力。这就是小煤矿和自动化真正大数据的能力,参赛公司包括雅虎、Google,每年都要进行比赛。我们拿了四项,有两项常核心的项,已经在屏幕上列出。
这个是简单勾画了一下阿里云底层大数据的系统,各种数据有实时计算的数据,有人工智能平台、Data到核心的应用等等。数据安全、应用性和用户的认证使用。
这是阿里云的一个例子,12306的网站,这是卖车票的,春运的时候达到一个峰值,2013年已经优化过,实现15000万的卖票能力,但是没有办法满足峰值实现对余票查询的需求。查票占总体流量的90%,但是到了春运峰值特别大,怎么办?如果照峰值配置,资源特别特别差,因为资源大量浪费,怎么办?就是云计算,云计算就是Public Service,核心的能力是你需要的时候把这个资源给您,不需要的时候我们再用到别的用处上。我们对他的余票查询进行的支持,查询量破了7亿。
这是CCTV的核心网站服务,就是对网站整合,但是如果自己重新建设、内容管理,常浪费资源的,并且导致得重新上线,最后用的是阿里服务。采用了之后,比如说去年的春晚,通过使用阿里的服务,没有任何的问题。
讲到云计算,我们要讨论安全性。安全性很重要。假如说有一个地方数据能,安全性有很多的data Cneters,是中国第一个云计算真正进入到美国市场,在欧洲也要发展。这个很有意思,可以做到对用户的数据透明的,整个儿数据是几乎实时的同步化,背后有大量的技术挑战,我们今天已经实现了。其实对数据安全有非常非常关键的意义。现在我们有九个数据中心,包括新加坡、、硅谷、等。
刚才韩院长讲得特别好,能源利用。因为Face book确实做得特别好,Face book绿色中心做到一点七左右,当然这是一个标杆性的。今天阿里巴巴做云计算,我们不能说做到一点,很难。但是我们做到利用风力、水力大量减少能源。在和千岛湖,利用风力、太阳能等等。大家讲中国老美国,其实这个故事应该反过来讲。
人工智能有大量应用在大数据,否则背后数据不能产生价值。今天的人工智能平台能支撑各种业务,从微贷到信用、理财等等。我们做了超大规模服务器,这个水平能支持百亿特征的公司,全世界没有几家。这是语音识别,今年双11有95%已经自主智能服务了,全是通过智能机器人和知识库的处理等等。风险控制通过大数据智能技术来抓异常风险操作,十万分之一的故障率,远低于世界的业界水平。
蚂蚁微贷是一个真正利用大数据来做的模式,决定给哪个小企业贷款、贷多少钱、什么时候收钱全部通过数据模型做,否则通过银行做,非常缓慢。只能是大企业,否则成本非常高。
90后淘宝卖家大学生毕业第一笔贷款就是拿了淘宝的信用贷款,这是一个真实的故事。阿里巴巴三个战略,国际化、农村化、大数据。农村化就是服务农村,我们向18万的农村小微发放贷款,累计服务5000万农村消费,这个很有意思的,农村上网比城市还多。
保险相对比较传统的行业,今天的大数据给它造成了很大的机会。从各个方面,农业、互联网、车险等。举一个例子是运费险,运费险是一口价,你买了报5%,退货就免费。在阿里巴巴做创新,我们做了一个大数据模型,做完之后,保险变成了真正有竞争力的行业,每年是100%的增长速度,虽然并不大,但是常有前途的一个行业。
车险差异化定价,简单来说就是我们希望产生一个新的合作模式,把技术和第三方合作产生新的产品。另外一个例子就是淘金100指数,我们和聚源、中证、博时合作,发布首个电商大数据指数基金。美国可以把各个行业区做出发展形图,我们完成了 这个工作的创新。
大数据智能,一个新的世界正在打开。今天从技术角度来讲,从数据的使用方、加工、提供方,怎么隐私、数据安全等等,但是融合起来,我们要产生更好的技术产生更好的服务于用户。
谢谢大家。
主持人:下面是百度大数据部首席布道师陶海亮。
陶海亮:我叫陶海亮,在百度大数据库主要负责一些创新业务。百度大数据库是去年新成立的一个部门,百度大家都知道,每天都从全国抓很多的网页给大家提供搜索结果,所以本身就是大数据的一个基础,建立在大数据基础之上的一笔业务。后来成立一个新的部门叫大数据库,当时我们同事说,大数据的业务是要去推广大数据在中国的应用,甚至去创造一些我们原来没有的业务。所以我觉得除了孵化业务创新之外,还承担着一个宣传的职能。
我今天讲的跟漆总讲的内容不太一样,我更多的不会从技术的角度讲,更多的从商业的角度讲大数据的事情。首先这章PPT是整个儿的精华,大家离开这个会场没有记住我们说的任何一句话,希望大家记住三个字:细、活、通。为什么说这三个字?去年我们成立大数据库的时候在思考,我们做什么样的新业务?在大数据现在整个儿领域中,真正产生价值的,除了搜索之外是广告,这是我们比较传统的业务。当时公司领导提出要求,你们要创新,大数据可以产生什么新的业务?我们就去研究,大数据本身是什么,大数据给这个社会带来的价值是什么?创造的价值都是从什么角度创造的?
大家知道有一本书叫《大数据时代》,当时《大数据时代》中提出大数据的特征是4个“V”,我们基于这4个“V”的特征去匹配,发现并不是所有具有这4个“V”的特征对我们来说都是有价值的,后来我们想什么样的大数据对我们是有价值的?我们思考的结果总结了这三个字:细、活、通。细是能够细化到最小粒度的细。美国有一家公司干了一件事,气象局每天都会发布天气预报,是每个区都会发布天气预报,但是这个公司是雇了几个员工做气象的服务,把天气预报细化到每一块农田,能够通过大数据的模型去预测每一块农田天气的情况,基于这个天气模型做了一个保险产品,让农民去买这个保险,买完之后可以确保农民在天气不太好的情况下,收益还继续得到一定的保障。这是一家非常典型、成功的大数据公司。已经被孟山都公司十亿美元收购了。第二个是活,大数据是具有时间属性的。第三个是数据互相之间是可以打通的,我们是一个大数据时代,每一个部门、企业都在用不同的数据,但是如果这些数据不联通起来,产生的价值是有限的。
下面做一个广告,百度有什么数据?刚才漆总介绍的蚂蚁金服,我大概也说一下百度的数据。大家比较熟悉,首先是搜索,每天大概超过60亿次的搜索请求。其次是百度地图的活跃度也非常高,每天有150亿次的定位请求,SDK也包括在里面。百度有这些数据之后,我们怎么样反馈社会,怎么样做出一些有用的业务?我现在在大数据库主要负责定位业务,因为我们去年做了很多事情,比如说疾病预测、去年世界杯预测等。现在我们聚焦一点到证券业务上,百度每天有60亿次的搜索请求,我们把这些搜索请求提取出来,分析了一下散户投资者是什么样的特征。我把2015和2011年做比较,投资者常年轻化的。在年龄段的分布上,2015年在25岁以下的相比2011年提高了20%,从6%提高到26%。
因为移动互联网时代的到来,现在更多的是在手机上进行炒股,大家可以看到移动端的DAU(日活跃数)下半年应该是已经超过了PC端的UV,炒股DAU成为了高频率的应用。股民每天打开11次,每次登陆时间2分钟。然后是投资者的教育水平比原来更高了,比如说相比2011年,本科以上学历占比从63%提升到72%,更加高学历的股民进入到了我们股票的市场,他们也会搜索很多跟事件相关的,比如说“之下”的视频出来之后,很多人搜柴静概念股。这些都是很核心的变化,大家可以看到这是今年A股上证指数的走势,从年初大概不到3000点一直到年终的5000点,今年6月份的时候一把过山车,一下子变成了3000点。
中国的证券市场常特殊的市场,我们做过中国和国外证券市场的对比,中国80%是散户炒股,靠小道消息,不做分析,更多的是朋友推荐或者说某人推荐的小道消息来炒股。这个股市的走势代表了散户在今年被机构赚了很多钱去。
我们做一件什么事情?刚才说到百度有很多跟证券相关的数据,我们把这些数据做成一个APP,这个产品叫百度股市通。股市通不能炒股,你不能在这个产品上进行股票买卖,但是可以在这个产品上你买过的股票或者了解你想要买的股票的信息。我们在这个产品中把百度的搜索数据聚合起来,给任何一个人就能看到什么样的股票在百度搜索的热度大幅度提升,什么样的行业在百度搜索的情况发生了很大的变化,以及跟股票相关的新闻都会推出来。背后有一些技术,背后有一个知识图谱的东西,比如说海尔公司属于什么样的行业,跟什么样的产品、公司、政策相关,全部都自数据挖掘出来,免费提供给使用这个软件的用户。做了这件事情可能不能让所有的散户都成为股神,但是希望让散户在和机构PK的过程中获得一点优势,不会那么差。
今年上半年还做了另外一件事情,因为很多企业在百度做推广,全国有五十多万,遍布了27个行业、31个省份,不仅仅是商品性,更多是服务性的小微企业。这些数据我们能够做点什么?后来我们做了一个百度经济指数的产品。这个经济指数是做什么?我们把这些数据汇总起来,我们预测中国经济发展的,其实这个也跟市场相关。每一次统计局发布经济指数,对于经济市场都有非常大的影响。我们做的是什么?我们可以做到去预测,比如说先行指数、PPI、PMI指数,可以提前三个月预测到统计局发布的数据,因为统计局发布的数据是公布以上的企业,通过统计局的体系分层汇总上来的,比较慢。我们这个数据让我们研发同学跑五个小时就出来了,其实理论上我可以每天发一个,但是统计局找我们说不能这样干,这样干的话他们就没有工作了。我们每个月月底发的,后来改成月中发,每个月发一次。但是准确率还是相当高的。我们跟统计局的数据相比有一个特点,我们能够细化到每一个行业的每一个地区,比如说我们想知道市某个餐饮行业体系的情况,我们就可以从这个系统公司提取出来,这些东西全部都是免费的。
比如说大家去买理财产品的时候经常会看到一句话,投资有风险,理财需谨慎。我们希望通过大数据把这句话变成实实在在的服务,谢谢大家。
主持人:下面有请腾讯社交广告部高级产品总监周洲。
周洲:我2005年毕业于大学,毕业之后一直从事广告方面的工作。之前在美国公司、国内门户、腾讯都做过一些工作,感觉国内互联网但凡重点活动都会请BAT来发一下言,今天清数D-Lab的揭牌活动是一个非常隆重的活动,我特别开心,作为BAT里面我最后一个上台,刚才漆总、陶总,我下面再说什么他们已经下去了,没有机会反驳我。刚才漆博士从非常先进的领域对大数据做了一些介绍,陶博士虽然不讲那么高深的技术,但是其实金融离我们每个人日常生活还相对有那么一点点的距离,特别是证券理财,还是有风险的。作为腾讯,我要说我们是最贴近用户产品的一家公司。我从用户产品的角度给大家做一些介绍,我们在大数据、用户端做了哪些工作。
我的题目是“没有广告:数据让广告更懂你”。
我们先来看一下大数据对人的解读。每一个人现在都非常深度地用腾讯的用户产品,所以我们有机会能对用户有一个更深度的解读,这其实是国庆的一些数据,国庆大家都会出行,这个出行通过我们的解读会发现有一些不一样的理解,游玩不是我们出行的解读,有七成的外出者出行的目的地是家。我们又发现在大家出行的时候,00后、90后、80后都会有一些不一样的行为,00后都是少年不知愁滋味,更多都在旅行、游玩。作为80后、90后作为事业的上升期,更多的是在社交或者参加朋友的婚礼。50后、60后、70后更多是天凉好个秋,在享受生活。
基于朋友圈的解读,我们会发现国庆结婚、家人是黄金周的一个主题,与此同时也会发现,原来广告也会是在我们朋友圈里互动和关注更高的。虽然大家会在我们朋友圈下面发各种小广告。同时我们发现朋友圈对于整个儿人出行的影响也非常大,基本上有76%的用户会因为朋友圈看到的分享产生外出的想法,并且对目的地、景点的选择以及对住宿、购物都会产生显著的影响。
我印象特别深刻的一个广告是高露洁,他有提到我们的目标是没有蛀牙。所以经常会让我想到,我们做广告的目标是什么?我会觉得是让这个世界没有广告,怎么做到?其实就需要通过大数据的帮助。
腾讯大家都不陌生,有一个笑话说,在中国的边如果捡到一部手机,捡起来看至少有腾讯的一款APP在里面。现在QQ的月活跃用户已经达到了8.4亿,微信的月活跃用户达到了6.4亿。Face book月活用户的时间已经被我们赶超,微信月活跃户的时间超过了Face book,QQ和Face book等同。
再看一下用户使用时长上,在国内我们是NO.1的地位,主要是因为我们一些产品的特性,是一些社交的特性,用户天然地在的黏性会比较高。我们为什么能够对用户有一个全天候情境的陪伴?因为我们不光有微信、手Q,基本上介入到用户每一个需求的环节,比如说会看新闻,有腾讯新闻,想看视频,有腾讯视频,听音乐,有QQ音乐,上网、冲浪有QQ浏览器。每一个环节都想着为用户提供非常好的服务,这也使得我们能够对用户有一个24小时全境的洞察。
我们特别感谢我们的战略投资同事,他们在过去三年里做了非常好的布局。刚才主要提到的是腾讯自己的一些产品、服务,在最外面这个圈子里,我们可以看到通过我们和整个儿业界合作伙伴的合作,不管是京东、搜狗、58同城、易车等等,通过这样全行业的布局,我们能够给用户提供更好的服务,也会让我们更了解我们的用户。在这样的一个用户和数据的体系下,我们就建设了我们的广告定向体系,能帮助我们更好地了解用户,给他们提供更优质的服务,不光是用户的基础属性,也包括他的状态、各种行为,我们会全景地了解这个用户,并且用在我们能为他提供资讯服务的场景下。
我们怎么做到这个?其实大家都说大数据,背后很核心的是这个“挖煤产业”到底是什么样的。我们有四大工具:文本分析平台、Peacock主题模型、Lookalike Model、LASSO,通过这四大模型,再基于前面提到的核心数据,特别是行为数据、用户关系链数据,我们能够非常好地把我们的信息传递给对的用户。这里就说一些比较有趣的数据玩法,其实我个人还是比较相信终将消灭,最后一定是一个数字的时代。但是在还存在的今天,我们在做用户产品的时候,总是在想我们的产品体验如何传递更多的人情味。这是我们在手Q的广告,用到了广告的样式、数据。
现在移动端里非常热的是信息流广告,如果我们只是简单地把一个广告变成一个用户广告,这对用户体验并是不很好,怎么样更充满亲情?这是一个很简单的例子,我们能够比较好地识别出用户的生日或者节假日的结点,在用户生日前一周的时间里,会有这样一款非常诱人的巧克力蛋糕,明天是你的生日,励一下自己吧,来一块恰颗粒蛋糕。不知道大家看到这个信息会怎么样,觉得是一个广告还是一个关怀?拿数据来说话,我们会很自然地看到这样对用户信息推送,点击率很高,点击率超过20%。在门户时代,一般门户首页广告点击率是相当高的,只能做到千分之一或二的水平。在移动时代,特别是信息流里,比较好的广告可以做到3%-4%的点击,所以20%比这个高出一个量级,常好的效果。也是证明我们把人文的元素放到我们的广告里,并且融合我们的大数据产生的效果。
再看一个大数据的使用,我每天从北四环上班,北四环北边有一块广告牌,写着西山别墅一号,我根本买不起,总给我看这个广告有什么价值?作为开发商也是困惑的,因为他在那儿树立这样一块广告牌,成本常高的,其实就是他想传达的信息没有传达给对的人。这样的问题我们怎么解决?我们做了一个尝试,和杭州的坤和和家园,我们会推送一些经常出入高级酒店或者高档小区的用户,他们也许更多的是别墅的受众。于是我们就对江南会、悦榕庄等常去这里的用户做一个定点的推送,在很小的预算下就卖出了一套价值一千五百万的别墅,对方特别开心,这是一个高大上的例子。然后是韶关的碧桂园,我们会跟他沟通,从他的行业知识了解到,也许韶关的碧桂园不光是对房产有兴趣的用户购买,广州的用户也会购买。我们在广州韶关对于教育有一定要求的用户,对他们进行针对性的推送。结果非常成功一套售出三百万。这都常直接的大数据应用,甚至刚才说的房地产例子,我们现在是一个移动的时代,LBS给大家带来的改变是大家一直畅想的,具体到业绩应该有很多非常有意思的玩法。大家可以更仔细地想,比如说现在我们在大学,我记得在上学的时候,在楼道里会看到非常多的广告、海报,今天你刚贴完,下午就被别人覆盖掉了,非常低效和浪费。其实可以看到,背后有很多广告企业对于大学生这样的人群有高度渴求。我们怎么利用大数据识别出学校的用户?对我们来讲,我们已经做完了一个非常简单的算法。再举一个例子,比如说我们刚才在一个群里看到,这其实就涉及到商旅用户,再回到我刚才说的西山野鼠一号,像漆总这样经常在中美之间往返的用户也许是他们的潜在用户,这是通过商旅人群的挖掘。
很重要的一点,刚才陶博士也提到了活、通。对于腾讯我们今年在3月份发布了DMP的产品。大数据首先得有很大的数据,这个在国内BAT可能是最大的数据源。第二个提到的是挖煤的工具,这个工具在我个人的理解得在有大数据的前提下,然后我们才会有各种各样不断的尝试和使用,去试验出更好的东西。这就是为什么听到BAT的资源会眼睛发光的原因。
我们DMP的定位是腾讯大数据的能力,这里也会索引一下之前很多嘉宾提到的数据安全,我们的定位是把我们先进的“挖煤”工具出来,听到很多声音是希望BAT直接数据,但是坦白来讲,在目前这样一个数据安全立法缺失的情况下,我们会非常谨慎。在内部数据方面非常谨慎,但是我们希望能够把我们的数据能力工具给大家,让大家在这个层面有更多的尝试。第二点是我们希望连接各方的数据,成为一些行业级的数据解决方案提供商。同时我们希望在整个儿大数据行业发展过程当中,可以一块儿去推动,加强数据的增值和流通。
提到我们腾讯大数据的能力,我们会哪些能力?这些是我们已经比较核心的能力,首先是跨屏跨。在当前这样一个多时代,我们不断地听到业界的企业说,我在PC上的用户,在移动端怎么找到他们知道是一个用户,而不会浪费营销费用?腾讯在这样的一个格局下,是最有能力做到这一点的。然后是相似人群的扩展,这个也是营销界提到比较多的。基本上大数据被所有企业常重要的,所以每家企业都会建立自己各种各样的管理系统,但是他们的数据源往往非常小,也许是十万或者百万级的,和BAT的数据量比起来,怎么样由他十万很精准的用户找到更多的潜客,其实就是我们要做的一件事情。永久Cookie和跨屏跨背后有一些相似,都是因为我们有一些特殊的账号能力,所以能够帮助所有的合作伙伴实现永久Cookie。后面就不多讲了。这是刚才提到的跨屏能力,基于QQ和微信做到的功能。这是Lookalike,对于西瓜和梨的属性越清楚、越多,就越能在一堆梨当中找到两个西瓜,就是用机器自动做这个事情。因为刚才提到整个儿腾讯全产业链的布局,所以我们对用户的属性会有一个非常丰富的认识。所以我们会比较高效地做好这样的工作。
这是刚才两位提到的案例,这是我们在做的事情,金融方面的。会有保险公司找到我们,大家都在用微信做营销,这里面很多已经做了保险的购买,怎么样把这些数据用起来,能够提高保险公司的效率?他们就会和我们的DMP做合作,把他们的粉丝以及哪些粉丝购买了保险数据都给到我们,通过DMP的画像分析,可以做两件事情,第一方数据精准营销。然后是Lookalike模型来判断,原来还有这么多人和这些已经购买保险的用户非常相似,他们有80%的可能会购买保险,然后想一个更有针对性的营销方式,这是我们做的有效方式。
总的来讲,大家看到腾讯的态度,所以我们希望能够有更多的合作伙伴一起加入我们的生态链,携手促进大数据的变化。谢谢大家。
主持人:下面我要给我们的创业企业做一个广告,叫腾讯天下,因为他们是今天最大的支持者,他们给了我们最大的赞助,谢谢腾讯天下。下面的是TalkingData合伙人&执行副总裁林逸飞。
林逸飞:我的题目数有先后,进退有据。怎么理解先买房还是再炒股?还是先炒股没钱买房?这就是先后,当你出现这种先后问题的时候,你进退一定会失序。我们考虑这些问题的时候,特别同意前面几位嘉宾说的,你得有海量数据、极致地工具,但是当你想服务广告业态或者传统企业时,你要有专业的咨询。我又做了一个不太成功的实验,双12的时候,有一个植被的男生一直暗恋一个女生,他进行了海量数据分析,她的微信、微博、QQ,发现这个女孩子最近缺一支口红。在这个过程中他用了很多的工具,因为都是理工男嘛,玩过爬虫,这时候缺一个专业的咨询。他问我,我一共节省了六百多块钱,你说我应该买一个什么样的口红会比较合适?他又问了我第二个问题,对女生来讲,我是不是应该买一个包更合适?然后我说六十块钱买一个包?你还是买口红,想一想买一个什么样品牌的。在双12那天,听说某宝还送50块钱,把你们宿舍的支付宝全拽到一起,每一个包可以送50,这六百多块钱都不用花了。今天早上给我发了一个微信,找到一家店,两块钱一个的口红一共买了800个,拿了一个麻袋送给那个女孩,问我说,这个事干得漂亮吧?而且这件事情上只付了两百块钱,剩下的都是支付宝给的。
你做任何一件事情,你有了数据、工具,但是你对那个业态不了解的时候,对这个领域里真正怎么使用数据没有深刻研究,甚至没有专业的智慧和专业的人才放进去的时候,你只能坐在金山上啃馒头。我们作为先锋公司或者尖锐公司怎么玩这件事情?
海量数据,我们主要是做移动端APP的合作,我们现在服务将近超过10万款不同的APP或者游戏,这是现在排名前100了,我们覆盖大概30%-40%,也就是活跃游戏、活跃应用。这一块还是覆盖了大家在衣食住行、各个角度上各种各样的数据。我们到今天累计不到三年的时间,累计到设备24.2亿,包含了大家各种各样的移动终端(手环、Pad、智能电视),我们日活和月活的数字不能跟BAT比拟,但是我们是用三年的时间成长到现在的阶段,日活设备2亿,月活6亿的水准。我们每天也处理这么多的事情,我们也有比较大的数据处理,有这样大的数据体量。同时我们还花了很大的精力和投资部署线下的业态,我们今天在72个城市里部署了超过2000多家商超,每天进行数据交互超过2200万的POI。我们也做了标签化,前面那些工作大家只要记住我们现在有2亿日活、6亿月活,中间的过程都一样,把这些纷繁复杂的数据进行标签化。数据本身看上去很美,是个很苦的事情。所有准备投身这个行业的人,不要把这个事情想得像前面几位讲得那么美,因为有很多人要做非常非常基础的事情,大家知道我们去统计任何一款手机,我们以品牌集中度最高的苹果举例,我们要多少个设备的品牌户?超过5000万。因为不同的命名、不同的市场、二手手机市场,包括祖国南方具有强大能力手机DIY的工厂,那里面可以看到无数的设备,简简单单这一件事情就是很苦的事情。所以从数据中发现奥妙或者从数据终发现盲点的前提,还是要花很多的时间处理数据,大家都讲数据,这一块要花很大的时间。
我们真正进入一个领域,我们不可能像BAT那样,没有那么多的带宽,我要告诉你通过什么样的指标、标准,跟自己家的业态可以连接上。一个房地产、快销企业和银行,它的KPI究竟是什么?如果这些东西你不理解?我给你一个报表,非常炫的可视化数据展示的东西。离这个数据被他用起来,中间还差了一个不可逾越的鸿沟,那是一个业务跟数据之间的关系。所以我们在两年之前开始突破游戏行业时,到今天游戏行业里会拿我们出的一套游戏指标作为大家衡量自己游戏的KPI。刚才听到很多数字,大家心里稍微转一转,怎么定义?安装?安装?活跃是一天还是一周的?安装一次就下载了算不算?一天上几次算不算活跃客户?类似这样的挺多的。所以我们通过一个指标体系进入游戏领域,之后进入银行、券商、房地产、保险公司、零售企业,我们干一件事情,先去理解人家的业态里对于这样的数据到底怎么用。这是我们前面创建的指标体系,AARRR的这一套运营模型,我们现在也比较专注只做几个领域,没有那么多精力做更多领域范畴的业态。
每一个做大数据的公司背后都得有一个铲子,无论是什么样质地,总要有能力把数据拿进来,做相应的分析,无论是做什么样的服务,工具是必需的。对公司稍微有一点了解的,我们还服务超过几十家大投行,主要在国外,包括刚才他们提到的老虎等等,我们会给他们提供一些Market Intelligence比较宽,我们能够覆盖国内的体量比较大,我们也有第三方数据,我们还没有跟BAT有任何的瓜葛,所以我们出的各种数据有一定的公允性。通过Market Intelligence这样的工具服务很多有商业背景和无商业背景更多的合作伙伴,也包括机构。现在也出一些新的潜力应用宝和增长的爬升榜,有很多有潜力的APP在很短的时间里跃升。
我们除了海量数据和极致工具之外,我们特别专注这件事情,专业咨询。这就是我说的3A3R模型,各种领域里我们都用同样的一套方法体系,从互联网的视角理解一个企业业态里是什么样的逻辑用这样的数据,需求是什么。我现在服务的像一些大型的银行机构,像平安、招行、兴业等等,也包括排名前20的券商都有合作,包括航空、地产公司等。回应一下刚才那个问题,做这样的房地产销售要明白,在这里面今天有4-6个点谁拿了?A证拿了,你做了那个报表找客的时候,最难的一件事情什么?4个点绝对被拿掉了,而且会瓜很多的中间成本、代客,那个报告只起了第一层的作用。
这一块我们也放了不同的工作人员,我们会摆一些客服进来,这帮人干什么?唯一的目的是解决客户的问题,我通常会把他前项部署到客户那边,我帮他看我的数据,我帮他看他的数据,我还帮他看他过去的数据。从这里做KPI,部署到最终客户的线上,最终把数据发生作为。二,永远不会在外面看客户的数据,而是在客户这一侧帮助客户使用自己的数据。还有数据咨询师,谈了很多的逻辑之后,进到企业里,尤其是中B、大B企业里,有很多专门做报表的,表哥、表姐一堆,有一帮码农也没问题,这个时候在他们之间要跳上去两层楼会出现很多真正的业务人员和领导,他们之间有巨大的GAP。我们干的事情是在这个领域上起真正的作用,把数据的奥妙发生真正的逻辑。
这里简单列了一下我们现在的合作伙伴,我们公司的墙上会贴着一句话,除了,其他人只拿数据说话。我们这家公司为什么叫TalkingData?因为我们或者我们认为数据自身可以说话,但是说话要通过三件事情,海量数据、极致工具、专业咨询,缺一不可,谢谢大家。
主持人:下面进入论坛环节。
张茉楠:现在邀请刚才的嘉宾,大学数据科学研究院的执行副院长韩亦舜。百度大数据部首席布道师陶海亮。腾讯社交广告部高级产品总监周洲。TalkingData合伙人&执行副总裁林逸飞。希望在这么短的头脑风暴中,能有更多有价值的观点碰撞出来。
开始我们这个圆桌论坛之前,我想引用凯文凯莉的一段话,她说的一段话特别有价值,这个世界最悲哀的事情就是你努力,但是你不在风口上,你催命,但是你不把握这个趋势。左翼说当那些又在风口上又把握趋势的人,我们觉得这些人常幸运的。所以在座的除了BAT公司之外,包括韩院长数据科学院的大旗以及现在新创的TalkingData公司,我觉得大家都是在风口浪尖上。我们还是回到今天的这个书体,大数据、大责任。我觉得无论是我们的巨量型、体量型非常大的BAT公司还是初创公司,特别是在大数据时代,除了真正的挖掘价值、创造价值,而不是收集数据本身,可能是企业未来创造更大的社会责任和我们创造更大的企业发展的空间,这常重要的。所以想请几位来自于企业的老总,从企业自身的角度来讲,包括从以客户为导向的角度来讲,您认为如何为社会创造更大的数据价值?
林逸飞:我们公司做了4年,算是一个中度的创业公司,所以您的问题是我们一直在思考的一个角度。从某种意义上,我们更关注的是数据对于他在使用上遵从的三个对象,从三个角度上考虑一个数据使用的合规性、安全性。数据本身、数据的使用方法或者落地方法、过程中的使用形式,从这三个角度上我们花了很多的精力去考虑。尤其是在数据的流向上,原始数据通常都不会对任何的客户,目前我们看到的,除了在所谓标签层次上做相应的合作之外,可能还会涉及到一些风控方向的应用,通常会对数据打分。另外一些是数据处理,同样对地理信息的信息,进到不同业态时解读这样打点信息的逻辑是不一样的。所以变成加工地不能完全在你的数据中心里,这个时候你会要很困难地解决另外一个问题,我的数据不能完全的情况下,你的领域知识又不可能到一个领域内的计算模型或者算法的时候,怎么处理?再往后我们叫数据处理,因为我们大概有一多半的精力花在了跟中地、大地企业的合作,他们会有比较长时间的数据,银行动辄还是有上千万的客户,体量其实一点都不小。这种情况下变成你的第三方或者第二方的数据在什么样的地方用什么样的逻辑跟第一方数据之间发生关系,这件事情其实也是比较难的。我刚才讲的数据使用难度的台阶越来越高,很多大公司会止步在第一个阶段,也就是说在标签,标签会为一些报告、轨迹、指数就结束了,但是其实越往后越难。反过来对于传统企业来讲,真正能够造成巨大社会价值的是在后面。
陶海亮:我觉得客户BAT增长还可以,但是其实像创业企业的增长,他不发海报,增长100%别人也不知道。其实我觉得BAT的增长主要是两个方面,一个是互联网的红利在增长,我们不是顺着大势在走,社会的潮流,只要你这个潮流就可以。
我相信大家都是在为客户做辅攻级,帮助他们得到更多的价值。大数据库原来做广告是按照点击率来付费的,现在我们转变这个模式原来一个网民点击了是梳理型,我们现在建了一个中心,有点类似于你在淘宝买东西的时候,是一个全环比环的。我们建立了中心之后,在百度用户点进去的广告,未来我们可能不收费,真正有人在你这个网站下购买这个服务之后,我们再来结算之类的,对客户能够有一个更好的提升。这也是我们在大数据的角度下做的一些分析。
张茉楠:您认为怎么能创造更多的社会价值?
周洲:首先感谢各位领导对我们公司努力的认可,其实刚才的里提到,过去的三年到五年,腾讯在连接这一块,已经是整个儿公司层面的战略。很多这样的创业公司、开发者、用户都会在其中受益,我刚刚有看到TalkingData的手册,我们一直在着这样一个旨,我们也能看到作为中国排名第三的互联网公司,不光是自身的盈利,我们更多的是社会责任。我们一直在贯彻这样的旨。回到刚刚讲的,怎么样去承担这样的责任,帮助整个儿社会分享这样的环节?我会觉得首先回到做广告这个行业,我们的数据确确实实有在回会。举一个美国的例子,Face book和Twitter,Face book的用户黏性会逐渐地顺到Twitter上,其实这背后有一个因素,Twitter基本上是公开的信息,谁都可以获取。但是Face book还会偏你的好友、熟人的层面,在整个儿信息爆炸的时代,包括我们自己朋友圈很多时候是没有时间刷完的,在这样一个信息爆炸的时代,怎么样有效地帮助用户筛选他更有价值的信息?至少我们这个部门会觉得特别需要承担这样的一个社会责任。我们刚才有聊到在背后基于数据的挖掘,看到这个更有价值的信息,我们做出了努力。大数据这个词火到今年已经是第N年,但是真正能够对用户产生极其大的质变还是需要一个过程。我们通过大数据,刚才有提到把点击率提高到一个量级,但是这都不能说我们真的就让用户看到的每一个营销的资讯都是他想获得的,这中间肯定是有一个过程的。包括,虽然说我们也在推出我们的大数据平台,怎么样让整个儿业界的人都进来玩得更好?这也需要一个过程。涉及到数据安全的隐私、立法的完善,我们需要知道怎么样在这里玩是安全的,这也是我们一直在思考的。
张茉楠:我觉得今天真正的布道者还是韩院长,刚才邱主任谈的大道之行、数据大同。本身我们现在是站在的制高点上,刚才很多专家也谈到了,在未来的发展过程中,无线、连接无线,但是有的时候跟责任、安全、隐私,跟我们现在相关的地带或者边缘地带毕竟有冲突和摩擦,所以我们也想请韩院长谈一谈您对数据责任、大数据时代责任担待方面有什么更深的?
韩亦舜:不用不行,也不行,所以挑战蛮大的。主持人这样一铺垫就给一个机会,你们三个谁跟谁都有点别扭,找我。我们清数D-Lab做的数据尝试就是这个作用,因为我们立法相对中立一些,特别愿意倾听真正来自业界的需求。有一次跟一位老先生聊,他说到很多时候我们没有机会听业界的需求是什么。我觉得今天这样的学校让自己真正尽快融合现在已经出现的产业界的鸿沟,产业界很多需求学业界都不知道。数据科学研究院要担负起这个责任,咱们一步一步来,哪些数据可以在这些平台上尝试着,让用户可见之类的,这些都是可以做的。也许没有那么,责任挺大的,但是我觉得整个儿新秩序的数据时代会重新建立,所以我们对隐私的认知、权属的确立都会有一个全新的过程。作为学校要担起这个责任,而且要更加立场的推动这件事情。这样省得你们谁干都有嫌疑,就我干没有嫌疑。
张茉楠:清数D-Lab就是大数据时代的一个由器、资源汇集的平台。所以我们现在无论是从、企业还是个人、社会、产业界,我觉得这是一个大融合的时代,我们需要有一个平台能够更加、、客观地发现和创造这些价值,所以我觉得本身清数D-Lab是一个非常好的公共价值创造的平台。
各位嘉宾对未来清数D-Lab有什么好的?怎么发现更大的价值?比如说从研究的层面、专业的层面作为这样一个孵化中心或者平台?
韩亦舜:其实挺好的机会,但是有核心的挑战。我觉得最大的挑战可能是你自己,因为今天我提的话题里有一些感受,新型的搞大数据的公司天生就带着创新的DNA,所以时时地否定自己,看看自己是不是用这样的思维思考这个问题,在创造新价值,这是一个很大的挑战。不光不敢数据,BAT不敢数据,各有各的理由,都一定对吗?我们一起努力,才有可能有解。如果都守着自己,给自己一百个、一千个不的理由,永远不可能数据产生新的由于所带来的价值,所以这个挑战希望你们能够担当起来。
周洲:其实清数D-Lab是一个非常好的、有优势的,虽然身份是第三方中立的角色。举一个消极的例子,Google这家公司大家都知道,他非常有名的是不,所以Google在第三方的身份上,在整个儿业界是不缺少的。Google在两三年前就有在做一个类似于大数据的项目,其实Google和我们也是战略合作伙伴,我们也一直有在聊,即便他们这样的身份,在今天这样的项目也还没有做成功,并且我还没有看到他们有做成功的迹象。这不光是身份的问题,也会涉及到很多整个儿系统机制的设计、解决各方利益的问题。但是很好的一点是清数D-Lab已经有这样的身份的优势,可能背后刚好是最优秀人才的聚集地,可能会想到更多的机制、方法,让大家在这个生态圈里成长。
陶海亮:大数据的确是火了好几年了,大数据也出了国家层面的文件。但是我觉得从理论的高度、从真正怎么样发挥价值,什么样的数据对我们是不可或缺的?我特别期望有一个东西,比如说二十年以后,我们这个信息社会发展到非常发达的程度,数据的采集已经是的情况下,清数D-Lab在这种情况下,数据的使用怎么规范?我觉得特别需要有人给我们画出一个蓝图,所以有一个小小的期望。
林逸飞:跟两位相比,我们还是算初创的企业。在这一块我们一直是比较的,所以包括BAT也都是我们的合作伙伴。对于清数D-Lab,从数据中心这个角度来讲,我们常的。这个数据的运用从层面、学术层面听到的声音挺多的,所以想找到一个相对具有一定权威性,并且能持续推动的一个体制或者规范出来,在这个规范或者这个过程里,需要我们提供的支持,不管是数据层面还是技术层面,我们都愿意心的介入。
张茉楠:通过一上午嘉宾的发言和我们的圆桌论坛,无论是老企业还是新企业,无论是还是在企业,其实最重要的是大家有一颗澎湃的心,特别是有这种要推动大数据产业健康发展的责任感和感,我觉得大家在这个层面上都是一致的。也就是说真正在大同方向上,我们都是同舟共济的,都是在一条船上的。
下一步每个月都有一个非常重要的议题,每个议题也都在不同层面上对我们当前整个儿学术界产生了非常广泛的影响,所以我们也希望未来的圆桌论坛能够围绕大数据、大责任,特别是在大数据时代的数据、数据文明、数据价值方面有更大的探索性。无论是从企业实践的推动还是从我们研究理论上的推动,在大数据时代是应该有中国声音的,因为需要有一种东方文化更加包容、融合,其实这也是我们这个圆桌论坛最初设计的旨,谢谢大家。
主持人:谢谢各位嘉宾,谢谢各位对清数D-Lab的期望和已经承诺的支持。实际上我们当时想做清数D-Lab这件事情的时候,有过比较多的接触,跟拥有这些的企业讨论这个问题,讨论之后的结果是,我们的很多会员企业在每一个领域都有大数据,但是可能在大数据的金山上还在喝凉水,但是很多初创型企业拿着金刚钻也只能喝凉水、吃馒头。另外还有一大批的同学和的研究团队,因为跟业界接触不足够多,所以他们并不真正清楚问题在哪里。如果他们在学习中间不能够拿到真正的数据、真正的问题去研究,可能这个还是象牙塔里的研究,他们走到社会、BAT等渴求大数据人才的公司里,可能还要花两三年的时间,才能够把他们培养成可用的“挖掘工人”。因此我觉得对于清数D-Lab有几个任务要考虑:
一,对于学校,我们怎么样把学习这边从产业界拿到实际的问题、实际的需求,使得同学能在这做研究。我们不排除到BAT、TalkingData去研究,不见得这个数据一定要拿出来,其实从机制上来讲有很多方法可以保障。
二,产业界的上下游,因为数据融合之后能够产生更大的价值。清数D-Lab也愿意帮助某一家有数据的企业,帮助有需求的企业组织团队来解决你的问题,也希望在座的各位投资者将来看到小的初创团队在某一个领域有点建树的时候,也伸出一把手帮他们一把。
今天大学大数据大责任高峰论坛和数据创新揭牌仪式到这里就结束了,非常感谢大家三个小时持续的付出,也希望清数D-Lab能够在数据科学院和启迪的帮助下,从一棵小苗慢慢长成一棵大树,谢谢大家。
推荐:
娃娃王爷无盐妃,强占契约妻,恶夜活死鸡图解,重生之我是步惊云,抛砖引玉打一生肖,冷面总裁笨蛋妻,天才丑女玩转校园,失婚总裁劫前妻,拉缘天堂,冲喜新娘赔心交易,酿酒皇后,欲色谷,主家教贝尔菲戈尔,晓声长谈在线直播,美人计苗亦有秀,甜妻不撒娇,极品白领后记,江山美人志女主角,掳情一夜成欢,爱妻慈蓝伶,琢本友希,小村春潮,七个相公够不够,烟绕寒天,穿越之蓝月皇后,村上里沙和金毛,王锡玄快乐大本营,倩女幽魂修为模拟器,刑警使命第二部,张良的表字,喜上加喜片尾曲,神雕之萧峰后人,部长夫人请息怒,魅惑暴王别宠我,垂悬腹,村上里沙帝王浴,魂断楼兰好看吗,豪门绝恋赎罪新娘,蓬松乳,痒孟楠,柴胡疏肝散 同仁堂,驯服坏坏太子,黑道冷枭的陪心交易,赤道和北极原唱,圣魔网,狼王宠奴,挽红楼之玉亦狂,茅道临是茅于轼儿子,素手华筝,徐其耀玩过的女人,新矿吧,kayden kross第八日,打飞机专用网,红楼旁观的平淡生活,首席执行官的合约情人,焰王的极品新娘,穿越人鱼之我要的幸福,冰山王妃邪魅爷,超幸福鞋垫三部曲,勒组词,一级片武则天,鸿钧现代生活录,现代豪侠传插曲,欲海逍遥,花间浪子,牛娃闯都市,诀别诗卓文君,悍马h10报价,高官前夫别来无恙,江陵肃是谁的孙子,落梅沁雪,恶少的毒爱,色五月 干什么,美少女被虐饲育记,隔世离空的红颜原唱,女总统音译歌词,女人你敢甩我,我的泪珠儿演员表,恶魔军官放我走,木已成舟下一句,暴露狂楠楠,365式性姿势,不想骗自己英文版,花开在古代,9a撸霸,残虐女犯人刑务所,血泣五胡,乔榛近况,综漫之逐艳曲,终极一班苏教官,吾组词,www.169mm.cc,恶女绿萍,盲目的救赎,徐其耀玩过的女人,村上真依,痒孟楠,天字号大纨绔,庞青云原型,风尘女教师,刘瑞龙简历,玩火娇妻,安住凉子,王爷的倔宠儿,169mm.cc,清穿之永日清茶,绝色倾权,青春出动吻戏,李富春简历,左葳葳,色少林,妓中技,punisher全cg存档,华能吧,东风东路小学班级网站,橘黄刺杯菌,冰峰魔恋mp3,武则天传位于谁,夏耕是谁的女婿,屎球吧,热吻野男人,曹征平简历,大铁人17号,翻身弃妇太撩人,网王之恋猫物语
网友评论 ()条 查看