友盟+的高级技术总监李春元《解读数据未来:全域数据时代已开启》

  艾媒网讯 6月25日,由CMAC组委会指导、全球知名的移动互联网第三方数据挖掘和分析机构艾媒咨询集团主办的2016中国(第五届)大数据与移动广告营销大会在 广州南丰朗豪酒店成功举办。大数据、广告行业、品牌广告主与新媒体精英代表4000余人出席该营销顶尖峰会,近30位海内外名企CEO将登台发表精彩主题 演讲。

  会上,友盟+的高级技术总监李春元出席“2016中国大数据应用领袖峰会”为大家带来《解读数据未来:全域数据时代已开启》的演讲。以下是李春元的演讲实录:

 

  李春元:各位来宾,大家下午好!我是友盟+的李春元。我今天给大家分享的是我们整个友盟+在最近以及我们对未来的一个数据思考。我们认为未来的数据是全域数据时代,这个时代已经开始了,我们友盟+服务了很多中小开发者。我们服务了很多中小的站长和媒体。我们发现他们在用数据来指导自己生意的时候,我们发现了很多的问题。节下来我给大家介绍一下他们应用里面的一些问题。数据分析这个时代里面,对于数据的应用分为三个层次:

  第一个层次就是数据本身的层次。

  第二个层次是数据的技术,

  第三个层次是数据的思维。

  这三个层次里面,今天我们很多的企业和很多的开发者,很多的中小站长,他们都在这三个方面存在或多或少的问题:

  第一个问题,缺少数据。现在看到列出来的不管是我们现在的餐饮业、线下零售店、电影院也好,一些游乐场、线下的商店,他们其实今天没有很好的数据,没有把这些数据给利用起来,没有把这些数据指导他们的生意。举个最简单的例子,我们的商场,我们每天都有人逛商场,但是我们线下零售店完全抢不过线上店。为什么?他没有对逛商店的人很好了解、没有对周围商圈进行很好了解。他的店铺建得位置合不合适?进店的人怎么样的状况?怎么样触达线下的客流?因为缺少数据化,所以他们没有办法去有效的进行他们的引流、转化的整个的过程。所以他的生意不可能和线上抢。

  我们看下医疗,最近在国家互联网中心发了一个国家互联网数据报告,预说国家对于医疗数据和健康数据有很大的开放性。我们今天,包括我们在医疗数据的应用上也是一块空白。我们首先没有把我们每个人每天的每个生活时间段的健康数据采集起来,没有把我们每次去医院的诊断数据,医生给我们的处方。我们的心跳以及血液的采集各种诊断结果我们没有很好的采集出来;同时这些数据我们也没有依据我们最后的症状进行关联的分析。如果我们可以把这些数据整理归结起来,我们其实可以很好辅助我们整个医疗的过程。我是有小孩的父亲,其实在小孩成长过程中,我其实发现,我每次带小孩去看感冒,医生会根据他的发烧、体温、血液特征判断出给他用什么药?这些其实是根据我个人的经验数据的,我们可以在这里面实现机器的病理诊断,这一块是很大的看法。

  我们再看看教育,今天教育行业,针对小孩的学习成绩,他的课程辅导这方面的数据,虽然今天我们看到有一些应用在做了。包括现在网上的一起作业网的APP,以及我们学校正在尝试的自动线上应用的过程,他们在尝试这样的数据采集,去辅助孩子的指导,但是都是处于一个初级阶段,还没有把整个包括我们每次老师的评分、小孩学习的兴趣这一块都没有很好的应用起来。所以总的看起来,其实我们现在面临的状况是缺少数据。

  现在有很多互联网企业已经有很多数据了,但是,对于这些中小企业来说,他们缺少什么?他们缺少技术。而在小的企业里面,他们缺少了什么?他们缺少他们的基础设施,缺少他们的平台计算能力,所以他们不能很好把这些数据应用起来。现在把数据处理得很好的。除了BAT三家大型公司以及很多大的公司之外,其他中小,我们面对的这些开发者,他们为什么要利用我们友盟+的服务,因为他们缺乏计算的能力。从数据的流程来看,数据首先要通过采集才能收集上来,但是采集的手段,因为人的各种各样的行为,采集的手段是丰富、多变的。我们守望手机端,移动端、智能电视、智能家居以及我们开车的这些数据怎么采集起来?我们需要相关的工具。数据采集之后我们要进行相应的统计和计算,反映线上流量的情况,APP的情况,这些我们要有相关数据实时的计算。数据的实时计算之后,我们要有平台的大规模处理能力,能够把很长很大的几十个TB、几十个BP的数据进行计算的能力。把数据的计算能力有了,我们还要对客户进行清洗、过滤、建模,让我们每个用数据团队的人利用好这个数据。

  我们的算法团队针对我们的业务状况去建模,挖掘数据的价值。最后我们可以把这些数据对外输出,输出我们要考虑大规模的数据处理能力,今天有前辈嘉宾在介绍到,我们要去实时竞价,实时竞价是很短的过程。这些数据输出的能力,所以这些都是我们今天缺少的,很多中小企业缺少的。他们缺少什么?缺少数据。

  最后一个,这个也是最难的一个,我们缺少数据思维。我们看到很多行业,地产、广告、娱乐、我们有很多医疗的行业,我们不缺少数据了,比如说我们的广告行业,我们已经有很丰富的数据了。我们的金融行业、互联网行业。我们有很多采集到的数据,但是我们怎么基于这些数据,这些行业去进行行业的建模,然后把这些每个过程的业务流程进行数据化,从中做分析,挖掘形成数据的应用,这个是我们缺少的。我们现在能够看到,比如说今天我们用得最多的是精准营销,基于人的属性进行标签,根据人的兴趣标签做实时的竞价,实现广告和人的连接。另外我们看到一些应用做信用评估,我们拥有企业APP的流量数据,我们可以来做征信模型,去辅助我们的贷款,金融行业给他们贷款,这个我们也可以去做;我们还可以做关联推荐,基于用户的购买行为,去做相关性的关联的推荐,这个我们也可以做。然后今天阿里巴巴在做什么?阿里巴巴在做工商打假,基于用户反馈,拿到这些数据之后我们可以做什么?我们去看哪些是假冒伪劣?地址在哪里?配合我们工商部门去进行打假。但是这些只是数据应用的我们能想到的冰山一角。还有很多。这是我们缺少的数据思维的一个过程。

  接下来全域数据时代,我们怎么解决这些问题?全域数据时代已经来临了。今天在全域数据时代有三个重要的特点:

  第一个特点是全面的数据采集能力,我们可以采集各种各样的数据,基于人的数据、天气的数据,我们可以把数据汇总起来,然后形成丰富的基层。

  第二是全面的数据处理能力,很久之前大家不谈大数据?因为我们那个时候的计算机以及分布式计算系统只能处理几十G的数据,这个时候没有办法探讨大数据的问题。所以全面的处理能力很重要。

  第三是全面的数据服务能力。我们今天数据服务能力很单薄,这个是我们认为要做到全域数据时代的核心。

  全域数据采集能力,我们今天可以采集什么样的数据?友盟+今天可以采集网民娱乐的数据,我们进行分析,可以看到客户对于什么样的数据感兴趣?同时我们有收集近一百万APP用户的启动数据、行为数据,所以我们这一块有它的移动端的数据。我们还有什么?我们结合了高德的地理位置数据,高德的导航数据。我们接入进去进行分析。还有基于WIFI、探针以及商场、酒店、游乐场采集线下数据,我们同时也采集更加相关的电子盒子的信息,采集智能家居的信息,包括空调、洗衣机、电视的数据。我们再去采集一些可穿戴设备的数据。把这些数据串联起来,刻画人的需求、特征。

  全面的数据处理能力,我们需要什么?我们需要大规模的数据。云计算很火,它有分布式的计算系统,有高效的运维、监控管理系统,你的机器出问题都可以及时修复。再往上一层,我们需要相关的开元的或者是这些系统,这些系统可以是开源和自主研发,但是你要有分布式对立能力,还有流式计算,还有高性能,高并发的数据存储和查询。再往上,你的模型,算法,你的数据服务,你的反作弊的模型怎么做的?还有你的征信模型怎么建的?你怎么基于人群的相关性进行分析。这里面友盟+有很多的产品,我们也服务了很多的广告主,我们发现在每年平时的时候,我们有检测产品,我们检测到广告的流量,点击的流量,曝光点击在平时的节点,我们判断是无效的流量是20%到30%左右。双十一的时候,我们异常发现这几天无效流量是有效流量的两到三倍。所以在这里面反作弊是很重要的一个处理。

  全域数据时代我们要解决全行业的问题,我们怎么看待行业里面有怎么样相关的问题?今天我们看到我们的中小企业,中小开发者来说,我们提供什么样的服务和什么样的工具去辅助他们完成这个过程,这个是我们要考虑的,我们提供服务的。第二是我的应用出来了,我的网站也有,我怎么去引流?怎么去推广?怎么进行有效推广?拿来流量也是很重要的。现在流量有大流量的用户。他们要想的问题是不仅仅是引流,因为引流只能解决一部分的问题。他每天的流失是很严重的,我们观察到严重的现象是大大多数的应用他们流失的用户和他们拉进来的用户几乎是等同的。如果一个应用停止了拉新的话,基本上他的用户很快就会流失。他们怎么去解决这个问题?我们要去辅助他们提升用户的活跃度。防止用户的流失。我们要去创建一些运营的共聚合自主运营的工具,解决他们整个网站或者是应用里面运营的根接问题。最后就是一个变现,这些人拥有了数据,依托在友盟+的情况下,怎么去给数据带来收益?这个是我们考虑的问题。

  前面都是讲全域数据时代的状况。最后讲讲友盟+怎么来应用这些数据?我们友盟+日触达全球独立活跃用户是9个亿,这个用户是一个真实的人友盟+触达的用户。第二我们每天及到的日收集量是两百亿。我们合作的应用数是一百万。有一百个APP在我们平台上,我们服务的网站有500万,500万的问占每天的数据都在检测。这个友盟+从开发、推广到运营的过程中我们提供了推送和社区的能力,他可以很轻松完成他在自己的应用里面可以创建社区,去共享、社会化分享,分享到FB,我们还提供一些IM数据,我们在运营阶段,推广数据,我们提供了两款系统,第一个是PUSH,在我们大数据的池子下做的一个标签。然后去实现它人群的精准推送。我们也提供了我们友盟+做的网销监测,他可以看从APP点击激活、用户的注册以及用户的转化。在相关运营阶段我们提供了友盟+最著名的应用统计、游戏统计以及我们的网站统计等等运营的工具。我们还有一款深度自定义化的运营工具,辅助和分析自己网站状况的自主工具,可以实现多维的分析以及路径转化的分析解决运营问题。最后我们有友盟+EUP的平台,可以实现你人群的放大,最后我们还对接了很的的DSP,你可以直接到这些DSP上做广告投放。

  这个是我们友盟+在服务产品的一个矩阵,有运营工具以及线下采集数据的能力。行业分析,我们现在关注在三块,第一块是游戏分析。我们针对游戏行业做了深度的游戏分析报告和产品。然后我们有一款线下的强大分析系统,还有我们的广告监测,还有DMP,还有运营工具,指数分析报告。有一些报告百度也很关心,有一些报告百度都不让我们发。

  这个是网销检测,从激活到注册到付费,收藏加购、下单到底,我们计算它的ROI以及提供的人群的分析,这里面其实正常我们都觉得没有什么好讲的。唯一可能不同的就是今天整个网销监测关于人群的识别,我们是识别真人的识别。曝光的人数、点击的人数,是根据这个真实人的标识来计算,是屏、跨终端来做。因为淘宝的数据是消费数据和人口基本数据。关于人群的质量,利用的是友盟+自有的移动方面的应用数据来做的。

  u-Oplus:线下数据360度追踪,我们提供了热地图的分析。哪些人在哪些点比较集中活跃。我们还有人群的分析。我们把线下的数据基于人的WEB地址看他在线上的行为,线上和线下行为进行关联。提供人群分析。我们还对接高德的数据,提供商圈分析。实现缺人找地,缺地找人,然后从营销管理一直到线下的目标人群。我们做了一个类似于会场,友盟+也开了一个UBDC全域数据大会。然后标记到访多少人,热地图是怎么样的。然后一个热的消费。最后是Dplus的产品,这一款产品提供了很强大的数据分析能力。今天没有一个系统可以做到数据交叉分析的能力。第二我们在转化路径上也做了一些转化漏斗的分析,同时我们也接入了很多的模板,为各行各业做定制化的产品服务。没有关系。你自己不懂你的场景优化,我们有这些ISV的服务,我们还提供人群数据查询。今天我的分享就到这里。谢谢大家!