导语:古有水泊梁山英雄108将叱咤江湖,今有“中国大数据技术先锋108将”高端人物访谈搅动风云。2017年,由DT学院、清华大数据产业联合会、山西省大数据产业协会联合举办,面向大数据产业的技术精英、专家学者以及大数据产业链领域公司CTO的“中国大数据技术先锋108将”高端人物访谈活动正式启动,围绕大数据技术的多个层面进行分享,旨在搭建大数据技术传播分享的高端平台,促进大数据技术的业内交流。
首期专访人物
中国顶尖数据科学家 董飞
董飞
Datatist首席架构师&COO,毕业于南开大学,硕士杜克大学毕业。先后在创业公司酷迅、百度基础架构组和Amazon云计算部门,LinkedIn担任高级工程师,Coursera从事数据工程师,负责过垂直搜索,百度云计算平台研发和广告系统的架构。为多位企业客户解决营销难题,具备丰富实践经验。
访谈主题
大数据技术在预测性营销上的实践
访谈录
DT学院: 请您谈谈什么是预测营销?
董 飞:说到预测营销,不得不先提个性化的用户画像。我们针对每一类数据实体,进一步分解可落地的数据维度,刻画他/她的每一个特征,在聚集起来形成人群画像。比如下面就是两种典型年轻消费人群。
预测营销中的元素具体包括:
用户固定特征:性别,年龄,地域,教育水平,生辰八字,职业,星座
用户兴趣特征:兴趣爱好,使用APP,网站,浏览/收藏/评论内容,品牌偏好,产品偏好
用户社会特征:生活习惯,婚恋,社交/信息渠道偏好,宗教信仰,家庭成分
用户消费特征:收入状况,购买力水平,商品种类,购买渠道喜好,购买频次
用户动态特征:当下时间,需求,正在前往的地方,周边的商户,周围人群,新闻事件
当我们采集和分析这些用户画像,可以实现精准的预测营销。这是最直接和最有价值的应用,广告主可以通过用户标签来发布广告给所要触达的用户,这里面又可以通过上图提到的搜索广告,展示社交广告,移动广告等多渠道的营销策略,营销分析,营销优化以及后端CRM/供应链系统打通的一站式营销优化,全么提升ROI。
我们再说一说营销时代的变迁,传统的企业大多还停留在“营销1.0”时代,消费者需要什么,企业提供什么,而进入“营销2.0”,以社会价值与品牌为使命,也不能完全精准对接个性化需求。进入营销3.0的数据时代,我们要对每个消费者进行个性化匹配,一对一营销,甚至精确算清楚成交转化率,提高投资回报比。
大数据下的营销颠覆经典的营销4P理论,Product,Price,Place,Promotion,取而代之的是新的4P,People,Performance,Process,Prediction。在大数据时代,线下地理的竞争边界早就不存在,比的是早一步的先知能力,利用大数据,从顾客真实交易数据中,计算下一次的购买时间。 营销3.0时代关键词就是“预测”。
预测营销能够让你专注于一小群客户,而这群客户却能代表特定产品的大多数潜在买家。以上图为例,中国直播网,你可以将营销活动的目标受众锁定为 20 万潜在客户或现有客户,其中包括特定产品的大多数买家(4 万人)。你还可以拨出部分预算用于吸引更小的客户群(比如 20% 的客户),而不是整个客户群,进而优化你的支出。
过去我们看数据可能是被动的方式,但预测营销强调是决策价值,比如购买时间,你该看的不是她最后的购买日期,而是下次购买的时间,看未来的存活概率,最后生成客户终身价值(CLV)。预测营销催生了一种新的数据驱动营销方式,就是以客户为中心,核心在于帮助公司完成从以产品或渠道为中心到以客户为中心的转变。
DT学院: 在现代商业中大数据的价值体现在哪?
董 飞: 大数据最大的价值不是事后分析,而是预测和推荐。我就拿电商举例,"精准推荐"成为大数据改变零售业的核心功能。譬如服装网站Stitch fix例子,在个性化推荐机制方面,大多数服装订购网站采用的都是用户提交身形、风格数据+编辑人工推荐的模式,Stitch Fix不一样的地方在于它还结合了机器算法推荐。这些顾客提供的身材比例,主观数据,加上销售记录的交叉核对,挖掘每个人专属的服装推荐模型。 这种一对一营销是最好的服务。
数据整合改变了企业的营销方式,现在经验已经不是累积在人的身上,而是完全依赖消费者的行为数据去做推荐。未来,销售人员不再只是销售人员,而能以专业的数据预测,搭配人性的亲切互动推荐商品,升级成为顾问型销售。
DT学院: 能举个例子说明精准营销的好处么?
董 飞: “颠覆营销”书中提到一个例子,可以引述一下,大家思考一个问题:如果你打算搜集200份有效问卷,依照以往的经验,你需要发多少份问卷,才能达到这个目标?预计用多少预算和时间来执行?
以往的方法是这样的:评估网络问卷大约是5%的回收率,中国直播网,想要保证收到200份的问卷,就必须有20倍的发送量,也就是发出4000份问卷,一个月内如果可以回收,就是不错的表现。
但现在不一样了,在执行大数据分析的3小时内,就可以轻松完成以下的目标:
1. 精准挑选出1%的VIP顾客
2. 发送390份问卷,全部回收
3. 问卷寄出3小时内回收35%的问卷
4. 5天内就回收了超过目标数86%的问卷数
5. 所需时间和预算都在以往的10%以下
这是怎么做到在问卷发送后的3个小时就回收35%? 那是因为数据做到了发送时间的"一对一定制化",利用数据得出,A先生最可能在什么时间打开邮件就在那个时间点发送问卷。举例来说,有基人在上班路上会打开邮件,但如果是开车族,并没有时间填写答案,而搭乘公共交通工具的人,上班路上的时间会玩手机,填写答案的概率就高,这些都是数据细分受众的好处。
DT学院: 如何生成用户的精准画像?
董 飞: 大致分成三步:1. 采集和清理数据:用已知预测未知;2. 用户分群:分门别类贴标签;3. 制定策略:优化再调整。
采集和清理数据:用已知预测未知
#p#分页标题#e#首先得掌握繁杂的数据源。包括用户数据、各式活动数据、电子邮件订阅数、线上或线下数据库及客户服务信息等。这个是累积数据库;这里面最基础的就是如何收集网站/APP用户行为数据。比如当你登陆某网站,其Cookie就一直驻留在浏览器中,当用户触及的动作,点击的位置,按钮,点赞,评论,粉丝,还有访问的路径,可以识别并记录他/她的所有浏览行为,然后持续分析浏览过的关键词和页面,分析出他的短期需求和长期兴趣。还可以通过分析朋友圈,获得非常清晰获得对方的工作,爱好,教育等方面,这比个人填写的表单,还要更全面和真实。
我们用已知的数据寻找线索,不断挖掘素材,不但可以巩固老会员,也可以分析出未知的顾客与需求,进一步开发市场。
用户分群:分门别类贴标签
描述分析是最基本的分析统计方法,描述统计分为两大部分:数据描述和指标统计。数据描述:用来对数据进行基本情况的刻画,包括数据总数,范围,数据来源。指标统计:把分布,对比,预测指标进行建模。这里常常是Data mining的一些数学模型,像响应率分析模型,客户倾向性模型,这类分群使用Lift图,用打分的方法告诉你哪一类客户有较高的接触和转化的价值。
在分析阶段,数据会转换为影响指数,进而可以做"一对一"的精准营销。举个例子,一个80后客户喜欢在生鲜网站上早上10点下单买菜,晚上6点回家做饭,周末喜欢去附近吃日本料理,经过搜集与转换,就会产生一些标签,包括"80后""生鲜""做饭""日本料理"等等,贴在消费者身上。
制定策略:优化再调整
有了用户画像之后,便能清楚了解需求,在实际操作上,能深度经营顾客关系,甚至找到扩散口碑的机会。例如上面例子中,若有生鲜的打折券,日本餐馆最新推荐,营销人员就会把适合产品的相关信息,精准推送这个消费者的手机中;针对不同产品发送推荐信息,同时也不断通过满意度调查,跟踪码确认等方式,掌握顾客各方面的行为与偏好。
除了顾客分群之外,营销人员也在不同时间阶段观察成长率和成功率,前后期对照,确认整体经营策略与方向是否正确;若效果不佳,又该用什么策略应对。反复试错并调整模型,做到循环优化。这个阶段的目的是提炼价值,再根据客户需求精准营销,最后追踪客户反馈的信息,完成闭环优化。
我们从数据整合导入开始,聚合数据,在进行数据的分析挖掘。数据分析和挖掘还是有一些区别。数据分析重点是观察数据,单纯的统计,看KPI的升降原因。而数据挖掘从细微和模型角度去研究数据,从学习集,训练集发现知识规则,除了一些比较商业化的软件SAS,WEKA功能强大的数据分析挖掘软件,这边还是更推荐使用R,Python,因为SAS,SPSS本身比较昂贵,也很难做页面和服务级别的API,而Python和R有丰富的库,可以类似WEKA的模块,无缝交互其他API和程序,这里还需要熟悉数据库,Hadoop等。
在算法部分,我们通过相似度衡量聚类算法,主要核心是数据简化,让它具备大规模数据的能力,这里做变换,降维,抽样。在分类这一块,我们使用了决策树,Boosting监督的分类学习方法,随机森林来解决回归和分类问题。
DT学院: 请谈谈你们公司目前怎么做精准营销的,比如如何拉新和留存客户?
董 飞: 我们公司(Datatist)是专注于用大数据机器学习技术自动支持企业的智能决策和商业优化。拥有外部营销和内部营销相结合的闭环一体化用户运营优化解决方案。
对于外部营销优化:通过机器学习内部客户的特征,结合word2vec,神经网络多种模型精准预测最可能转化的潜在外部客户。
对于内部营销优化:通过机器学习客户的行为特征,精准预测最可能活跃的客户,最可能购买的客户等。并且通过内部触达渠道刺激用户转化,A/B test,效果跟踪和持续优化等一站式解决方案提高内部客户的转化率。
我们模型使用的算法包括神经网络,逻辑回归,随机森林和回归树,但这些对于营销人员意义不大,重要的是,可能性模型是通过学习历史行为来预测客户未来动作的。下面在使用模型之前,训练期和调试期使用历史数据的方法。
拉新和留存是很多客户最关心的,我们的做法是通过数据挖掘和机器学习的方式提升效率,并且两者是有关联,通过内部留存每一步的跟踪和转化,我们可以刻画用户的精准画像,对不同分类的客户做不同刺激,预测可能转化的用户,并将特征记录下来,对外部的拉新数据能够重用。
以最常使用的电子邮件推送为例,以往只能盲目发送,消费者没反应就再发一次。导入大数据分析后,可以很精准地掌握消费者的打开情况,消费者没有点开阅读一定有原因,一种策略是规划促销活动,再次发送给没点开的消费者,观察哪些消费者对促销内容有反应,不断回馈修正。 还有一种策略是建立每个消费者的消费习惯周期,比如顾客A是每隔30天购买,顾客B每隔60天购买,那么通过建模,第30天是顾客A的最可能购买点,之后购买概率衰退,最好在30天前的那一周发送电子邮件提醒刺激。如果太早提醒还没发现,太晚又错过了。因此在适当的时机,营销才能事半功倍。
总之,客户的资源有限,如何将人、时间、金钱等资源得花在刀刃上?通过数据进行有效资源分配,可以降低营销预算,只要在关键购买点触动他们,就可以达到很好的效果。但是对于即将流失的顾客,就应该投入相对高的营销预算,产生资源最大化的效果。
特别声明:本文为中国直播网直播号作者或机构上传并发布,仅代表该作者或机构观点,不代表中国直播网的观点或立场,中国直播网仅提供信息发布平台。
版权声明:版权归著作权人,转载仅限于传递更多信息,如来源标注错误侵害了您的权利,请来邮件通知删除,一起成长谢谢
欢迎加入:直播号,开启无限创作!一个敢纰漏真实事件,说真话的创作分享平台,一个原则:只要真实,不怕事大,有线索就报料吧!申请直播号请用电脑访问https://zbh.zhibotv.com.cn。