2020年11月29日上午,伟易博2020级商业剖析硕士班行业沙龙委员会约请51Talk首席数据科学家,大数据智能中心认真人刘思喆先生为同砚们带来题为“在线教育数据科学家的自我修养”的行业沙龙。
速读摘要:在有了周全的数据以及精准的模子,数据团队盘算实时的展望每个客户的付费概率,并泛起给"课程照料"资助他们做更好的决议。当我们有了更多信息之后,真相才会逐步浮出水面,并且并不是模子越精准效果越好,还需要思量模子的使用者和使用场景。并为告竣上述目的制订所需接纳的战略,并且明确这项战略会针对哪个指标举行转变,之后视察指标,权衡战略的有用性,反应营业目的告竣情形。在沙龙的最后,同砚们踊跃加入提问,刘思喆先生就同砚们的问题做出了详细的解答,指导同砚们在掌握统计知识的同时,也要注重对营业的明确,要注重营业的投入产出比和可诠释性。
原文约 2040 字,建议阅读 5 分钟
一、两个有趣的案例
刘思喆先生枚举了营业中遇到的两个有趣的案例:
案例1:虽单看差别星座、差别年岁的“课程照料”付费转化率最高,但当综合思量所有的因素时,发明星座和年岁着实并不显著,而“课程照料”的籍贯才是显著变量,由于这个指标可以体现“课程照料”的效劳意识。
案例2:在有了周全的数据以及精准的模子,数据团队盘算实时的展望每个客户的付费概率,并泛起给“课程照料”资助他们做更好的决议。但在AB测试时,发明看到信息的“课程照料”,效率显著地低于没有看到信息的“课程照料”,由于一些“课程照料”看到特殊好的客户选择不跟进。
通过这两个案例,刘思喆先生向同砚们先容在现实营业中要小心单维度指标剖析转达的信息,当我们有了更多信息之后,真相才会逐步浮出水面,并且并不是模子越精准效果越好,还需要思量模子的使用者和使用场景。
二、事情内容的时间轴
刘思喆先生枚举了51Talk大数据团队的主要事情内容以及为什么做这些项目,指出在线教育领域有四个要害指标应该关注,划分为转化率,退费率,续费率,转先容率。现在51Talk已建设四套归因模子,周全回覆以上四个要害指标的的相关影响因素。
随着营业的推进,现在51Talk的数据团队已逐步细腻化,演变为数据剖析(商业数据剖析和决议支持、BI可视化)、数据架构(需求和妄想、数据客栈、手艺平台、数据质量)和增添应用(数据挖掘、供需平衡算法、数据产品)三个偏向。
这一部分刘思喆先生总结为,看起来很厉害的算法纷歧建都有商业价值;模子的应用偏向和问题的界说有很大关系,现实营业中是可以通过退费与否的来反向找到营业的误差点;数据团队应知道怎样二次应用数据以及其附加价值在哪,在没有这部分信息时,数据团队需要自动出击,向外走一步;数据团队还要将思索二阶和三阶问题酿本钱能。
三、商业赋能和数据驱动
从用户视角来看,用户价值主张有三点:一是总本钱最低(卓越运营,又自制又好),二是产品领先(极致体验,对用户心智爆发影响),三是为用户提供解决计划。那关于一个数据团队关注的焦点点是第一点,即通过加速发明数据的速率;合理表达营业,降低要害人决媾和时间本钱;同时做到面向客户智能化,降低组织的协作本钱,快速将小我私家智慧成为群体智慧等方法,让一个企业的生产效率高于市场。
数据驱动的要害要素为:(1)行为和预期,即展望数据的转变,举行直击行为,行为反响闭环;(2)缩短反响周期,数据团队应清晰机制的建设,数据的网络,泛起的工具以及泛起方法等。在现实营业中,数据驱动保存要领论,即在营业中凭证营业、产品、功效等界说目的,并为告竣上述目的制订所需接纳的战略,并且明确这项战略会针对哪个指标举行转变,之后视察指标,权衡战略的有用性,反应营业目的告竣情形。
四、数据科学家的要求
通过“能解决问题的剖析师手艺栈敏感性剖析”,刘思喆先生指出在23项数据剖析的基本素质要求中,剖析师更应关注复盘和反思能力,问题界定和拆解能力,价值和主要性判断能力,系统化和结构化头脑这四方面能力。
在沙龙的最后,同砚们踊跃加入提问,刘思喆先生就同砚们的问题做出了详细的解答,指导同砚们在掌握统计知识的同时,也要注重对营业的明确,要注重营业的投入产出比和可诠释性。他建议同砚们三点建议:一是要终身学习才华跟上数据的转变;二是小我私家要找到行业的“势”,现在数据科学的盈利在细分的笔直领域;三是岗位选择上,与决议层远近体现了数据团队的话语权。
嘉宾简介:刘思喆,51Talk(NYSE:COE)首席数据科学家,大数据智能中心认真人,认真商业流程算法优化、数据产品、数据平台建设,以及运营剖析、用户行为挖掘、风控和反作弊等相关事情。在加入51Talk前,他是京东(JD.com)推荐平台部高级司理,一经将推荐系统带来订单占全京东订单的比例,从5%提升到10%。入选京东手艺名人堂,在《京东手艺解密》一书中,15 位手艺牛人之一。同时他照旧“统计之都”理事会成员,中国人民大学大数据剖析实验班、首经贸信息学院校外硕士生导师。海内R语言的早期推广者,17年的使用履历,《153分钟学会R》的作者,《R语言焦点手艺手册》的译者。