Bendi新闻
>
数据分析终极难题:多影响因素下,归因模型怎么搭建?

数据分析终极难题:多影响因素下,归因模型怎么搭建?

7月前
数据分析领域有几个经典的终极难题。多影响因素归因,绝对是其中最让人头大的。特别是临近促销旺季,品牌、售后、客服、供应链、运营、产品、商品管理都会跑来,说:“今年业绩不错呀,公司多赚的10个亿,到底几个亿归功于品牌,到底几个亿归功于供应……请量化分析一下,谢谢”。
那么,到底该怎么分析呢?今天我们详细讲解一下。

多影响因素归因的表面

为啥这个问题是终极难题,只要做一个实验,马上便知道。
同学们可以亲自试试哦

第一步:请闭上眼睛

第二步:回忆淘宝里最近买的一件商品

第三步:在脑海里回忆该商品的名称、包装、价格、品牌、客服小妹声音……

第四步:睁开眼,告诉自己:我为这个商品付费的XXX钱,其中有X%是付给名称,X%付给包装,X%付费给商品上blingbling的广告,X%付给快递叔叔……
答得出来不?

不但很难答出来,估计很多同学连最近买的是啥都不记得了。

消费者不是所有消费都理性。

消费者不是所有商品都重视。

商家提供的品牌、服务、产品本身就是一个整体。

因此站在消费者角度,这个问题从源头上就不成立。特别是啤酒瓜子矿泉水一类的快消类产品。价格低,消费频次高,冲动消费多,心情好了就买点,心情不好了也买点,因此很难讲清楚。
大宗耐用品,比如房子、车子可能思考得多一些,有一定概率区分出来,但是仍然很难量化到每个因素的得分,如果怀疑这点的,想象你结婚那一刻你(也许是你老婆)有多纠结,就秒懂了,哈哈。
那么问题来了:为啥明知道分不清楚,各个部门还一而再、再而三要求分家呢?
这就触及到问题的本质:大家的屁股坐在哪里。

多影响因素归因的本质

表象上看,多影响因素归因,难在很难拆解数据。
本质上看,多影响因素归因,只是部门间分赃不均的结果。
每个部门都太急于证明自己的价值,总想努力跟业绩指标挂上联系。
特别在年底,要为部门争取奖金,要为明年争取预算,分家的冲动就更高。
因此,多影响因素归因,本质上是在衡量部门价值,这才是核心难点。
很多同学会忽视这个核心问题,用一些简单的数据方法处理。比如:把各个部门的费用设为x,把业绩设为y然后怼一个线性回归模型出来。然后把各个参数的系数视为贡献大小。且不说,这么干,首先完全误会了回归模型的含义;其次,也没有考虑分类变量和连续变量的问题。单纯就结果本身,也会被人喷死。
比如,算出来销售的系数是2,供应链的系数是1,那明年多找2倍的销售,却只提供1倍的商品,还能有这个销售业绩吗?肯定不可能啊,有枪没子弹啊!部门之间分工合作,不是简单的1+1=2的关系,这是常识。因此强行割裂部门间联系,把不同分类的部门拉在一起评价,是注定要扑街的。
因此,破局思路,在于从一开始,就应该直接否掉这种一条公式打天下的想法。从部门工作性质出发,建立科学的衡量机制,从而有效化解这种立功焦虑。

破局思路

想破局,首先得分清各个部门的工作类型与贡献方式(如下图):
之后,就可以分门别类进行分析考察。
软支持类:放弃直接关联销售业绩,按需分配。

软支持的核心问题,在于不能自证清白。对于品牌宣传而言,即使所有宣传都带链接,导流到购买页面,也无法证明到底用户购买是多大因为品牌,甚至这些年爆款打法、网红带货,都在可以弱化品牌,突出产品功能和粉丝效应。

况且,至少6成以上的品牌宣传,根本连带货链接都没有(比如上市前的宣传),就更无从谈起了。客服、售后也同理,虽然顾客找上门来的时候,这两者服务很重要。但是主动发起的客户比例少,因此很难关联整体业绩。
这种不做不行,做了说不清楚效果的事,最好直接按整体业绩比例分配资源,考核自身的效果,而不是非要强行关联销售业绩。
比如根据产品生命周期/时间,配置宣传力度(如下图)宣传能达成足够市场认知,覆盖足够人数(考核点击、转发、阅读数等等)即完成任务。
比如客服、售后。根据业务总量分配资源和人力。考核本身服务满意度,服务覆盖率,从呼叫到响应的速度,严重投诉/风险事件的应对速度,等等。做好本职工作及完成任务。
硬支持类:考核。
硬支持类的考核就简单清晰很多:供给到位,损耗降低。并且追求的是峰值控制与长期水平的下降。太过计较一城一地得失,反而容易定出来很死板的流程,搞出很多乌龙(如下图)
硬拉动类:引入ABtest机制,提前预设目标。
硬拉动类,属于叠加buff的做法,因此必须事先设好控制变量,否则混在一堆因素里,事后根本无法拆分。比如事先设定好拉动的总目标,事先测试方案效果,事中余留参照组,采集过程数据,这样才能在事后做好区分。
硬拉动类是可以评估的,问题总是出在:事先不做工作,事中不留参照,不踩数据。啥都没有,事后能分析出来就见鬼了。
核心流程:建立分级机制,深入分析影响。
核心流程里,销售和产品互怼的事也很常见,但是这种互怼是可以分析出,到底过错在谁那边的。只要建立好分级机制,对渠道质量、商品属性进行打标签分析,监控过程转化率,是可以做深入分析的,因此核心流程尽量多做分析,不留扯皮空间(如下图)。
现实永远很骨感
以上只是理想状态下的建议,实际开工:
  • 总有人想争取更多资源,大喊:“品效合一!”“心智资源!”
  • 总有人认为客服售后没必要,今年再扣他点费用?(从而引发服务部门的奋起反击“老子也有贡献!”)
  • 总有人喜欢夸大自己贡献,促销活动效益写的巨高,甚至比自然销量还高。
  • 总有人怕被追究责任,拼命往:没有促销!没有支持!产品不给力上推责任。
所以有关“到底每个部门贡献多少,能不能具体到每一块钱里几毛几分是谁来的”的议题,永远不会停下来。
加之,总有新入行的数据分析师,认为只要怼几个数据进线性回归或者因子分析模型,就能算个参数出来让每个部门满意。所以这种来来回回扯皮的事,还会延续很多很多年,哈哈哈。

小结

类似的数据分析千古难题,还有很多:
  • 为什么ABtest中实验有效,投产没效,到底怎么测得准!
  • 自然增长率要怎么计算,才是全宇宙最公平合理的!
  • 用户心智资源的开发与认知深度的变化,如何衡量!
  • 销售预测,到底怎么才能预测100%精准!
  • ……
每一个问题,都是表面看似数据分析,背后是人心贪婪,推过揽功。业绩好了就说是自己做的,业绩不好就甩给外部因素和内部各种无法量化的因素,以图自保。

源 | 接地气的陈老师(ID:gh_abf29df6ada8

作者 | 接地气的陈老师 ;编辑 | 荔枝

内容仅代表作者独立观点,不代表早读课立场



微信扫码关注该文公众号作者

来源:互联网er的早读课

相关新闻

大模型开闭源之争的终极答案:不重要?!大模型时代,顶尖数据分析团队是怎样炼成的?| 极客时间企业版大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度大数据分析:特斯拉等电动车的事故率真的比燃油车多吗?今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理求职干货 | 海归求职:数据(数据分析、数据科学、工程)停止内卷的终极办法:冬眠!?小模型怎么扩大参数?SOLAR: “自我嫁接”就行!神经网络架构「殊途同归」?ICML 2024论文:模型不同,但学习内容相同Byzer:大模型时代下的AI数据库这个环境下,如何体现数据分析的价值?偷窃、殴打、校园霸凌、团体虐杀...... 青少年犯罪成世界性难题:我们的孩子因何残忍?多少?你说多少?GAP童装终极省钱攻略:无限开大!2折到底!完整的数据指标体系,大厂是怎么搭建的?58同城孙启明:生活服务垂类大模型怎么搭?自研+开源两手抓,火速微调上线Llama 3|GenAICon2024两万字实录:该怎么让机器人吃下大模型?丨GAIR live已经疯了?特鲁多刚刚宣布:对房东下狠手,三大新政压!华人网友:以后没人敢出租房屋了...终极提问:OPenAI能取代Google吗?让CPU跑大模型该怎么做?阿里云交出答卷:AI推理速度飙升7倍英伟达 Nemotron-4 340B 火了!合成数据能否将大模型带入下一个阶段?奇葩不?百度股价下挫10%:因文心大模型被引用 市场担忧被美国制裁对话林咏华:刚在“AI春晚”上开源了3.4T数据集的智源,是如何死磕大模型数据难题的很想一次性讲清楚:数据分析师有必要转数据产品经理么?终极对决:腾讯 vs 字节跳动,你站谁?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。