我在外卖系统里做「判官」
文 | 解亦鸿 魏荣欢
编辑 | 陶若谷
柯南
顾客:说了炒饭不要放葱,偏要放!(一星差评)
商家:亲,我们的炒饭都是不放葱的,这个是蒜苗。
系统:评审员,你觉得这个任务的最终结果是?
这道题被发在豆瓣“评审团癫人大赏”小组,判官们吵开了锅。
考据党直接发来蔬菜科普图例,葱类分为大葱、京葱、火葱、香葱,蒜类分为大蒜、蒜黄、蒜苗、蒜苔……可判官们的依据,只有顾客差评里的炒饭照片:泛着油光的米粒儿间隙,掺杂几颗不知名的茎类蔬菜。有人发帖说,“天王老子来了,它也是葱花。”立刻被怼回去,“这就是蒜苗,如果你连蒜苗都不认识,就别出来丢人现眼了。”考据党也不知道什么才是正确答案,它们已经被切成丁,失去了完整形状。
不管怎样,他们的投票都会汇入系统票池。如果支持商家的票数大于50%,系统将剔除该差评对商家评分的影响,差评会被隐藏展示——商家获胜。如果支持顾客的票数大于50%,差评就会维持展示——顾客获胜。
方雨被分到的题目里,也有类似的难题。她曾在一个案子中冤枉了好人。顾客点了杯奶茶,指控商家没有提供吸管。商家主张自己是清白的,还提交了视频监控截图作证,图片里可以看到,店员往外卖袋装入了吸管。方雨判定,商家举证清晰,她投票给了被告。
系统却扣掉了她的一条命。因为80%左右的评审都支持了顾客,系统采用少数服从多数的规则,多数者阵营的选择将被视作正确判决。投票结束后,评审员会在开放区留下支持某一方的理由,方雨才明白,顾客的订单是9月份的,而商家给出的监控截图时间为6月,举证造假,不应该采信。丢掉一条命的教训,让方雨总结出经验:时间是最关键的举证信息。她自诩不会代入顾客、商家、骑手任何一方,“我只看证据,证据最重要。”
在她看来,做评审员是一个逐渐变成柯南的过程。
在一次民宿案件里,方雨仔细检查了证据,发现商家使用的是经典造假手段——民宿商家与顾客常在微信中完成沟通,但商家提供的微信对话框,绿色是顾客,白色是商家,发件人和收件人对调了。投票前,她在心里向其他评审员呼喊,“一定要发现这个细节呀。”但方雨还是丢掉了当天的命数,因为52%的评审都没注意到这个细节,商家的虚假举证被通过。
每个评审员每天有两条命,如果投票站在少数者阵营,系统会扣掉一条命,即使少数阵营判对了,在这套机制里,也会被扣掉一条命。出于对决策质量的考量,每天评审员的题目是有限的,不超过20个。
●资料图,源自东方IC
判的案子越多,识破商家做伪证的速度也越快。差评在系统里的第一道审核关卡是机器,AI可以初步判断是否折叠展示,有经验的判官都知道,很多商家为了骗过机器,已经养成一套装傻话术:比如无中生有——顾客在差评里吐槽,“麻了,真难吃”,商家可以申诉说,“麻了”是用谐音骂脏话,是恶毒评论,建议折叠这条。
评审员方雨也看到过这套话术,她的判断原则是,“装傻的商家一律败诉,他们对待差评的态度不够端正。”她为了不误判,常把自己拿不准的案子分享到豆瓣小组,投票前和大家讨论一番,再做决定。拿不准的,通常是一些习俗、常识上的认知差异。比如锅包肉一定默认是猪肉吗,鸡肉算不算?图片上的水果是丑橘还是果冻橙?煲仔饭里必须要能吃到锅巴吗?
面对这样的问题,在北京读社会学的女孩杨琴也迷茫过。她是煲仔饭爱好者,在她的认知里,人们吃煲仔饭为的就是要“吃那一口锅巴”。当了判官后她发现,有的粤菜商家很精明,会在煲仔饭后面括号注明“没有锅巴”,顾客一旦差评质疑“煲仔饭怎么没有锅巴”,商家也有了正当理由回复,“我标注过了”。
每当遇到这种题,她都会投票支持顾客,尽管这并不是多数人的选择。“很多判官觉得,顾客没看到这一行提醒小字,是顾客自己的问题,但是大家忘了,没有锅巴的还能叫煲仔饭吗?”
在她的价值观里,判决的公正性也意味着将人们生活中的习俗与常识统一度量衡。有一个顾客点了家上海本帮菜,差评说“齁甜”,杨琴看是本帮菜,本身就偏甜,觉得一定是顾客自己吃得太淡,投票支持了商家。投票后一看评论区,她又陷入纠结——其他人提出,“这个顾客是江苏人,江苏人已经很能吃甜了,如果他都说甜,说明商家做的真是齁甜。”
而辣不辣比甜不甜更难判。顾客如果差评“太辣了”,杨琴会先看这个人选择的辣度,如果是“微微辣”或“微辣”,那她只好仔细检查图片里辣椒的量;如果是“中辣”“特辣”或“变态辣”,她会直接投票支持商家,“不能吃辣还点变态辣,这人是不是有毛病。”
乐子法庭
在外卖系统的评审团里,根据平台给出的官方数据,平均每天有12万评审员在参与投票,解决纠纷。系统发言人称,评审员绝大多数是大学生。他们中有一部分是自愿成为评审员的,投票的入口向每个人敞开,也有一些“判官”是被平台邀请的优质用户。
顾客一星差评:柠檬茶里一整杯都是冰块,这是让我喝茶还是喝冰?
商家回复:这是因为骑手送的太快了,冰块还没有完全化掉。
碰到这样的题目,方雨会不假思索地支持顾客。成为评审员半年以来,这已经不是她第一次遇到这样的癫商。在她看来,商家显然是偷工减料,放大量冰块本就不合理,收到差评后,还要甩锅给骑手,“骑手真惨,送慢送快,背锅的都是他,商家怎么不自己来送?”
这一次,80%以上的评审都投票支持了顾客。“今天的快乐又有了。”方雨在兰州一所大学读会计学,同寝室的舍友先当上了判官,她看舍友判案时总是哈哈大笑,也想进来找点乐子,常在晚上睡觉前点开。
像方雨这样的评审团成员不在少数。对他们来说,这里像个“乐子法庭”——消费者是原告,商家是被告,自己则是陪审团的一员。一张选票,往往能决定纠纷中谁才是正义的那方。方雨在专业里时常处理经济、数学问题,接触不到解决纠纷这类工作,能在判案中证明某一方的清白,她感觉是件有价值感的事,逐渐喜欢上了投票的感觉。
在北京一所211高校读社会学研究生的杨琴,比方雨更早加入到这个系统里。她一直在思考,系统为什么不让判官们先讨论,再投票?她猜测,“系统可能认为,在不受任何人影响的情况下,做出的选择才是相对公正的。但是我觉得就像陪审团一样,经历了讨论得出来的结果,可能才是更接近真相的。”
评审系统刚建立起来的2020年,杨琴就在点外卖时收到邀请信息,加入到评审团。那时还没有扣掉命数的闯关玩法,被告也是实名的。她曾经因为偏爱一家云吞饺子馆,每次遇到这家店被“差评”,都会不由自主投票支持它。现在系统已将被告匿名,“可以规避判官的一部分偏见。”
杨琴喜欢逛论坛,刷争议帖——综艺里哭了的女嘉宾是真的委屈吗?备婚时产生冲突的伴娘和新娘谁更在理?她都会参与讨论。除了当评审员,她能想到的上一次投票,已经是上学时选班委。但无非是从一些人里选几个人,选举标准也就变成性格好、抛头露面多、熟悉、人缘好,无法拥有真正属于自己的价值判断。
她讲述了她在公交车上遇到过的一件小事。三个中老年阿姨上车后,看中了两两相对的四人座位,她们入座时,一个十多岁的男孩原本也想坐在这里,并给妈妈占座,但是看到阿姨们入座,只好起身离开。男孩的妈妈这时走过来,看到孩子没了座位,跟三个阿姨说,我们本来要坐一起的。对方一头雾水,其他乘客问这个妈妈,是你的孩子给她们让座了吗?妈妈大声否认说不是,“是这仨老太太抢了我们的座位。”
杨琴就坐在附近,凑巧目睹了全程。“座位又不是你一个人享有的,根本不存在抢”,她很想把真相讲出来,但是阿姨们都没吭声,杨琴把想说的话又憋回肚子里。她觉得自己比当事人更在乎这件小事的公道,但在那样一个场合,发声可能会挑起争端,她选择了跟当事人一起沉默。
方雨在“乐子法庭”当评审的纪录曾排到过全省第一。相比生活中个体的声音被忽视,在这里投的每一票能让方雨感受到一种确定性,“我的价值判断是可以被听到的。”她想起上学期的审计实务课,同学都反感老师采用“翻转课堂”的形式,“学生大部分没有实际的工作经验,怎么能上台教另一群学生实务操作?”但没人敢提出异见,很多同学匿名发抖音吐槽这样上课有什么意义,期待老师可以在某天偶然刷到,促成一些改变。
方雨原本想打印一封匿名信,塞到老师办公室,又想到高中时递交匿名信,被老师查监控揪了出来,批评教育了一下午,犹豫半天没去。第二学年,她发现下一届学妹还在问自己要同一门课的PPT,“只觉得形式主义延续了下去,改变不了什么。”
●方雨的评审纪录。讲述者供图
其他评审员也提到,生活中很少有机会就“公平与真相”一来一回地争论,能参与的投票也只有小区里选个楼长,候选者还是根本不认识的邻居。当评审员不一样,一位在上海做程序员的评审发现,自己投票时,总能注意到一些别人无法觉察的线索。
在一个二手交易平台,他经常识别出卖家的金饰克重造假,帮买家投出一票,即便结果是败诉,也会收到买家在系统里送出的一朵小红花,他很喜欢这样的时刻,“如果能帮到这个人最好,即便不如愿,对方也会抱有感激。”
“一个公平的系统是需要逐渐完善的。”杨琴记得2023年以前,外卖评审员系统没有上传图片的功能,被告全靠一张嘴在那里反驳。顾客说“花送到的时候已经枯萎了”,商家说“我送出的时候还是新鲜的”,口说无凭互相甩锅。系统可以提交图片之后,商家的自证方式变得多元化。花交给骑手前,先给单号和花束拍照,杨琴看到这样的证据就会采信。
而原告的举证远不如被告充分。判案时,杨琴总想回到原告最初的场景里,因为他们是给出差评的人——米饭太硬了,椒麻鸡做得太辣了……“所以是真的硬吗?辣吗?有多硬?有多辣?我很想让原告描述得更清晰一点。”但原告只留下一句评论就走了。
在目前的系统中,评审员还不能和原告对话。用户吐槽,抱怨,发泄完怒火离开,“没有人在意自己的差评公不公平,是不是真相,系统也不会要求他们参与举证。”杨琴有时手握投票权,仍然不知该投给哪一方。
她记得一个买菜的案子。原告在生鲜超市买了油菜,指控菜量没给够300克,商家提交了监控截图。杨琴很犹豫,她想看清秤上的克数,但怎么放大图片都很模糊。她只能根据菜量的模样,估算跟300克差不多,支持了被告。
投机、失意、恶意
开紫菜包饭店的五年时间里,钟芸遇到过许多令人迷惑的差评,她多数时刻都搞不懂,“顾客是哪里不满意了呢?”有时差评就俩字,“啊这”。她追评,“饭哪里不合口味了嘛?”对方没了回音。
紫菜包饭店是她跟爸爸一起开的。他50多岁从一线城市的餐饮后厨退休,回老家想做点轻松的厨房工作。爸爸只会做饭,弄不懂外卖平台这套,钟芸就帮他管理线上运营,白天在吉林四平市一家外贸公司上班。
刚开店的时候,钟芸觉得自己也很用心,她手绘了一个长发小女孩,头上趴着一团紫菜卷,设计成店铺logo。为了让紫菜包饭保温,她用锡纸替代饭盒来装,还因此收到过不少好评。但也收到过差评——“怎么锡纸这么包着就给我送来了,连盒子都不给”。钟芸觉得委屈,但也没申诉,觉得可能有的人就是不喜欢这种形式。
今年2月的一天下午,她在上班时间接到爸爸打来的电话,说有个顾客把饭退了,但紫菜包饭已经卷好,他正准备切,不知道该怎么办。钟芸打开系统,发现确实接到一单退款,顾客下单5分钟后退的。她立刻给顾客打电话,想劝一劝。
她问对方:您是什么原因想退款呀?听声音,对面像一个年轻的小伙子,只说“订错了,不要了”,电话很快挂断。几分钟后,系统里收到他给了条一星差评,理由是商家态度不好。钟芸又冤又气,“我为什么要打这通电话?还多余闹出一条差评。”
几乎每一个商家都提到,在经营过程中,客户反手就给一个差评是再常见不过的事。“消费者吃到不错的炸鸡,并不会想到主动给好评,一顿饭的小事,吃完就过去了,但一旦吃到不满意的炸鸡,他们一定会给差评。”这是另一位商家付玲的经验。
在杭州加盟炸鸡店不到一年,她就后悔了。一位顾客连续两天用同一张照片申请退款,说“吃出了异物”。她第一天同意了退款,第二天才生疑,怎么可能有一模一样的头发和面?——在顾客第二天提交的差评图片里,那根头发以同样的形状掺杂在同一碗火鸡面里。付玲识别出,这是典型用差评换退款的,写差评就能吃霸王餐。
差评里隐藏着消费者的投机,生活中的失意,甚至无端的恶意,当它们被系统纳入评审流程,人性暗面也在这里一览无余。一位想吃生煎包的食客,点餐之后给了一星差评,理由是,“包子挺好吃的,但是就要给个差评让商家感受感受,生意可不是好做的。”买了35束玫瑰的顾客,告白失败后给了商家一星差评,因为“这花和我一样是臭的”。
点珍珠奶茶的顾客差评说,珍珠全沉底了,没搅匀,商家回复,“这个珍珠我要怎么让它漂起来,是阿基米德可以浮在天上吗?”点蜜雪冰城的差评说,“其他店可以点冰淇淋送冰块,就你们家不行”。一位评审员投给了“不适合展示”,她自己也是商家,明白小本经营的不易。这条评价58%的人选择不适合展示,42%的人选了适合。
●一星差评部分截图。讲述者供图
被退紫菜包饭的钟芸发起了申诉,想证明自己的服务态度没问题。她觉得自己有证据——跟顾客交涉的电话有语音提示,说会被录音。
商家要想对差评进行申诉,第一步是选择正确的差评分类——“无意义差评”“非商家原因差评”“不实差评”……钟芸的申诉经常以“不符合对应分类”为由被驳回,在她失败的经验里,那条不知所云的差评“啊这”,居然不属于无意义差评。
然后是机器审核,通常情况下通不过,她又申诉一次,“机器人懂个啥,我要的是跟人对话。”一小时后等来人工客服回电,她讲述了沟通过程:
她问对方,“我的申诉是为什么失败了?你可以听见我和顾客电话沟通的过程,可以告诉我是为什么吗?”平台客服回复,评价系统和外卖订单系统是两个系统;作为评价系统的客服,看不到订单具体内容,也听不到那通电话,只能看到顾客在差评里说,“这家店态度不好”。
钟芸继续问客服,“那能不能申请进评审团,让判官们评评理?”钟芸知道高手在民间,有经验的判官,根据下单时间可以分析出很多东西。但客服告诉她,有争议的差评才能进评审团。“进入评审团又有什么标准吗?”钟芸的追问没有得到回复。
对商家来说,能不能进入法庭当上“被告”,就像在抽盲盒的隐藏款,概率上是有可能的,但需要运气。许多商家拥有和钟芸一样的困惑,只要商家能够提供足够的支持证据,是否就能启动评审团机制?准入标准是什么?
按照一位美容商家的经验,她在申诉时针对差评逐条分析,认真说理,效果还不如打感情牌。申诉失败是常态,标准不透明是商家们反映的共同问题。钟芸申诉失败后,申请了“餐损赔偿”——出餐流程正常的情况下,商家可以申请这一项,补偿顾客取消订单造成的经济损失。她第二天才发现,顾客反复提交的退款申请中,有一次选的是“骑手提前点击送达”作为理由,她又开始担心,“这笔餐损赔偿的钱,可能从骑手手里扣走了。”
看不见的手
在“法庭”里,评审员常常看到商家把锅甩给骑手,“骑手送太久,餐变辣了”,“骑手送太久,冰块变多了”……方雨最怕遇到这样的题——骑手配送时长12分钟,订单完成时长79分钟,她总是投得很犹豫,想跟骑手对话,“到底是商家出餐慢了,还是骑手送慢了?饭凉了是骑手没放进包装袋里,还是取餐晚了?”
在经济效益与人性化有着结构性矛盾的现代社会,外卖骑手一直处在系统中弱势的一方。但在评审机制的运作中会发现,在商家提交的十分详细的取餐时间线中,的确有骑手花上一个小时,兜圈子去取餐,原因不明。举证链条中没有骑手这一环,很难看出这一餐到底为什么送来已经凉了,为了搞清楚这个问题,有“判官”甚至建议系统增加功能,“让商家申诉顾客差评时,反过来投诉骑手,看看锅到底是谁的。”
●资料图,源自东方IC
当评审团被赋予了过多权责与价值,落在个体身上的纠结就出现了。方雨起初对自己的定位是“绝对的中立”。看到一位顾客因为“新店开业迎宾免费赠送小串”,下单时要求赠送200串,商家只赠了1串,就给了一星差评,方雨毫不犹豫地支持了商家。她觉得顾客明显在占小便宜,这样的差评也不会给其他消费者带来知情的意义。
但她在投票中逐渐觉察到,自己没有办法成为理想的中立者,“消费者和消费者其实是更容易共情的。”恶意差评遇到得多了,她原本觉得顾客有问题,但看到商家在追评里骂“你是不是脑子有病”,她又会转变立场,选择了支持顾客,“商家为什么不能好好说话呢?”。
评审员杨琴的判案标准比方雨更严格。“只要商家给的证据不充分,看不出来真假,就一律视为假,票投给顾客。”在她看来,“法庭”的推出——评审员帮助平台给商家消除差评——本身就是偏向商家的,“所以只有评审员偏向消费者,才能更加公平,这也是一种对消费者的赋权。”
杨琴最初在二手闲置交易平台做陪审员,也有类似的“法庭”系统。买卖双方纠纷由17名自愿参与的“陪审员”裁决,通过投票决定“卖家是否退款”,或“买家能否退货”。由于双方都是个体,杨琴觉得需要绝对中立,没有任何偏向。
在这个系统中,买卖双方可以在陪审员投票结果公布之前,持续上传新的证据,杨琴看到,许多买家直到投票结束的最后一秒钟,都还在补充举证。但作为卖家,即便在投票中获得16:1的支持,也有可能败诉,因为人工客服掌握着一锤定音的权力——买家只要投诉通过,之前的投票全部无效。
熟悉平台运作规律的运营人员王浩解释,很多用户做决策要听第三方声音,看商品评价,店铺评分,而这些东西都来源于普通用户的数据积累。这类平台就是以客户为中心,客户有两端,消费者是,商家也是。在两方产生争议时,举证对于商家来说更容易,他们也更了解自己出售的商品,而消费者已经产生消费,属于弱势,王浩介绍,在举证环节,平台会更倾向消费者。
也有一些“判官”在熟悉这套玩法后失望地离开。在河南做销售的女孩孙路认为,这套机制有意无意地搞成游戏形式,大谈民主公平,实际却在侵占消费者权益——商家每折叠一条差评,顾客就被剥夺一次表达的权利,其他顾客的知情权也被遮蔽了。自己可以促成的唯一改变,不过是帮平台消除差评——和孙路一样,多名离开“法庭”的判官提到,这是他们离开的原因。
●资料图,源自东方IC
判官们关心的是店铺口碑,他们并不知道,自己在“乐子法庭”刷题的时候,商家们则在玩另一套游戏,“上分”。
为了生意,商家大多会对店铺评分进行“维护”。方式很简单,就是花钱——请顾客吃顿霸王餐,换得一条好评。在商家们看来,店铺在外卖平台的评分必须要维持在4.7星以上,低于4.7,平台就开始流量降权,订单量明显减少。
一家皮肤管理店的老板娘为了上分,亲自接待客户,不敢多做推销,提写评价也是轻描淡写一句,生怕客人烦。开店一年多,100多条评论把店铺评分好不容易托到4.6分。直到遇见一条半星评论,评分直接掉到4.4,要爬回原来的评分,至少需要十来条好评。
除了前台五星制的评分,商家后台还有一个百分制的分数,低于90分或80分,会有相应的流量惩罚,保持满分则会得到流量奖励,有的商家为了满分流量,会再额外花一笔钱,参加平台组织的活动。从一颗星到五颗星的评价策略,轻松量化的不仅是口碑,还有流量。几乎所有商家都表示,非常害怕一星差评。卖紫菜包饭的钟芸在申诉时问过平台客服,“差评就放在那里,不折叠也行,但是咱们可不可以不计入(流量)降权?”客服回复她说,没办法实现这样的操作。
店铺持续亏损的后半年,炸鸡店老板付玲不想把钱花在评分“维护”上了,彻底摆烂,让评分和流量自生自灭。她算了一笔账:4.8星左右时,每天约有五六十份订单,平均3-4条差评;放任不管一两个星期,会从4.8降到4.4,店铺明显接不到多少订单了,每天只剩个位数。
顾客用差评换霸王餐那次,她的申诉走到了第二轮,仍然没有通过。申诉期间,平台客服打来电话,问她想怎么处理这件事。她上传了监控照片,想举证当天店里后厨只有两个小伙子,短发,还都戴着帽子,很难产生头发异物,坚持“不退款”。在她的描述中,客服开始引导,“现在店铺经营还不错,如果不退款,会有负面影响。”
今年3月她关掉了炸鸡店,花了最后一笔4000元,用作店铺回收转让。她开始备考雅思,打算重回外贸行业,找个班上。
(出于隐私保护,文中人物均为化名。)
版权声明:本文所有内容著作权归属极昼工作室,未经书面许可,不得转载、摘编或以其他形式使用,另有声明除外。
微信扫码关注该文公众号作者