国际科技财经移民娱乐民生时事体育

>

ddl是第一生产力有了科学解释，网友：给大模型试试

ddl是第一生产力有了科学解释，网友：给大模型试试

1年前

西风发自凹非寺
量子位 | 公众号 QbitAI

到年底了，大学生碰上期末周、打工人在赶KPI，没有deadline（ddl）的年底不是真年底……

ddl在我们的日常生活中普遍存在，“ddl是第一生产力”更是人们通过亲身实践得出的“至理名言”。

然鹅，关于ddl行为效应的系统证据却很少见。

不过，运筹学和管理科学领域最大的专业协会之一INFORMS旗下期刊《Management Science》上，就刊登了一项关于ddl的研究。

该研究通过两项实验证实了ddl的有效性，给出了ddl是一种强有力的管理工具的研究解释，并揭示了个体对ddl的反应受到记忆和注意力限制的影响。

有学者评价道：

了解不同协调方法之所以有价值，是因为它们充分考虑到了人类的认知限制，这是一个有趣的课题。
未来，我们与AI的交互设计将着眼于弥补人类心理上的限制。显而易见，当前的聊天界面是不完善的，因为它们错误地假设了人类能像LLM一样处理和记忆相同量级的上下文信息。

网友们也是脑洞大开，“给大模型设置ddl，会不会提高它的性能？”：

考古「ddl有效」实验

这项研究由来自德国IZA Bonn研究所、哥本哈根大学、赫蒂学院、凯泽斯劳滕大学的研究人员共同完成。

他们在一家大型牙科诊所进行了两项实验，目标人群是那些需要做预防性检查的患者。选择这个场景做实验，主要是考虑到：

按医嘱，患者应定期主动联系牙医，预约检查（检查频率相对较低），也就是人们需要主动完成任务，但没有明确的执行日期。这个设置就特别适合探讨ddl、任务表现和记忆限制之间的相互作用。

具体来说，第一个实验时间跨度为2011-2013年。

牙科诊所的检查预约通知系统会按照患者的建议检查时间间隔，向患者发送一张明信片式的提醒通知，提醒他们预约下一次的常规检查。

在这个基础上，研究人员在提醒通知中加入了ddl，对应三个治疗组：D1（1周ddl）、D3（3周ddl）、ND（无ddl）。在每个治疗组中还设置了3种奖励水平：大奖励（免费专业牙齿清洁）、小奖励（牙护套装）、无明确奖励。

这样就构成了3种ddl×3种奖励水平的9种组合。

被试共有1175名患者，来自1015个家庭，共产生了2661次的治疗。研究人员在2011-2013年时间段内分43批次随机分配患者进入不同治疗组。

分析结果变量主要是患者首次联系预约的日期、累积响应率、在ddl内的响应率、每日风险率（Hazard Rate）。

在2013年的第二季度、第三季度，研究人员在同一环境下设置了第二次实验，主要是为了探究关键发现在更长的ddl下是否稳定。

作为对照，除了与主实验中的D1、D3和ND相对应的处理，第二次实验还包括了一个为期6周（D6）、10周（D10）和截止到12月31日的“年终”（EoY）ddl处理。奖励是价值10欧元的牙护套装。

其他设计和分析流程与第一个实验类似。

ddl的威力

最终研究人员对实验结果进行了分析，分析过程有点复杂，感兴趣的家人们可以查看完整论文，“省流版”如下。

设置ddl可以显著提高和加速人们对任务做出反应的频率和时间。

相对较短的ddl（1-3周）不仅可以加速人们的反应，还可以在ddl后100天内持续使响应率升高10%以上，持续提高人们更长时间内的任务完成率，这可能与记忆和注意力的限制有关。
即使没有明确的奖励措施，ddl对人们的行为也有显著影响，ddl本身效果与高额奖励的效果近似。

在给定ddl前，风险率随着ddl的延长而降低，这与理论预测不符，也可能是记忆限制的影响。

也就是ddl较长，人们有可能遗忘之前要完成的任务，导致风险率相对较低。

将奖励和合理的短期ddl结合起来，能以更低的总成本激励人们提早完成任务，成本效益最高。

对一个任务施加ddl可能会对其他任务产生负面溢出效应。
在无ddl设置中响应率较低的群体，在施加ddl后任务表现相对提升更大。

网友热议

沃顿商学院教授Ethan Mollick扒出并分享了这项研究后，得到不少网友关注。

有网友表示，“这和帕金森定律相呼应”（工作会膨胀以填满用于完成该工作的时间）：

较短的ddl增加了紧迫感，但也更安心，因为知道在ddl来临之前仍有时间纠正错误或补救问题。

从研究出发，有网友还对ddl对心理的长期影响以及工作质量的影响感兴趣：

ddl本质上仅是一个时间框架，它设定了完成任务时可进行的分析的范围和深度。然而，人们常常将面对ddl的压力视为是一种惩罚。

此外，也有网友吐槽ddl：

你确定这不是因为囚犯习惯了牢笼铁栅栏吗？没有ddl的情况下，我工作得更好。

参考链接：
[1]https://x.com/emollick/status/1743464038716027107?s=20
[2]https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2021.4227

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

微信扫码关注该文公众号作者

来源：量子位

相关新闻

“5.20元送一朵花”：Kimi试水打赏收费，AI大模型应用的商业化有了新路径？北大研究生复试结果出炉，“蔡元培”第一！网友：不管做校长还是学生，蔡元培都是这么厉害！谷歌版Her大翻车：试了3次且换手机才成功…网友：我手动只需10秒今日arXiv最热大模型论文：复旦提出基于diffusion的虚拟试衣模型，模特一键换装还不试试AI大模型？能让你少加点班！中国给了菲台阶是礼让也是试金石猛女勇抓偷拍男！她试衣时突然感觉不对：咋这么大臭脚味儿？！结果...小米SU7 Max版试驾：百万跑车驾驶感受！6大最热门问题详细解析，值得买吗？｜视频低至$4的IKEA早餐火了！澳洲博主大赞“超划算”，网友跃跃欲试经验大放送 | 本科人大四战人大432终上岸，专业课140+复试第一综合第三——一名非典型“多战生”的备考建议 2024国自然函评季消息汇总：有的口子优先资助从50%降至30%？约20%申请者明显是应付或试水？百度离职副总裁4月已成立新公司；马斯克脑机公司：首位受试者脑内设备出故障；新冠疫苗阿斯利康正式停产丨大公司动态宾大荣誉教授倡导试点“三年制”本科，是“水本”还是“福音”？SpaceX星舰第四次试飞成功；海底捞给顾客喝二手饮品；张朝阳力挺企业家做网红；胖东来回应于东来患胃癌...李佳琦称今年618大促难；参哥否认其内容是成功学；抖音试水AI电商 | 一周简讯 3900 万人围观雷军直播试驾；马斯克招募第二名脑机实验患者；DeepMind 推出大模型危险性评估框架 | 极客早知道华男：有了这项技术法拉盛商家将更安全！纽约市开始试点新项目 DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩试驾排到凌晨3点！小米汽车店员忙到飞起：从没见过这么多人！蔚来、问界突然亮出大动作，特斯拉：Model Y全系涨价5000元！1小时超1分钟，要缴1个半小时停车费……杭州发改委回应“试行机动车停放以分钟计费”：试点缩短计费周期人大教授建议：试点四天半工作制 5天工作制应该进行调整高速上不按规定保持车距被罚100元，当地交警回应称是试点凯迪拉克海报疑暗讽小米，官方回应：泼天的流量轮到我了；招行人均年薪61万元；小米SU7上市后首个周末：试驾排至凌晨3点丨邦早报北大放榜！“蔡元培”复试第一，“莫言”复试第二