Bendi新闻
>
ddl是第一生产力有了科学解释,网友:给大模型试试

ddl是第一生产力有了科学解释,网友:给大模型试试

9月前
西风 发自 凹非寺
量子位 | 公众号 QbitAI

到年底了,大学生碰上期末周、打工人在赶KPI,没有deadline(ddl)的年底不是真年底……

ddl在我们的日常生活中普遍存在,“ddl是第一生产力”更是人们通过亲身实践得出的“至理名言”。

然鹅,关于ddl行为效应的系统证据却很少见。

不过,运筹学和管理科学领域最大的专业协会之一INFORMS旗下期刊《Management Science》上,就刊登了一项关于ddl的研究。

该研究通过两项实验证实了ddl的有效性,给出了ddl是一种强有力的管理工具的研究解释,并揭示了个体对ddl的反应受到记忆和注意力限制的影响。

有学者评价道:

了解不同协调方法之所以有价值,是因为它们充分考虑到了人类的认知限制,这是一个有趣的课题。
未来,我们与AI的交互设计将着眼于弥补人类心理上的限制。显而易见,当前的聊天界面是不完善的,因为它们错误地假设了人类能像LLM一样处理和记忆相同量级的上下文信息。

网友们也是脑洞大开,“给大模型设置ddl,会不会提高它的性能?”:

考古「ddl有效」实验

这项研究由来自德国IZA Bonn研究所、哥本哈根大学、赫蒂学院、凯泽斯劳滕大学的研究人员共同完成。

他们在一家大型牙科诊所进行了两项实验,目标人群是那些需要做预防性检查的患者。选择这个场景做实验,主要是考虑到:

按医嘱,患者应定期主动联系牙医,预约检查(检查频率相对较低),也就是人们需要主动完成任务,但没有明确的执行日期。这个设置就特别适合探讨ddl、任务表现和记忆限制之间的相互作用。

具体来说,第一个实验时间跨度为2011-2013年。

牙科诊所的检查预约通知系统会按照患者的建议检查时间间隔,向患者发送一张明信片式的提醒通知,提醒他们预约下一次的常规检查。

在这个基础上,研究人员在提醒通知中加入了ddl,对应三个治疗组:D1(1周ddl)、D3(3周ddl)、ND(无ddl)。在每个治疗组中还设置了3种奖励水平:大奖励(免费专业牙齿清洁)、小奖励(牙护套装)、无明确奖励。

这样就构成了3种ddl×3种奖励水平的9种组合。

被试共有1175名患者,来自1015个家庭,共产生了2661次的治疗。研究人员在2011-2013年时间段内分43批次随机分配患者进入不同治疗组。

分析结果变量主要是患者首次联系预约的日期、累积响应率、在ddl内的响应率、每日风险率(Hazard Rate)

在2013年的第二季度、第三季度,研究人员在同一环境下设置了第二次实验,主要是为了探究关键发现在更长的ddl下是否稳定。

作为对照,除了与主实验中的D1、D3和ND相对应的处理,第二次实验还包括了一个为期6周(D6)、10周(D10)和截止到12月31日的“年终”(EoY)ddl处理。奖励是价值10欧元的牙护套装。

其他设计和分析流程与第一个实验类似。

ddl的威力

最终研究人员对实验结果进行了分析,分析过程有点复杂,感兴趣的家人们可以查看完整论文,“省流版”如下。

  • 设置ddl可以显著提高和加速人们对任务做出反应的频率和时间。


  • 相对较短的ddl(1-3周)不仅可以加速人们的反应,还可以在ddl后100天内持续使响应率升高10%以上,持续提高人们更长时间内的任务完成率,这可能与记忆和注意力的限制有关。

  • 即使没有明确的奖励措施,ddl对人们的行为也有显著影响,ddl本身效果与高额奖励的效果近似

  • 在给定ddl前,风险率随着ddl的延长而降低,这与理论预测不符,也可能是记忆限制的影响。

也就是ddl较长,人们有可能遗忘之前要完成的任务,导致风险率相对较低。

  • 将奖励和合理的短期ddl结合起来,能以更低的总成本激励人们提早完成任务,成本效益最高。


  • 对一个任务施加ddl可能会对其他任务产生负面溢出效应。

  • 在无ddl设置中响应率较低的群体,在施加ddl后任务表现相对提升更大。

网友热议

沃顿商学院教授Ethan Mollick扒出并分享了这项研究后,得到不少网友关注。

有网友表示,“这和帕金森定律相呼应”(工作会膨胀以填满用于完成该工作的时间)

较短的ddl增加了紧迫感,但也更安心,因为知道在ddl来临之前仍有时间纠正错误或补救问题。

从研究出发,有网友还对ddl对心理的长期影响以及工作质量的影响感兴趣:

ddl本质上仅是一个时间框架,它设定了完成任务时可进行的分析的范围和深度。然而,人们常常将面对ddl的压力视为是一种惩罚。

此外,也有网友吐槽ddl:

你确定这不是因为囚犯习惯了牢笼铁栅栏吗?没有ddl的情况下,我工作得更好。

参考链接:
[1]https://x.com/emollick/status/1743464038716027107?s=20

[2]https://pubsonline.informs.org/doi/abs/10.1287/mnsc.2021.4227

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


微信扫码关注该文公众号作者

来源:量子位

相关新闻

“5.20元送一朵花”:Kimi试水打赏收费,AI大模型应用的商业化有了新路径?北大研究生复试结果出炉,“蔡元培”第一!网友:不管做校长还是学生,蔡元培都是这么厉害!谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装还不试试AI大模型?能让你少加点班!中国给了菲台阶 是礼让 也是试金石猛女勇抓偷拍男!她试衣时突然感觉不对:咋这么大臭脚味儿?!结果...小米SU7 Max版试驾:百万跑车驾驶感受!6大最热门问题详细解析,值得买吗? | 视频低至$4的IKEA早餐火了!​澳洲博主大赞“超划算”,网友跃跃欲试经验大放送 | 本科人大四战人大432终上岸,专业课140+复试第一综合第三——一名非典型“多战生”的备考建议2024国自然函评季消息汇总:有的口子优先资助从50%降至30%?约20%申请者明显是应付或试水?百度离职副总裁4月已成立新公司;马斯克脑机公司:首位受试者脑内设备出故障;新冠疫苗阿斯利康正式停产丨大公司动态宾大荣誉教授倡导试点“三年制”本科,是“水本”还是“福音”?SpaceX星舰第四次试飞成功;海底捞给顾客喝二手饮品;张朝阳力挺企业家做网红;胖东来回应于东来患胃癌...李佳琦称今年618大促难;参哥否认其内容是成功学;抖音试水AI电商 | 一周简讯3900 万人围观雷军直播试驾;马斯克招募第二名脑机实验患者;DeepMind 推出大模型危险性评估框架 | 极客早知道华男:有了这项技术 法拉盛商家将更安全!纽约市开始试点新项目DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩试驾排到凌晨3点!小米汽车店员忙到飞起:从没见过这么多人!蔚来、问界突然亮出大动作,特斯拉:Model Y全系涨价5000元!1小时超1分钟,要缴1个半小时停车费……杭州发改委回应“试行机动车停放以分钟计费”:试点缩短计费周期人大教授建议:试点四天半工作制 5天工作制应该进行调整高速上不按规定保持车距被罚100元,当地交警回应称是试点凯迪拉克海报疑暗讽小米,官方回应:泼天的流量轮到我了;招行人均年薪61万元;小米SU7上市后首个周末:试驾排至凌晨3点丨邦早报北大放榜!“蔡元培”复试第一,“莫言”复试第二
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。