【新智元导读】AI在现实工作环境中如何影响了工作效率?微软发起一项最大规模的调查研究,AI工具在工作场景中最大提效30%。
对于每个打工人来说,AI工具就像小助理,想不出来?要赶deadline?先交给AI头脑风暴一下。写文案可以用AI,做PPT可以用AI,做设计也可以用AI。AI到底能在多大程度上提升我们的办公效率?微软最近搞了一项迄今为止关于工作场景下GenAI的最大规模研究,涉及来自60多家公司超过6000名员工。报告地址:https://www.microsoft.com/enus/research/uploads/prodnew/2024/07/Generative-AI-in-Real-World-Workplaces.pdf
微软于2023年12月发布了第一份人工智能和生产力报告,报告主要得出了一个结论:AI工具有可能为信息工作者执行的任务带来生产力的阶跃函数提高。
报告地址:https://www.microsoft.com/enus/research/uploads/prod/2023/12/AI-and-Productivity-Report-First-Edition.pdf
半年前的研究主要由基于实验室的研究组成,在这些研究中,参与者使用生成式人工智能工具在受控的模拟工作环境中完成研究人员设计的任务。
现在,越来越多的人可以使用生成式人工智能工具,这些工具在实验室环境之外、在人们执行日常工作时会有什么影响?因此,第二份Microsoft AI和生产力报告重点关注人们如何将Copilot和其他生成式AI工具应用到日常工作中。研究人员与60多个组织(包括各行各业6000多名员工)合作,对Copilot for Microsoft 365进行了大规模随机对照现场实验,参与者在日常工作中使用AI工具而不是研究人员在实验室环境中模拟。Copilot for Microsoft 365将生成式AI工具结合到了Word、Excel、PowerPoint、Outlook、Teams等应用程序中。每个组织至少预留50个许可证,随机分配给该组织指定的100名或更多Microsoft 365用户。研究人员使用这些组织中Microsoft 365的元数据,比较了电子邮件、会议和文档的使用情况。研究人员发现,与没有使用Copilot的人相比,使用Copilot for Microsoft 365的人平均阅读的个人电子邮件数量减少了11%,使用邮件的时间减少了4%。一些企业电子邮件阅读量和与写邮件的时间相对减少了20%或25%。研究人员推测,Copilot for Outlook中的电子邮件摘要功能和Copilot聊天功能可能允许工作人员检索信息,而无需阅读或重读单封电子邮件。Copilot对参加会议数量(通过 Microsoft Teams)的影响更为复杂,增加、减少和基本不变的情况都有出现。有10个组织的出席会议数量出现了统计上的显著减少,平均每天减少0.39次会议,而在Copilot之前平均每天有3次会议。Teams Copilot提供会议摘要,并使用记录来回答用户在会议期间或会议后可能提出的问题,增加可能反映了 Teams Copilot使用的增加,但并不表明总体会议数量的增加。在文档方面,使用Copilot的人比没有使用Copilot的人创建和编辑了更多的文档。总体而言,人们编辑的文档数量增加了10%,其中Word、Excel 和 PowerPoint的重度用户编辑数量增加了13%,一些企业的增幅达到25-30%。Copilot 提供的写作和创作帮助,使生成和修改输出变得更容易。或者,人们可能会利用Copilot节省的一些时间来进行其他文档创建和编辑。为了了解生成式人工智能对工作场所生产力和满意度的影响,微软开展了2024年办公趋势指数调查。这项匿名调查由Edelman Data & Intelligence对31个国家/地区的3.1万名全职雇员或个体工作者进行。该调查旨在广泛捕获用户对生成式人工智能的看法和体验,而不是关注Copilot等任何特定的生成式人工智能工具。调查的一项重要发现是,在使用人工智能的受访者中,78%的人至少使用了一些其组织未提供的人工智能工具。这突显了一个重要现象,即许多员工会主动寻找外部人工智能资源来满足他们的日常使用需求。此外,工作趋势指数数据分析的一个重要焦点是「人工智能高级用户」,研究人员将其定义为熟悉生成式人工智能、每周至少在工作中使用几次、每天节省超过30分钟的个人。29%的AI用户可被归类为「高级用户」,他们表示通过使用 AI 每天可以节省超过30分钟的时间。下表展示了每个要素在提高人工智能使用频率方面有多大帮助,分数越高表明重要性越高。在此分析中,分数范围从361到882,突出显示了影响AI高级用户的重要因素是AI工具丰富和提高工作效率。并且,调查结果发现,AI工具的影响因职位角色和职能而异,客户服务和销售员工的生产力提升最大,而法律专业人员的改善较小。搜索是工作流程中的一项常见任务,为了了解人工智能增强搜索的使用与传统搜索有何不同,研究人员随机选择的8万个样本,分析了传统Bing搜索和使用Copilot Bing搜索的不同数据。研究发现,与Bing Copilot的聊天往往集中在与知识工作相关的主题,例如「翻译和语言学习」、「创意写作和编辑」以及「编程和脚本编写」。总体而言,72.9%的Copilot对话属于知识工作领域,而Bing搜索会话的这一比例为37%。然后,研究人员使用GPT-4根据Anderson和Krathwohl的分类法对与每个搜索会话相关的任务进行分类,该分类法定义了从最低复杂性到最高复杂性的六个类别:记忆、理解、应用、分析、评估和创建。就完成「记忆」任务来看,超过四分之三的传统搜索会话是用于完成「记忆」任务,而使用使用Copilo搜索这一比例不到二分之一。「记忆」和「理解」被归为低复杂性任务,其余任务则归为高复杂性任务,结果发现13.4%的传统搜索会话和 37%的Copilot会话属于高复杂性任务。也就是说,人们常常把人工智能增强搜索用于比传统搜索更复杂的领域。研究人员将传统搜索和Copilot之间任务领域和复杂性的转变解释为生成式人工智能的帮助。研究人员在多语言环境中研究Copilot如何促进使用不同母语的同事之间的协作。首先,研究人员要求77名母语为日语的人回顾一次用英语录制的会议。一半的参与者必须观看和收听视频,另一半可以使用Copilot Meeting Recap,提供人工智能会议摘要以及回答有关会议问题的聊天机器人。然后,研究人员要求其他83名母语为日语的人回顾一次类似的会议,遵循相同的脚本,但这次会议以日语举行。同样,一半的参与者可以使用 Copilot。对于英语会议,使用Copilot的参与者正确回答有关会议的多项选择题的比例提高了16.4%,获得满分的可能性增加了一倍多。此外,在比较两种场景之间的准确性时,使用Copilot听英语会议的准确率达到了97.5%,比使用标准工具听母语日语会议的准确率 (94.8%) 略高。研究人员对在日常工作中使用Copilot的人进行采访时也提到了Copilot在非母语人士交流中的作用。在跨国公司中,Copilot可以帮助人们进行有效沟通。总结一下以上的研究报告,微软强调,在日常工作中使用GenAI可以显著提高生产力,但同时也承认效果可能会根据环境和使用情况而有所不同。进一步的研究将探讨企业如何才能最好地促进人工智能的高效利用。https://www.microsoft.com/enus/research/uploads/prodnew/2024/07/Generative-AI-in-Real-World-Workplaces.pdf