Nature:斯坦福最新报告显示,人工智能这些领域接近甚至超过人类!医学领域尤为迅猛
Bringing medical advances from the lab to the clinic.
关键词:人工智能;医学;Nature
人工智能(AI)领域发展迅猛,在包括图像分类、阅读理解、视觉推演、多任务语言理解和数学竞赛等多项任务中已超过人类水平,在数学领域尤其快速突破、接近人类水平【1】;这在斯坦福大学人工智能研究所的“2024 人工智能指数报告”中得到了充分体现【2】。
快速发展也意味着许多常用的基准和测试正迅速过时,亟需新的评估方式。
十年前,一项基准测试可以为 AI 研究提供 5-10 年的指引。如今,这一周期缩短至数年。
AI 的发展速度惊人。
行业主导 AI 创新:2023 年,业界发布了 51 项重要的机器学习系统,而学术界贡献了 15 项。学术重心正转向深入分析企业产出的模型。
大语言模型挑战增多:研究人员在不断开发更严格的测试,以评估大语言模型(LLM)在视觉、数学甚至道德推理方面的能力。例如,Google-Proof Q&A Benchmark 基准测试就为 LLM 设置了研究生水平的复杂问题。
AI 模型在性能上取得突破的代价是成本上升。
OpenAI 的聊天机器人 ChatGPT 使用的 GPT-4 训练成本为 7800 万美元,谷歌去年 12 月推出的聊天机器人 Gemini Ultra 耗资 1.91 亿美元。这些模型的能耗和对数据中心冷却用水的需求都令人担忧。
训练数据有瓶颈吗?
有研究指出 ,高质语言数据可能于今年耗尽。更准确的预计是 2028 年,但这也凸显了训练数据可能出现的瓶颈。
AI 在科学中的应用
今年的指数报告首次专门介绍了人工智能在科学中的应用:
材料探索: 谷歌 DeepMind 的 GNoME 项目旨在帮助化学家发现材料。
快速天气预报: 另一个 DeepMind 工具 GraphCast 可以快速进行天气预报。
医学应用迭代更快。
1)知识渊博的医疗AI已经到来
2023 年的临床知识模型 GPT-4 Medprompt 的准确率达到了 90.2%,比 2022 年的最高分提高了 22.6 个百分点。自 2019 年推出该基准以来,MedQA 上的人工智能性能几乎增加了两倍。
2)美国FDA批准的医疗AI产品快速增长
2022年,FDA批准了139种人工智能相关医疗器械,比2021年增长了12.1%。自2012年以来,FDA批准的人工智能相关医疗器械数量增加了45倍以上。人工智能越来越多地用于现实世界的医疗目的。
编者按:
当前的人工智能热潮建立在神经网络和机器学习算法之上,自 2010 年代初开始以来迅速发展。
我是第一批ChatGPT用户、第一批谷歌Gemini用户、也是特斯拉完全自动驾驶的用户,这其中的每一个突破都令人激动。
充分利用这些新科技,不仅有助于使得我们的生活更为方便、更大幅提高了工作效率;人工智能也大幅拓展了我们个人的知识边界,使得我们有更多机会成为超级个体。
期待朋友们的分享。
微信扫码关注该文公众号作者