Bendi新闻
>
大模型突飞猛进,但我们离真正的AGI还有距离

大模型突飞猛进,但我们离真正的AGI还有距离

10月前

2024.01.18

本文字数:1877,阅读时长大约3分钟



导读:寻求基础技术提升和向行业去落地是未来两大主题。


作者 | 第一财经 刘晓洁

一次可读30万汉字,大模型又“上新”了。


1月17日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2),相比此前的版本,书⽣·浦语2.0在长语境输入及理解能力、基础语言能力上都有大幅提升,拓宽了大模型向行业落地的可能性。实验室表示将继续提供InternLM2免费商用授权。


在过去的一年,大模型接连发布、不断迭代,来到2024年这种势头还未停止。上海人工智能实验室领军科学家林达华对第一财经表示,大模型会比去年发展更快,“如果说2023年大家可能都是朝着一个目标,就是去追赶GPT-3.5或者GPT-4的性能目标去走的话,未来不同的机构、企业和团队会朝着不同的方向去发展,会更加多样化。”寻求基础技术提升和向行业去落地是未来两大主题。


对于此次书⽣·浦语2.0的更新,一次可读30万汉字(约五六百页的文档)、200k的长语境输入及理解能力是亮点,除了支持超长上下文外,其能够准确提取关键信息,这意味着模型可以显著拓展应用场景,比如支持大型文档的处理、复杂的推理演算和实际场景的工具调用等。


在具体应用方面,上海人工智能实验室领军科学家林达华对第一财经介绍,可用书⽣·浦语2.0模型尝试去读几百页的财报,它能够将财报里面一些非常细致的信息精准提取出来,形成摘要,或者能听一场几个小时的会议,虽然语音识别文档会有错误,但这并不影响理解,模型依然能很好地将会议的关键信息摘取出来。


InternLM2总结“联合国2023年10月2日召开的联合国贸易和发展会议记录”


除此外,此次更新后更强大的数理能力、工具调用的能力,以及明显改善的对话创作等方面的能力,都能够为大模型的应用带来很大的帮助。


“能力的持续提升,能够拓宽大模型向行业落地的可能性,它不仅仅是做对话,在行业里,它还能自由调用工具给很多垂直场景提供助手的能力,将一个大模型从闲聊的工具,逐渐变成能够和场景需要相结合、深入落地提供价值的利器。”林达华表示,媒体、教育、金融、传统制造业这些场景,都可以受益于大模型技术的进展。


回顾2023年,林达华认为有非常多惊喜,大模型有几个非常关键的进展。一是GPT-4的出现,让大家看到了大模型不仅仅是一个一本正经胡说八道的聊天工具,意味着它真正有用,其次,函数工具调用的能力、代码解释能力,让大家看到了大模型向现实场景衔接的可能性和技术途径,对于落地很有帮助。另外很重要的是模型推理能力、推理速度、推理性能的急剧提升,对于降低落地成本、门槛也非常重要。


对于未来大模型发展的趋势,林达华认为,一方面是基础能力的提升,“我们现在离真正的通用人工智能有较大的距离,无论是国内的模型还是GPT-4。”因此,未来会有顶尖的研究机构沿着更强的技术手段,如扩大规模、用更好的数据,或改进训练的方法,模型架构,逐渐向通用人工智能靠近,这是一个核心技术层面的突破,也是顶尖研究机构的使命。


上海人工智能实验室主任助理、领军科学家乔宇同样表示,我们做大模型能力越来越强,但离真正比肩人类的、可信的AGI还有距离。他认为,过去人工智能兴起核心的一点是大力出奇迹,堆更多的数据、用更多的算力,但只靠规模、只靠数据解决不了幻觉、可信和可控的问题。未来大模型的发展应该是以规模增长为主线、但又要充分吸纳其他技术路线的方向。


林达华对第一财经补充表示,规模(scale)路线确实是在过去这两年验证了的非常有效的手段,无论是数据规模和算力规模,但很多学者认为单纯依靠这个路径,不一定能够真正到达AGI的彼岸,有些核心的问题如幻觉、可信,需要规模路线与其他手段结合才能到达,这个是未来需要去探索的。


另一方面,大模型的能力已经到了一定的高度,具备了逐渐向某些行业去渗透的条件,很多机构也会逐渐将模型结合工具调用能力、交互能力、计划决策的能力,逐渐探索向各个行业去落地的可能性。


“我相信这些探索能够将大模型真正从去年能力的展现,变成真正能变革生产力的一个工具,我觉得这两方面今年都会有巨大的竞争。”林达华说。


在发布会现场,徐汇区委常委、副区长俞林伟表示,对于2024年,他较为关注的方面是,美国能不能够逼近真正的通用人工智能、大模型的“iPhone时刻”什么时候能够到位,以及,中国的大模型谁先能够逼近OpenAI的GPT-4。


俞林伟谈到,在和行业交流时他发现,大家普遍认为GPT-4是主力应用的起点,要做真正的垂类市场闭环应用,必须以GPT-4作为能力的起点,“所以对我们来说,能不能在2024年实现突破,谁能率先跑过这根线我觉得很重要。”


微信编辑 | 立早

推荐阅读

日本突发!福岛发生集体食物中毒事件



微信扫码关注该文公众号作者

来源:第一财经

相关新闻

字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走我们需要怎样的大模型?AI不跑分|国内外七款大模型,哪款是真正的训猫大师?闭关一年创业大模型,姜大昕站在AGI呼啸的风中医院是应用大模型最好的场景,但不是商业化的最好场景华盛顿大学撰文反驳微软,我们无法删除大模型关于哈利波特的记忆构建大模型一年多,我们总结了关于 LLM 应用的运营经验换了30多种方言,我们竟然没能考倒中国电信的语音大模型澳洲各大超上架春节年货!但澳洲网友却破大防:打我们的脸!警惕AI大模型的“共情鸿沟”!剑桥团队呼吁:我们需要“儿童安全人工智能”框架我们用3000多道测试题,帮你找到了最聪明的大模型 | 文末附下载我们用3000多道测试题,帮你找到了最聪明的大模型我们用大模型给 IDE 升了个级,这是我们总结的万字心得微软秒删堪比 GPT-4 的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试对话面壁智能刘知远:大模型将有新的「摩尔定律」,AGI 时代的智能终端未必是手机李彦宏:高考后大模型公司热衷于写高考作文价值不大,真正的需求是填写志愿科学家揭示数据驱动型大模型的三大问题,并指出发展多语言AI的紧迫性终于来了!中国首个接入大模型的Linux开源操作系统正式发布!无需人工/GPT-4V排序,针对多模态大模型的全自动多级偏好学习上海交大林云:揭秘大模型的可解释性与透明度,AI 编程的未来在这里!70倍极致压缩!大模型的检查点再多也不怕普通人难进清华北大的真正原因,被这篇奇文精准说透莫尼什·帕伯莱访谈:抓住真正的大机会
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。