大模型突飞猛进,但我们离真正的AGI还有距离
2024.01.18
本文字数:1877,阅读时长大约3分钟
导读:寻求基础技术提升和向行业去落地是未来两大主题。
作者 | 第一财经 刘晓洁
一次可读30万汉字,大模型又“上新”了。
1月17日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2),相比此前的版本,书⽣·浦语2.0在长语境输入及理解能力、基础语言能力上都有大幅提升,拓宽了大模型向行业落地的可能性。实验室表示将继续提供InternLM2免费商用授权。
在过去的一年,大模型接连发布、不断迭代,来到2024年这种势头还未停止。上海人工智能实验室领军科学家林达华对第一财经表示,大模型会比去年发展更快,“如果说2023年大家可能都是朝着一个目标,就是去追赶GPT-3.5或者GPT-4的性能目标去走的话,未来不同的机构、企业和团队会朝着不同的方向去发展,会更加多样化。”寻求基础技术提升和向行业去落地是未来两大主题。
对于此次书⽣·浦语2.0的更新,一次可读30万汉字(约五六百页的文档)、200k的长语境输入及理解能力是亮点,除了支持超长上下文外,其能够准确提取关键信息,这意味着模型可以显著拓展应用场景,比如支持大型文档的处理、复杂的推理演算和实际场景的工具调用等。
在具体应用方面,上海人工智能实验室领军科学家林达华对第一财经介绍,可用书⽣·浦语2.0模型尝试去读几百页的财报,它能够将财报里面一些非常细致的信息精准提取出来,形成摘要,或者能听一场几个小时的会议,虽然语音识别文档会有错误,但这并不影响理解,模型依然能很好地将会议的关键信息摘取出来。
InternLM2总结“联合国2023年10月2日召开的联合国贸易和发展会议记录”
除此外,此次更新后更强大的数理能力、工具调用的能力,以及明显改善的对话创作等方面的能力,都能够为大模型的应用带来很大的帮助。
“能力的持续提升,能够拓宽大模型向行业落地的可能性,它不仅仅是做对话,在行业里,它还能自由调用工具给很多垂直场景提供助手的能力,将一个大模型从闲聊的工具,逐渐变成能够和场景需要相结合、深入落地提供价值的利器。”林达华表示,媒体、教育、金融、传统制造业这些场景,都可以受益于大模型技术的进展。
回顾2023年,林达华认为有非常多惊喜,大模型有几个非常关键的进展。一是GPT-4的出现,让大家看到了大模型不仅仅是一个一本正经胡说八道的聊天工具,意味着它真正有用,其次,函数工具调用的能力、代码解释能力,让大家看到了大模型向现实场景衔接的可能性和技术途径,对于落地很有帮助。另外很重要的是模型推理能力、推理速度、推理性能的急剧提升,对于降低落地成本、门槛也非常重要。
对于未来大模型发展的趋势,林达华认为,一方面是基础能力的提升,“我们现在离真正的通用人工智能有较大的距离,无论是国内的模型还是GPT-4。”因此,未来会有顶尖的研究机构沿着更强的技术手段,如扩大规模、用更好的数据,或改进训练的方法,模型架构,逐渐向通用人工智能靠近,这是一个核心技术层面的突破,也是顶尖研究机构的使命。
上海人工智能实验室主任助理、领军科学家乔宇同样表示,我们做大模型能力越来越强,但离真正比肩人类的、可信的AGI还有距离。他认为,过去人工智能兴起核心的一点是大力出奇迹,堆更多的数据、用更多的算力,但只靠规模、只靠数据解决不了幻觉、可信和可控的问题。未来大模型的发展应该是以规模增长为主线、但又要充分吸纳其他技术路线的方向。
林达华对第一财经补充表示,规模(scale)路线确实是在过去这两年验证了的非常有效的手段,无论是数据规模和算力规模,但很多学者认为单纯依靠这个路径,不一定能够真正到达AGI的彼岸,有些核心的问题如幻觉、可信,需要规模路线与其他手段结合才能到达,这个是未来需要去探索的。
另一方面,大模型的能力已经到了一定的高度,具备了逐渐向某些行业去渗透的条件,很多机构也会逐渐将模型结合工具调用能力、交互能力、计划决策的能力,逐渐探索向各个行业去落地的可能性。
“我相信这些探索能够将大模型真正从去年能力的展现,变成真正能变革生产力的一个工具,我觉得这两方面今年都会有巨大的竞争。”林达华说。
在发布会现场,徐汇区委常委、副区长俞林伟表示,对于2024年,他较为关注的方面是,美国能不能够逼近真正的通用人工智能、大模型的“iPhone时刻”什么时候能够到位,以及,中国的大模型谁先能够逼近OpenAI的GPT-4。
俞林伟谈到,在和行业交流时他发现,大家普遍认为GPT-4是主力应用的起点,要做真正的垂类市场闭环应用,必须以GPT-4作为能力的起点,“所以对我们来说,能不能在2024年实现突破,谁能率先跑过这根线我觉得很重要。”
日本突发!福岛发生集体食物中毒事件
微信扫码关注该文公众号作者