Bendi新闻
>
荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布

荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布

2月前

随着ChatGPT等技术的兴起,我们正在步入一个人工智能技术引领的全新时代。2023年,大语言模型、AIGC、世界模型、具身智能、超级智能体等关键词频繁地出现在各大新闻头条,人工智能不仅经历着范式转变,更被誉为第四次工业革命的标志性成就。在全球竞相发展新一代人工智能技术的时代背景下,2024年的《政府工作报告》强调了“人工智能+”战略的重要性,明确了人工智能在推动新质生产力发展中的关键作用。

什么是新一代人工智能?新一代人工智能将如何改变我们的生活?如何在这场技术革命中抢占先机?这些问题影响着人工智能的发展,更深刻地影响着国家的前途命运。多模态大模型,是这场技术范式变革的核心,是迈向通用人工智能(AGI)的关键。



1

新一代人工智能的探索之旅

多模态大模型涵盖了多种技术领域,包括自然语言处理、计算机视觉以及具身智能等。近年来,这些领域的研究成果不断涌现,但却分散在各个领域和不同的文献中。由于表述习惯、术语和符号的差异,初学者往往难以建立系统性的理解,面临一定的学习困难。由中山大学人机物智能融合实验室(HCP-Lab)刘阳副研究员和林倞教授精心编写的《多模态大模型:新一代人工智能技术范式》一书的出版恰逢其时,本书不仅涵盖了自然语言处理、计算机视觉和具身智能等多个领域,更是深入浅出地介绍了多模态大模型的关键技术和应用,全面且系统地介绍多模态大模型,为广大人工智能从业者和爱好者提供一本全面而系统的学习指南。

《多模态大模型:新一代人工智能技术范式》



2

权威推荐,内容丰富

《多模态大模型:新一代人工智能技术范式》是业内首本全面介绍多模态大模型核心技术与应用的书籍,并围绕新一代人工智能技术范式,详细阐述了因果推理、世界模型、超级智能体与具身智能等前沿技术。

《多模态大模型:新一代人工智能技术范式》致力于全面而系统地介绍多模态大模型的关键技术、基础模型和典型应用。本书采用通俗易懂的语言和丰富的直观实例,深入浅出的方式介绍了各个关键技术点,旨在为初学者和人工智能领域的新进人才搭建一座通往深入理解的桥梁。本书不仅深入阐述了因果推理、世界模型、具身智能与多智能体等前沿技术,还详细探讨了丰富的应用场景。

本书还荣幸得到了鹏城实验室主任、中国工程院高文院士的作序力荐。高文院士认为,本书的出版有助于人工智能科研工作者全面了解多模态大模型的特点及潜在发展方向,对新一代人工智能技术范式和AGI的发展起到重要推动作用。《多模态大模型:新一代人工智能技术范式》不仅是一本技术指南,更是一份行动路线图,旨在为学术界和工业界提供一个清晰的视角,以促进人工智能科研工作者更全面地了解多模态大模型的技术和新一代人工智能的发展方向。

高文院士作序力荐



3

系统架构,循序渐进

本书架构

本书内容共五章,每一章都围绕着多模态大模型的关键领域展开。第一章从最具代表性的大模型结构入手,引导读者深入了解当前主流大模型,为对多模态大模型的全面认知打下基础。第二章深入剖析了多模态大模型的核心技术,涵盖了预训练、提示学习、上下文学习、微调、思维链和人类反馈强化学习,揭示了多模态大模型的独特之处和技术内涵。第三章介绍了多个代表性的多模态基础模型,如CLIP、BLIP、LLaMA、SAM和PaLM-E等,展示了技术的多样性和广泛性。第四章通过视觉问答、AIGC和具身智能这三个典型应用展示了多模态大模型的实际应用能力。最后,第五章探讨了现有多模态大模型存在的挑战,并介绍了实现通用人工智能的可行思路。

本书主要面向高年级本科生和研究生,可以作为新一代人工智能相关课程教材使用,也可以作为对多模态大模型感兴趣的读者入门之用。

本书主要内容



4

实践导向,引领未来

中山大学人机物智能融合实验室(https://www.sysu-hcp.net)由林倞教授创办于2010年,实验室围绕“人工智能前沿技术与产业化”布局研究方向与课题,并深入应用场景打造产品原型,输出大量原创技术及孵化创业团队,许多重要学术和产业成果享誉全球。

在多模态认知计算、具身交互与学习、元宇宙与数字人、可控内容生成等领域开展体系化研究,以“攀学术高峰、踏应用实地”为工作理念。2022年实验室孵化创新企业拓元智慧,打造通用多模态认知AI技术平台,深度赋能企业数智化、元宇宙、智慧城市等主要应用场景。

作者简介

立即获取,开启智慧之旅

《多模态大模型》不仅是高年级本科生和研究生的理想教材,也是对多模态大模型感兴趣的读者的宝贵资源。本书在线资源(含目录、参考文献等)已经上线https://hcplab-sysu.github.io/Book-of-MLM/

现在就访问京东官方自营购买本书,开启您的人工智能学习之旅!

京东官方自营购买链接:https://item.jd.com/10100489294930.html

更多内容,点击下方关注:

微信扫码关注该文公众号作者

来源:AI科技评论

相关新闻

文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布李未可科技古鉴:发布自研多模态大模型WAKE-AI,三大优化让AI眼镜交互体验升级 丨GenAICon 2024鲶鱼效应显著!Sora 发布满月,多模态领域成果丰硕 | 大模型一周大事中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4oGPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评AI早知道|ChatGPT模型大更新;阿里云发布多模态大模型;百度推多模态模型UNIMO-GGPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告AI早知道|Apple 发布 MM1多模态大语言模型;xAI 是市场上薪酬最高的人工智能公司《全球100大趋势》重磅发布,你准备好了吗?AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走AI早知道|百度即将发布全新App腾讯元宝;行业首发多模态大模型辅助视障人士《2024版中国NSTE-ACS诊断和治疗指南》重磅发布,P2Y₁₂受体抑制剂有哪些更新?丨NCC 2024今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明重磅!《英国未来10年就业需求报告》发布!5大热门就业领域曝光!超越OpenAI,谷歌重磅发布从大模型蒸馏的编码器Gecko完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”零一万物发布Yi-VL多模态语言模型并开源,测评仅次于GPT-4V2024英国私立学校协会ISC《英国私立学校报告》重磅发布!
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。