最新大模型论文合集！谷歌/微软/Meta/苹果/英伟达/阿里最新研究报告！

9月前

清华团队推出 MiniCPM：利用可扩展的训练策略挖掘小模型潜力；
苹果MM1大模型：30B参数，多模态，在预训练指标上达到SOTA；
亚马逊提出大规模视频语言对齐方法VidLA；
英伟达参与，高效视频扩散模型CMD发布；
谷歌、Stability AI新研究：由文本引导生成纹理3D服装；
港大、阿里新研究：只需一张图，轻松即时定制个性化照片；
上海 AI Lab 新研究：将 LVLM 分辨率提升到 4K HD。

大模型正在重构一个新的人工智能，技术的更迭也是日新月异，这次我整理了近3个月的包含谷歌/苹果/亚马逊/阿里等最新大模型研究102篇大模型论文，给大家做学习参考。

扫码回复“大模型”

领最新100+篇大模型论文合集

AI大模型，正在改变世界，为了更好的入局AI大模型，这次我特意复盘和整理大模型学习脉络，开了30节大模型的课程，包含大模型理论、大模型论文带读以及大模型企业项目实战，还附赠500+大模型论文。

0.01元解锁30节“AI大模型系列课程”

领500+篇大模型论文合集

以下是《AI大模型系列课》课程目录

第一课：NLP大模型：基础、前沿与学习路径

第二课：基于模型量化的大模型压缩的进展

压缩技术中，为什么量化要优于剪枝、蒸馏？

如何搜索裁剪阈值用于裁剪outlier？

包含有异常值outlier的特征如何量化？

第三课：基于模型剪枝的大模型高效计算和应用

模型剪枝的技术背景

模型剪枝具体方法

模型剪枝前沿方法

语言模型剪枝实例

第四课：讲解扩散模型的基础知识及拓展应用

AI作画--以文生图

扩散模型是什么

扩散模型工作拓展

扩散模型带来的机遇

第五课：大语言模型的RLHF

RLHF的优点和挑战

RLHF如何改善大模型性能

RLHF的实际应用案例

RLHF在大模型的未来趋势

第六课：[LLM + 微调]大模型的高效微调

01 介绍

02 常用的高效微调方法介绍

03 如何针对领域数据集根据高效微调方法创造大语言模型

04 未来挑战与研究方向

第七课：大模型医疗

医疗领域的数据特点、挑战和机遇

大模型的定义和特点，如预训练、微调、指令学习等

针对ChatGLM大模型，介绍ChatGLM模型微调

代码实践以及模型微调

第八课：大模型基本概念以及应用场景

发展线路与技术手段

应用场景

缺点与局限

未来展望

第九课：LLAMA2中文大模型

理论介绍

代码实践

第十课：大模型前沿论文带读训练营（NLP方向）

01 LLaMA训练营

02 LLaMA训练营——精读

03 LLaMA训练营——代码讲解

04 GLM-130B训练营——论文泛读

05 GLM-130B训练营——论文精读

06 GLM-130B训练营——代码讲解

07 Alpaca训练营——论文泛读

08 Alpaca训练营——论文精读

09 Alpaca训练营——代码讲解

第十一课：掌握大模型领域前沿，跑通三套企业级项目代码

01 开发基于大模型的聊天机器人

02 实战基于大模型的对话系统（实战一）

03 大模型模型原理及综述

04 大语言模型（LLM）原理及综述

05 精读大模型-3论文、Instruct论文

06 精读谷歌PaLM论文、脸书LLaMA论文

07 实战基于大模型的对话系统（实战二）

08 实战微调LLaMA模型

扫码回复“大模型”

领500+篇大模型论文合集

在大模型的构建之下，AI自动化交互，将会决定世界的未来，谁的大模型更强大，将决定在遥远的未来的话语权，同时，大模型会成为AI基础设施。

2024年也必将是大模型继续活跃的一年，不想错过大模型机遇的同学，赶紧0.01元扫码获取30节《AI大模型系列课程》！

0.01元解锁30节“AI大模型系列课程”

领500+篇大模型论文合集

微信扫码关注该文公众号作者

来源：CVer

最新大模型论文合集！谷歌/微软/Meta/苹果/英伟达/阿里最新研究报告！

相关新闻