Bendi新闻
>
2024年大模型潜力方向:大浪淘沙后的SFT和RLHF

2024年大模型潜力方向:大浪淘沙后的SFT和RLHF

1月前

从一年前ChatGPT突然爆火,到不久前文生视频大模型Sora以霸屏之势吸引全球舆论,再到近日OpenAI发布的王炸GPT-4o与AI大模型相关的议题越来越多地被大众所讨论如果说2023年的大模型风暴还集中在“对话”上,那么,今年AI带来的亿点点震撼,就突破了文字乃至图像的范畴!


大模型相关内容之所以那么火,与其相结合的技术原理绝对不容忽视,为了能让大家更能进一步了解时下大模型相关前沿热点,我们特邀QS前50博导、大厂算法研究员等多位大牛打造了大模型系列课程,附论文代码讲解,原价666元,限时免费领!


扫码领取课程(附老师授课PPT)
免费领导师推荐150篇大模型论文合集&复现代码


部分授课ppt&代码复现&论文展示

课程概览

系列1:万物皆可大模型系列

1.GPT Plugin背后的原理

2.大模型与数据库交互

3.大模型玩Minecraft


系列2:个惊艳的大模型高效参数微调法

1.大模型微调-任务特定的P-tuning

2.大模型微调-任务/模型无关的LORA

3.大模型微调方法-Peft库使用实践(实战篇)


系列3:知识图谱增强的LLM

1.知识图谱组成要素及其分类

2.知识图谱和 LLM 融合路线

3.知识图谱增强 LLM 的方法


系列4:惊艳的文本生成模型SORA

1.目前主流视频生成模式

2.主流模式的缺点

3.sora的工作原理及优点


系列5:大模型超级外挂:RAG让LLM不再胡说八道

1.目前主流视频生成模式

2.主流模式的缺点

3.sora的工作原理及优点


系列5:基于大模型的文本生成新神器

1.大模型时代下的文本生成

2.文本生成目前的挑战和未来发展




大模型必然是未来很长一段时间我们工作生活的一部分,而对于这样一个与我们生活高度同频互动的“大家伙”,除了性能、效率、成本等问题外,大规模语言模型的安全问题几乎是大模型所面对的所有挑战之中的重中之重,机器幻觉是大模型目前还没有极佳解决方案的主要问题,大模型输出的有偏差或有害的幻觉将会对使用者造成严重后果。同时,随着 LLMs 的“公信度”越来越高,用户可能会过度依赖 LLMs 并相信它们能够提供准确的信息,这点可以预见的趋势增加了大模型的安全风险。


扫码领取课程(附老师授课PPT)
免费领导师推荐150篇大模型论文合集&复现代码


部分授课ppt&代码复现&论文展示


最后,展望一下大模型研究的未来,目前大模型主要面临的挑战可以被归类如下:

  1. 实践验证:当前针对大模型的评估数据集往往是更像“玩具”的学术数据集,但是这些学术数据集无法完全反应现实世界中形形色色的问题与挑战,因此亟需实际的数据集在多样化、复杂的现实问题上对模型进行评估,确保模型可以应对现实世界的挑战;

  2. 模型对齐:大模型的强大也引出了另一个问题,模型应该与人类的价值观选择进行对齐,确保模型行为符合预期,不会“强化”不良结果,作为一个高级的复杂系统,如果不认真处理这种道德问题,有可能会为人类酝酿一场灾难;

  3. 安全隐患:大模型的研究要进一步强调安全问题,消除安全隐患,需要具体的研究确保大模型的安全研发,需要更多的做好模型的可解释性、监督管理工作,安全问题应该是模型开发的重要组成部分,而非锦上添花可有可无的装饰;

  4. 模型未来:模型的性能还会随着模型规模的增加而增长吗?,这个问题估计 OpenAI 也难以回答,我们针对大模型的神奇现象的了解仍然十分有限,针对大模型原理性的见解仍然十分珍贵。

文末福利


给大家送一波大福利!我整理了100节计算机全方向必学课程,包含CV&NLP&论文写作经典课程,限时免费领!



立即扫码
免费领100节计算机必学课程

-END-

微信扫码关注该文公众号作者

来源:PaperWeekly

相关新闻

2024年高考陆续出分:今天的大模型,能考上几本?|亮马桥小纪严选2024傅盛开年大课:企业“私有化大模型的时代”来了?新冠:2024年夏天的形势和对策企业家的2024年:风浪越大,鱼越贵|城市观察·无锡坚守、建设、和打击:2024年重建乌克兰的优势战略红杉资本 | 2024年:AI的机遇、现状和未来预测Nature:2024年最值得关注的七大技术!很可能就是你的创新性研究的基础2024年经济最佳和最差的州:纽约排名如何?【重磅】2024年中国AI大模型产业发展报告:智慧浪潮引领未来2024 年过半,AI 大模型在各行业的落地实践走到哪了?美丽修行:2024成分主义背后的大数据成分党和热门成分的洞察及应用报告​ACL 2024 | 新一代艺术媒介:探索基于大语言模型的互动戏剧清华大学:superBench大模型综合能力评测报告(2024年3月)2024年AIGC行业研究:多模态大模型与商业应用|36氪研究院LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」ACL 2024 | 多目标直接偏好优化MODPO:大语言模型的多目标对齐中科曙光智能计算产品事业部胡晓东:大模型时代的AI全栈软件能力应用实践 | GenAICon 20242024年第1季度中国大模型季度监测报告:开启智能新篇章晚讯|默沙东发布2024年Q1业绩报告:营收158亿美元,K药大卖69亿美元、华大智造长期投资价值显现AAAI 2024 | 小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值大模型与具身智能的火花,ICML 2024 MFM-EAI Workshop征稿和挑战赛启动冯仑再度研判2024年楼市:给做住宅投资的人两个方向即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。