Bendi新闻
>
RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架
RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架
3月前
新智元报道
新智元报道
【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架,简化了原本需要多个模型的复杂的RAG流水线,用微调的方法交给同一个LLM完成,结果同时实现了模型在RAG任务上的性能提升。
RankRAG微调框架
第一阶段的SFT数据:用于维持指令跟随能力
上下文丰富的QA数据:涵盖了DROP、NarrativeQA、Quoref、ROPES、NewsQA、TAT-QA等数据集,每条数据包含问题、黄金上下文(golden context)和答案
会话QA数据集:如Synthetic Conversation和HumanAnnotatedConvQA,同时包括对话内容以及一份背景文档
检索增强的QA数据:不仅包括SQuAD和WebQuestions中的问题和答案,还用BM25将黄金上下文和检索到的top结果组合起来,确保每条数据都有5个上下文,其中有些上下文可能不包括问题答案,甚至是hard-negative,这是为了重点提高LLM对不相关上下文的鲁棒性
上下文排名数据:使用流行的MS Marco语义相关性数据集,将其中的黄金样本视为相关的查询-段落对 (𝑞,𝑐+),BM25挖掘的hard negtive (𝑞,𝑐−)则被视为不相关,让LLM对这些样本的相关性进行二元分类(True或False)
检索增强的排名数据:同样使用QA数据集SQuAD和WebQuestions,以及BM25检索到的上下文,训练LLM的对相关性进行排名的能力
实验
消融研究
特定领域的RAG基准
排名模块
案例研究
作者介绍
微信扫码关注该文公众号作者
来源:新智元
相关新闻
首个WebAgent在线评测框架和流程数据管理平台,GPT-4、Qwen登顶榜首!首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!GPT-4预测股票涨跌更更更准了!东京大学新框架LLMFactor提升显著 | ACL 2024强强联合!当RAG遇到长上下文,滑铁卢大学发布LongRAG,效果领先GPT-4 Turbo 50%开源仅 1 天就斩获近万星!超越 RAG、让大模型拥有超强记忆力的 Mem0 火了开源仅 1 天就斩获近万星!超越 RAG、让大模型拥有超强记忆力的 Mem0 火了!多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作让人物跳起来!华科&阿里巴巴提出UniAnimate:人类跳舞视频生成新框架!支持合成一分钟高清视频!5秒完成3D生成,真香合成数据集已开源,上交港中文新框架超越Instant3D最航运 | 刚刚!马士基再次提升欧线旺季附加费!集运市场系统分析框架!围观:10大重点行业分析框架!2024年:医药全行业分析框架!ICLR 2024 | 图领域首个通用框架!任意数据集、分类问题都可搞定!华盛顿大学&北大&京东出品如何速成RAG+Agent框架大模型应用搭建现场Live震撼!OmAgent框架强势开源!行业应用已全面开花北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源高效、可泛化的高斯重建框架,只需3张视图即可快速推理,45秒便可完成优化RAG还是微调?万字长文总结大模型微调技能图谱CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值ICLR 2024 | 机器人领域首个开源视觉-语言操作大模型!RoboFlamingo框架激发开源VLMs更大潜能AAAI 2024 | 小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值只需将感知推理能力拆分,2B大模型就能战胜20B!国产新框架高效处理视觉任务