Bendi新闻
>
爆火!谷歌、微软全All in的Prompt学习

爆火!谷歌、微软全All in的Prompt学习

11月前

作为最先进的AI学习方法,提示学习和指示学习(instruction learning)代表了目前NLP方向的新趋势,能够让AI系统对齐人类的意图,大大提高大语言模型的学习能力。


由于所涉及的检索和推断方法多种多样,提示学习的实施十分复杂,特别是训练一个属于自己NLP任务的Pre-training LM。


这次我综合整理了20G的语言训练资料,包含点评、社区互动、维基百科等,这些数据已经处理好了,可以直接二进制读取然后进行训练。


扫码回复“提示学习

获取训练合集


这次我邀请了在阿里和微软亚洲研究院等公司进行NLP相关的项目的John老师在1月25日晚20:00来分享提示学习的学习策略,此次课程的主题是—《Introduction to the Prompt Learning 》


课程大纲:

1. Prompt基本概念描述
2. Prompt基本方法介绍
3. Prompt相关工具
4. 总结与学习路径

0.01元解锁

《Introduction to the Prompt Learning 》

  


另外John老师还做了《提示学习前沿论文解读课》,课程将从instruction tuning、Self-Instruct以及Black-box Prompt Learning三项技术入手,通过理论(3篇论文解读)+实战(LORA微调大模型)的方式,5节课全方位带大家深度掌握大型语言模型提示学习系列知识。


0.01元解锁

《提示学习前沿论文解读课》

  


课程大纲


第一节课:Prompt Learning 概述

  • 介绍prompt的基本概念

  • 介绍衍生的instruction learning以及两者区别


第二节课:论文解读1

paper1:Finetuned Language Models are Zero-Shot Learners

论文会议:ICLR 2022

本文提出了一个新的概念 instruction tuning,就是将很多数据集都表示成指令的形式,来进行fine-tune,从而大大提高了unseen 任务上的零样本性能。

通过学习这篇论文,我们可以了解在一组task上微调模型是否会提高模型在unseen task上的性能,以及通用模型的未来研究方向。


第三节课:论文解读2

paper2:Self-Instruct: Aligning Language Model with Self Generated Instructions

论文会议:ACL 2023

大型“指令调优”的语言模型已经证明了其在新任务上卓越的zero-shot能力。但是人工编写指令数据集仍然存在一些挑战。

本文首次提出自动构造instruction数据的方法,通过LLM生成指令来指导自身微调。提出的框架Self-Instruct可以使用最少的人工标注,生成大量的用于 instruct-  tuning 的数据。


第四节课:代码实践LoRA微调

  • LORA微调实战

  • 基于论文解读2自动构造的数据上进行大模型的微调


第五节课:论文解读3


paper3:Black-Box Prompt Optimization: Aligning Large Language Models without Model Training

现有的对齐方法主要侧重于对LLM进行进一步的训练,然而这些对齐方法在效率、可访问性、可解释性方面仍存在缺陷。

清华团队提出了一种黑盒提示优化(BPO)来执行对齐,通过优化用户Prompt以适应LLM对输入的理解来对齐大语言模型和人类的意图。


0.01元解锁

《提示学习前沿论文解读课》

  


老师介绍


微信扫码关注该文公众号作者

来源:CVer

相关新闻

爆料!收到亚麻、微软、谷歌Offer的留学生都毕业于哪些学校?外网爆火!微软、英特尔疯传的算法课程,100w人抢着学全网爆火!能上山下水、通勤上班的“运动凉鞋”到底有什么魔力?只想焊死在脚上...全网爆火、一杯难求的Stanley cup出事了!生产商自爆其含有毒致病物!全网爆火、一杯难求的Stanley cup出事了!生产商自爆其含有毒致病物!还能用吗Karpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对快过年了!两份爆火全网的故宫贺岁套装与绝美敦煌日历带回家!重大突破!孙案已移交澳移民局!最新近照!全家准备逃往这!澳媒:孙改名、更换信息!刷爆谷歌热搜...今年爆火的"护眼片"!澳、美权威认证!防蓝光、保护视力、改善老花眼!惊爆大瓜!出G、滥J…谷歌员工杀妻案反转?女方被曝X视频?年入400亿!哈尔滨爆火的“泼天富贵”,全留给这个小县城了全网爆火的Lulu家同款平替,3.5折入!这个夏天疯狂掉肉,全靠它!全网爆火!加拿大大学男子毕业后搬到中国!爱上林妹妹、独居陋室!全网爆火!加拿大男子多大毕业后:告别焦虑搬到中国!爱上林妹妹、独居陋室!现场削黄瓜、叠衣服,曾爆火的刮胡子机器人再进化,穹彻的具身智能大脑来了!谷歌前CEO猛爆料! 演讲全程放飞自我,这些话,是我们能听的吗?最近,这首15年前的中文老歌在外网爆火,老外:唱哭了!最近,这首15年前的中文老歌在外网爆火,老外苦苦钻研歌词:唱哭了!半折抢!全网爆卖300w支的止痒“神器”,0岁、孕妈可用!视频爆火!老外吐槽国外的N件奇葩事!中餐只点外卖、满街流浪汉!结果....雍和宫爆火的香灰琉璃手串,吉祥、聚福、不贵!送人自戴都可以赞!曾以“最牛学习计划表”火遍全网的双胞胎姐妹回国任教……听,教育早新闻来啦!今夏爆火的「小V脸绷带」!陈乔恩、辛芷蕾都在戴!显瘦10斤瘦赘肉~今夏“爆火”的工装裤凉爽到飞起!一裤两穿,束腿、阔腿随意切换,显高显瘦显腿长......
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。