Bendi新闻
>
我做了6节提示学习实战论文课(附20G训练资料)

我做了6节提示学习实战论文课(附20G训练资料)

9月前

作为最先进的AI学习方法,提示学习和指示学习(instruction learning)代表了目前NLP方向的新趋势,能够让AI系统对齐人类的意图,大大提高大语言模型的学习能力。


由于所涉及的检索和推断方法多种多样,提示学习的实施十分复杂,特别是训练一个属于自己NLP任务的Pre-training LM。


这次我综合整理了20G的语言训练资料,包含点评、社区互动、维基百科等,这些数据已经处理好了,可以直接二进制读取然后进行训练。


扫码回复“提示学习

获取训练合集


这次我邀请了在阿里和微软亚洲研究院等公司进行NLP相关项目John老师1月25日晚20:00来分享提示学习的学习策略,此次课程的主题是—《Introduction to the Prompt Learning 》


课程大纲:

1. Prompt基本概念描述
2. Prompt基本方法介绍
3. Prompt相关工具
4. 总结与学习路径

0.01元解锁

《Introduction to the Prompt Learning 》

  


另外John老师还做了《提示学习前沿论文解读课》,课程将从instruction tuning、Self-Instruct以及Black-box Prompt Learning三项技术入手,通过理论(3篇论文解读)+实战(LORA微调大模型)的方式,5节课全方位带大家深度掌握大型语言模型提示学习系列知识。


0.01元解锁

《提示学习前沿论文解读课》

  


课程大纲


第一节课:Prompt Learning 概述

  • 介绍prompt的基本概念

  • 介绍衍生的instruction learning以及两者区别


第二节课:论文解读1

paper1:Finetuned Language Models are Zero-Shot Learners

论文会议:ICLR 2022

本文提出了一个新的概念 instruction tuning,就是将很多数据集都表示成指令的形式,来进行fine-tune,从而大大提高了unseen 任务上的零样本性能。

通过学习这篇论文,我们可以了解在一组task上微调模型是否会提高模型在unseen task上的性能,以及通用模型的未来研究方向。


第三节课:论文解读2

paper2:Self-Instruct: Aligning Language Model with Self Generated Instructions

论文会议:ACL 2023

大型“指令调优”的语言模型已经证明了其在新任务上卓越的zero-shot能力。但是人工编写指令数据集仍然存在一些挑战。

本文首次提出自动构造instruction数据的方法,通过LLM生成指令来指导自身微调。提出的框架Self-Instruct可以使用最少的人工标注,生成大量的用于 instruct-  tuning 的数据。


第四节课:代码实践LoRA微调

  • LORA微调实战

  • 基于论文解读2自动构造的数据上进行大模型的微调


第五节课:论文解读3


paper3:Black-Box Prompt Optimization: Aligning Large Language Models without Model Training

现有的对齐方法主要侧重于对LLM进行进一步的训练,然而这些对齐方法在效率、可访问性、可解释性方面仍存在缺陷。

清华团队提出了一种黑盒提示优化(BPO)来执行对齐,通过优化用户Prompt以适应LLM对输入的理解来对齐大语言模型和人类的意图。


0.01元解锁

《提示学习前沿论文解读课》

  


老师介绍


微信扫码关注该文公众号作者

来源:深度学习自然语言处理

相关新闻

苹果使用 TPU 训练 AI、而非 GPU(附论文)爽!AI工具用得好,20分钟就能拿下1篇SCI?实战攻略来了……(内附提示词)2024年6月12-16日吉利根老师催眠线上授证课第二模块(附广州精英催眠营证书课程时间)参投北影节,我们做了人生第一支AI科幻短片(附全流程拆解)不会用AI写论文?这6个关键步骤,让你20分钟完成一篇SCI!(免费送提示词模版)实惨!研二医学生想靠MR发文,却反复被拒稿,险些被延毕……(附MR学习干货)2024年过去1/12,你和孩子阅读了吗?(你买书,我送课)全网独一份!AI大模型学习训练资源...(限时免费领)第十八期写作精品课(晚鸟票最后6天)年近40,晋升副高被卡?某院主治医生靠它3个月完成6分SCI!(附发文干货)班主任提醒: 这6个问题不改正,孩子成绩好不了!(附对策)确认发团!6月2日最美小镇一日游!热尔伯鲁瓦(Gerberoy)玫瑰节!【穷游最美小镇北线 】确认发团!6月2日最美小镇一日游!热尔伯鲁瓦(Gerberoy)玫瑰节!【穷游最美小镇北线】6月2日最美小镇一日游!热尔伯鲁瓦(Gerberoy)玫瑰节!【穷游最美小镇北线 】6月2日最美小镇一日游!热尔伯鲁瓦(Gerberoy)玫瑰节!雷军2024年度演讲PPT,这6个方法绝了!(附赠演讲PPT)2024年8月14-18日吉利根老师催眠线上授证课第三模块(附广州精英催眠营证书课程时间)北美科技大厂“带病生存”,6大方向成NG求职新选择!(附投递名单)字节、中信建投...200+公司开岗,最快2周拿Offer(附内推码)2024年5月8-12日吉利根老师催眠线上授证课第一模块(附广州精英催眠营证书课程时间)第二十六届上海国际电影节排片表公布(附线上购票攻略)用AI写论文会被拒收吗?《Nature》帮你总结了主流SCI出版社的观点……(附免费发文干货)港中文(深圳)1v1科研-AI对于大学生学习效率与质量的影响研究|收获一作论文与导师推荐信!孩子自学练字,黑科技又解放我了,只要两节写字班的钱(明10点返团)
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。