Bendi新闻
>
YYDS!万物皆可大模型!

YYDS!万物皆可大模型!

3月前

2023年以来,以ChatGPT为代表的大模型成为世界数字科技领域的新热点大模型目前在机器翻译、语言理解、聊天机器人、图像识别,图像视频生成、语音识别、推荐系统等等领域都获得了革命性的进步。


为了能够让大家更深入地了解大模型领域,我们联合沃恩智慧qs前50,人均20+篇一作作者,打造了大模型系列精品课程,原价699元,限时0元免费送!


扫码领取课程(附老师授课PPT)
免费领导师推荐近3年热门大模型论文&电子书


导师推荐近三年热门大模型论文合集&部分老师授课PPT原件



20+本ChatGPT相关电子书

大模型系列课程概览

系列1 万物皆可大模型系列

1.GPT Plugin背后的机理

2.大模型与数据库交互

3.大模型玩MineCraft

系列2 后AI大模型时代,多模态助你弯道超车

1.多模态学习-大模型开启AI新时代

2.如何快速训练自己的多模态AI大模型

3.后AI时代,多模态的研究方向和热点

系列3 惊艳的大模型高效参数微调法

1.大模型微调-任务特定的P-tuning

2.大模型微调-任务/模型无关的LORA

3.大模型微调方法-Peft库使用实践(实战篇)

系列4 大模型在文本生成方向的最新尝试工作

1.对比学习在多模态和NLP领域的应用

扫码领取课程(附老师授课PPT)
免费领导师推荐近3年热门大模型论文&电子书


导师推荐近三年热门大模型论文合集&部分老师授课PPT原件



20+本ChatGPT相关电子书


大模型微调遗忘问题依旧是当下的热点研究方向,近期有团队针对语言模型,在医疗问题解答(QA)任务的特定数据集上对其进行了微调。然后测量它在其他医学问答数据集上的分布通用性,并评估在常识性问答以及指令性任务中的任务通用性。



最近,又相继出现了各方向领域的微调模型,这里给大家介绍几个比较有特色的新微调模型:

TransGPT为一个开源交通大模型,能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能。

模型基座采用LLaMA7B进行训练。

地址

https://github.com/DUOMO/TransGPT

墨子(Mozi)大模型,主要完成科技文本理解和生成任务,覆盖了包括科技问答、对话、信息抽取和摘要理解等特定任务。

基于llama7b、Baichuan7b,使用的训练方法为QLoRA优化,使用8卡3090服务器训练约9天完成。模型支持最大输入长度为4096。

地址

https://github.com/gmftbyGMFTBY/science-llm

天文领域微调模型:StarGLM,该项目整合了司天工程相关的语料数据与知识库资料,训练得到了天文大语言模型StarGLM(ChatGLM for Variable Star),以期缓解大语言模型在部分天文通用知识和前沿变星领域的幻觉现象。

地址:

https://github.com/Yu-Yang-Li/StarGLM

在微调数据方面,先后经过ChatGPT-Corpus、Belle项目筛选数据、Firefly+Instinwild项目筛选数据、GPT-4-LLM项目筛选数据,并配合人工标注,共同组成20W条天文对话数据。




给大家送一波大福利!我整理了100节计算机全方向必学课程,包含CV&NLP&论文写作经典课程,限时免费领!




扫码领取课程(附老师授课PPT)
免费领导师推荐近3年热门大模型论文&电子书

-END-

微信扫码关注该文公众号作者

来源:PaperWeekly

相关新闻

世界顶尖多模态大模型开源!又是零一万物,又是李开复CVPR 2024 | 和马赛克说拜拜!华为、清华等提出基于认知的万物超分大模型行业巨变!大模型走下神坛!!惊呆!大模型工程师月薪快10w了!实锤了!斯坦福学生抄袭国内大模型!别忽视这个细节ControlNet作者搞起大模型!解决大家不会写提示词的痛点!降价!免费!圈地!大模型价格战卷到飞起ICML2024高分论文!大模型计算效率暴涨至200%,来自中国AI公司GPT-4o炸裂登场!大模型仍是最大赢家!字节、阿里再掀价格战,百度紧跟!大模型卖出“白菜价”黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10一个悄然崛起的国产开源大模型!OpenAI否认加入的AI搜索已是一片红海!Stack Overflow 数据用于 AI 训练再次引发争议!| 大模型一周大事百万tokens低至1元!大模型越来越卷了Meta最新进展!大模型“超级外挂”:LLM RAG​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源微软来大招:手机部署堪比GPT3.5高性能大模型!微软秒删堪比 GPT-4 的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试总结!大模型微调(Fine-Tuning)的常见方法Stability、Mistral、Databricks、通义、A21 Labs开源五连招,其中三个是MoE!|大模型一周大事只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。