Bendi新闻
>
弱智吧:大模型变聪明,有我一份贡献
弱智吧:大模型变聪明,有我一份贡献
2月前
「被门夹过的核桃,还能补脑吗?」
提出了一个高质量的中文指令调优数据集,专门用于与人类交互保持一致,并通过严格的过滤程序实现; 探讨了各种数据源(包括社交媒体、百科全书和传统 NLP 任务)对模型性能的影响。为从中国互联网中选择训练数据提供了重要见解; 各种基准测试和人工评估证实,在 CQIA 数据集上微调的模型表现出卓越的性能,从而使 CQIA 成为中国 NLP 社区的宝贵资源。
论文地址:https://arxiv.org/pdf/2403.18058.pdf 数据地址:https://huggingface.co/datasets/m-a-p/COIG-CQIA 论文标题:COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning
社交媒体和论坛:包括知乎、SegmentFault 、豆瓣、小红书、弱智吧。 世界知识:百科全书、四个特定领域的数据(医学、经济管理、电子学和农业)。 NLP 数据集:COIG-PC 、COIG Human Value 等。 考试试题:中学和大学入学考试、研究生入学考试、逻辑推理测试、中国传统文化。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
没想到吧,中文互联网上最好的大模型语料库是:弱智吧大模型中文微调最佳神器!「弱智吧」吊打小红书、知乎、豆瓣...大模型中文微调最佳神器!"弱智吧"is all you need“弱智吧”,人类抵御AI的最后防线“35岁没人聘你就自己去创业”,董明珠:有贡献才能谈收入,想休闲可以辞职!格力成立新部门,负责人曾任职京东弱智吧,人类抵御 AI 的最后防线恭喜弱智吧,打败AI吃饭不健康,癌症风险可能更高!《细胞》发现糖代谢致癌新机制;弱智吧竟成最佳中文AI训练数据?测试远超知乎豆瓣小红书|本周论文推荐什么弱智吧,叫哲学哥!“威胁说想动我!”被欠$14万,澳洲多名建筑华工追款无门!包工头:“我才是弱势群体”“威胁说想动我!”被欠$14万,悉尼多名建筑华工追款无门!包工头:“我才是弱势群体”顶尖AI研究者,中国贡献26%:全球人才智库报告出炉硬刚到底!JK罗琳称不会原谅哈利波特主演:向弱势女性道歉吧!全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报英国对人类的七大贡献牺牲的“高级将领”多,所以贡献大?澳新冠试剂盒曝质量问题!TGA紧急警告:“弱阳”也是阳!别不当回事!Linus Torvalds 言辞激烈,怒怼谷歌内核贡献者:垃圾代码!Linus 开喷谷歌内核贡献者:你的代码是垃圾!网友:我们熟悉的 Linus 回来了Linus 新年首次发飙!怒怼谷歌内核贡献者:垃圾代码Linus言辞激烈,怒怼谷歌内核贡献者:垃圾代码!私募十二月报:市场弱势探底,债券策略表现稳健招生官揭秘:强数学弱写作卡住华人孩子名校路拼多多去年营收利润双大涨,Temu贡献最大增长点 / 泡泡玛特2023海外营收大涨134.9%丨36氪出海·要闻回顾