Bendi新闻
>
弱智吧:大模型变聪明,有我一份贡献
弱智吧:大模型变聪明,有我一份贡献
8月前
「被门夹过的核桃,还能补脑吗?」
提出了一个高质量的中文指令调优数据集,专门用于与人类交互保持一致,并通过严格的过滤程序实现; 探讨了各种数据源(包括社交媒体、百科全书和传统 NLP 任务)对模型性能的影响。为从中国互联网中选择训练数据提供了重要见解; 各种基准测试和人工评估证实,在 CQIA 数据集上微调的模型表现出卓越的性能,从而使 CQIA 成为中国 NLP 社区的宝贵资源。
论文地址:https://arxiv.org/pdf/2403.18058.pdf 数据地址:https://huggingface.co/datasets/m-a-p/COIG-CQIA 论文标题:COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning
社交媒体和论坛:包括知乎、SegmentFault 、豆瓣、小红书、弱智吧。 世界知识:百科全书、四个特定领域的数据(医学、经济管理、电子学和农业)。 NLP 数据集:COIG-PC 、COIG Human Value 等。 考试试题:中学和大学入学考试、研究生入学考试、逻辑推理测试、中国传统文化。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
没想到吧,中文互联网上最好的大模型语料库是:弱智吧大模型中文微调最佳神器!「弱智吧」吊打小红书、知乎、豆瓣...大模型中文微调最佳神器!"弱智吧"is all you need清华北航博士生「强迫」Gemma-2说中文!弱智吧、角色扮演、数学问题表现惊喜“弱智吧”,人类抵御AI的最后防线“35岁没人聘你就自己去创业”,董明珠:有贡献才能谈收入,想休闲可以辞职!格力成立新部门,负责人曾任职京东弱智吧,人类抵御 AI 的最后防线恭喜弱智吧,打败AI吃饭不健康,癌症风险可能更高!《细胞》发现糖代谢致癌新机制;弱智吧竟成最佳中文AI训练数据?测试远超知乎豆瓣小红书|本周论文推荐什么弱智吧,叫哲学哥!“威胁说想动我!”被欠$14万,澳洲多名建筑华工追款无门!包工头:“我才是弱势群体”“威胁说想动我!”被欠$14万,悉尼多名建筑华工追款无门!包工头:“我才是弱势群体”顶尖AI研究者,中国贡献26%:全球人才智库报告出炉硬刚到底!JK罗琳称不会原谅哈利波特主演:向弱势女性道歉吧!全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报欢迎更多无证移民??最新报告:无证移民对美国经济贡献大!!?相信MBTI人格的都是弱智吗?无证移民因税收对美国经济贡献大插眼、断趾、敲牙、淋热油,残虐弱智女几乎致死,老毒妇一家六口被判刑!英国对人类的七大贡献牺牲的“高级将领”多,所以贡献大?【今日天下0714】Trump 遭枪击,枪手被击毙;2024最佳超市连锁评分公布;贡献个我自己经常做的早餐!澳新冠试剂盒曝质量问题!TGA紧急警告:“弱阳”也是阳!别不当回事!Linus Torvalds 言辞激烈,怒怼谷歌内核贡献者:垃圾代码!