Bendi新闻
>
马斯克开源Grok-1,OpenAI如何应对?|【经纬低调分享】
马斯克开源Grok-1,OpenAI如何应对?|【经纬低调分享】
9月前
基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调; 3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%; 2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。
pip install -r requirements.txt
python run.py
magnet:?xt=urn:btih:5f96d43576e3d386c9ba65b883210a393b68210e&tr=https%3A%2F%2Facademictorrents.com%2Fannounce.php&tr=udp%3A%2F%2Ftracker.coppersurfer.tk%3A6969&tr=udp%3A%2F%2Ftracker.opentrackr.org%3A1337%2Fannounce
Grok 是一款仿照《银河系漫游指南》设计的 AI,可以回答几乎任何问题,更难能可贵的是,它甚至可以建议你问什么问题! Grok 在回答问题时略带诙谐和叛逆,因此如果你讨厌幽默,请不要使用它! Grok 的一个独特而基本的优势是,它可以通过 X 平台实时了解世界。它还能回答被大多数其他 AI 系统拒绝的辛辣问题。 Grok 仍然是一个非常早期的测试版产品 —— 这是我们通过两个月的训练能够达到的最佳效果 —— 因此,希望在您的帮助下,它能在测试中迅速改进。
模型细节:Grok-1 是一个基于 Transformer 的自回归模型。xAI 利用来自人类和早期 Grok-0 模型的大量反馈对模型进行了微调。初始的 Grok-1 能够处理 8192 个 token 的上下文长度。模型于 2023 年 11 月发布。 预期用途:Grok-1 将作为 Grok 背后的引擎,用于自然语言处理任务,包括问答、信息检索、创意写作和编码辅助。 局限性:虽然 Grok-1 在信息处理方面表现出色,但让人类检查 Grok-1 的工作以确保准确性至关重要。Grok-1 语言模型不具备独立搜索网络的能力。在 Grok 中部署搜索工具和数据库可以增强模型的能力和真实性。尽管可以访问外部信息源,但模型仍会产生幻觉。 训练数据:Grok-1 发布版本所使用的训练数据来自截至 2023 年第三季度的互联网数据和 xAI 的 AI 训练师提供的数据。 评估:xAI 在一系列推理基准任务和国外数学考试试题中对 Grok-1 进行了评估。他们与早期 alpha 测试者合作,以评估 Grok-1 的一个版本,包括对抗性测试。目前,Grok 已经对一部分早期用户开启了封闭测试访问权限,进一步扩大测试人群。
收集反馈,确保他们打造的 AI 工具能够最大限度地造福全人类。他们认为,设计出对有各种背景和政治观点的人都有用的 AI 工具非常重要。他们还希望在遵守法律的前提下,通过他们的 AI 工具增强用户的能力。Grok 的目标是探索并公开展示这种方法; 增强研究和创新能力:他们希望 Grok 成为所有人的强大研究助手,帮助他们快速获取相关信息、处理数据并提出新想法。
在数次嘲讽OpenAI是「CloseAI」之后,马斯克果真选择了开源自家大模型。
当然,这背后肯定也有商业上的考量。
作为市场领导者的OpenAI,是没有理由开源ChatGPT背后模型代码的。
现在,通过发布Grok的代码,马斯克将自己牢牢扎根在后者的阵营中。这一决定,或许能让他的xAI超越Meta和Mistral AI。
Llama的开源给Meta带来了很多好处,几乎让小扎从元宇宙的泥潭爬了出来。
而仅仅只是一个小型初创公司的Mistral AI,也因为自己的开源策略而声名鹊起,被业界公认为「欧洲的OpenAI」。
开源版本可能会鼓励开发者和潜在客户更快地采纳自己的模型,实际上起到了市场推广的作用。
开发者社区对Grok开源版本的反馈和改进也可能有助于xAI加速开发新版本,这些新版本xAI可以选择开放源代码或保留专有权。
比如像Mistral一样,承诺继续发布开源版本,同时为付费客户保留最先进的模型。
马斯克一直是开源技术的支持者,连Tesla也已经开放了汽车某些部分的源代码,而他的社交媒体平台X公开了一些用于内容排名的算法。
「还有工作要做,但这个平台已经是迄今为止最透明、最注重真相、不是高门槛的平台,」马斯克今天在回应对开源X推荐算法的评论时,这样说道。
尽管OpenAI目前在AI领域仍遥遥领先,但开源和闭源的战争还远远没有结束。
AI模型是否应该开源?某些人认为,必须防止这种强大技术免受闯入者的侵害,而另一些人则坚持认为,开源的利绝对大于弊。
作为市场领导者的OpenAI,是没有理由开源ChatGPT背后模型代码的。
现在,通过发布Grok的代码,马斯克将自己牢牢扎根在后者的阵营中。
这一决定,或许能让他的xAI最终超越Meta和Mistral AI。
经纬张颖:2023,不只克服困难而是习惯困难
经纬张颖内部讲话:2024,四大关键决策
经纬2023年终盘点:Adaptability is the key to thriving
微信扫码关注该文公众号作者
来源:经纬创投
相关新闻
苹果免费使用ChatGPT,马斯克为何怒了?|【经纬低调分享】聪明人如何正确决策?|【经纬低调分享】一天只睡4小时,高手如何进化睡眠功能? |【经纬低调分享】从烘焙店女工到“女明星”,黄油小熊如何成为现象级IP? |【经纬低调分享】一分钱不花,他如何靠一辆竹子自行车环球骑行?|【经纬低调分享】OpenAI的人才库,为何挤满了新人? |【经纬低调分享】解压「捏捏」身价上万,如何抓住打工人的精神状态? |【经纬低调分享】如何从易疲劳体质变成一个精力充沛的人? |【经纬低调分享】如何抓住地震预警的黄金几秒? |【经纬低调分享】OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期马斯克“掀桌子”,AI大模型+自动驾驶会诞生什么? |【经纬低调研究】马斯克打脸OpenAI,全球最大巨无霸模型Grok-1开源!3140亿参数8个MoE,GitHub狂揽6k星马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?斯坦福紧急下架视频,谷歌前CEO施密特说了哪些真话? |【经纬低调分享】纸板床、奢侈品大秀、各国队服,谁是巴黎奥运会赛前最大亮点? |【经纬低调分享】每天只工作4小时,好不好?【经纬低调分享】俄罗斯人,挤爆三亚中医门诊?|【经纬低调分享】日本东京推出“官方Tinder”,生育率大跌下的紧急举措? |【经纬低调分享】打败“白人饭”,打工人开始吃盖浇饭减脂了?|【经纬低调分享】地球上最会赚钱的人,留下了哪些顶级判断力思维? |【经纬低调分享】当00后运营官方账号,动物快不够用了? |【经纬低调分享】当AI开始看图定位,你的位置不再是秘密? |【经纬低调分享】深夜焦虑的CEO看点什么? |【经纬低调分享】百年一遇都集中在2024年的4月了吗? |【经纬低调分享】