Bendi新闻
>
全新开源AI代码工具诞生!超越谷歌DeepMind旗下AlphaCode

全新开源AI代码工具诞生!超越谷歌DeepMind旗下AlphaCode

夕小瑶科技说 原创
作者 | 松果

听说,谷歌DeepMind开发出的AlphaCode,和上个月刚刚由Gemini推出的AlphaCode 2两位“老大哥”被超越了

没错,全新开源人工智能代码生成工具AlphaCodium,诞生了!

其开发不得不说受到了两位老大哥的启发,但令人惊喜的是,AlphaCodium现在已经“青出于蓝胜于蓝”,甚至在本周致使X(Twitter)处于混乱和激动的情绪当中。

AlphaCodium是前所未有的最好的代码生成方法,正如上文所说,它已经凌驾于AlphaCode和新AlphaCode2之上,且需要调整的地方少之又少。说不定它的诞生离让AI比人类能够生成更好的代码这一愿望又近了一步。

OpenAI的Andrej Karpathy曾在特斯拉担任人工智能总监,他强调了AlphaCodium在改善代码生成方面用到的 “流程引擎(一种迭代式代码编码法)”的方法。

听起来有点复杂,意思就是“从朴素提示转变而来”,即:答案范式转向流程范式,在这种范式中,答案是迭代构建的

为了提高LLM在特定代码问题上的性能,AlphaCode的“流程引擎”重新引入了GAN架构(由Ian Goodfellow于2014年开发)的元素,包括一个生成代码的模型以及一个通过测试、反射和规格匹配提供代码完整性的对抗模型。这一操作挣脱了只使用思维链提示工程的局限性。

下面我们来大概看看流程图是如何执行的。

从输入开始,接下来再是一系列预处理步骤。AlphaCodium在这些步骤中思考问题并最终得出第一个代码解决方案。下一步,它会生成一些额外的测试来帮助完善解决方案,并最终得出实际可行的最终版本。

CodiumAI开发AlphaCodium的故事

总部位于特拉维夫的初创公司CodiumAI开发了AlphaCodium,并在CodeContests数据集上进行了测试,该数据集包含约10000个竞争性编程问题。

据该公司网站介绍,CodiumAI的使命是“让开发人员能够更快地构建零错误程序”。它在CodeContests基准测试中的表现也证明,其性能将GPT-4的准确率从19%提高到44%。根据CodiumAI的说法,这一结果不仅仅是数字上的提高,更多是LLMs在代码生成方面能力的飞跃,为该领域树立了新的标杆。

CodiumAI成立于2022年,于2023年3月筹集了1060万美元。CodiumAI分享了AlphaCodium GitHub知识库和一篇附带论文《Code Generation with AlphaCodium: From Prompt Engineering to Flow Engineering》。

CodiumAI联合创始人兼首席执行官Itamar Friedman在接受VentureBeat采访时表示,AlphaCodium迄今为止引起的关注是出乎他意料的,但他补充说,这同样是一个突破,可以帮助整个开发者社区——他强调AlphaCodium不仅仅是一个模型,而是一个系统和算法,可以实现代码生成模型和“CRITIC”模型之间的交流。

这才是最核心的创新——重要的是要把它看作一种流动和迭代,这就是为什么我们称之为“‘flow engineering”。这种流程使人工智能不仅可以生成样板代码,还可以生成有效且准确的代码。

OpenAI VS 谷歌DeepMind,最大的人工智能编码竞争

Friedman指出,他认为开发了Codex的OpenAI和开发了AlphaCode、AlphaCode 2的谷歌DeepMind是CodiumAI在编码竞争中的强大对手,但话又说回来,最大的竞争对手还是代码完整性技术本身。

Friedman认为DeepMind带给他们很大的启发,在他与OpenAI首席执行官Sam Altman的谈话中,也提了代码完整性的重要性。

Friedman和Sam有非常高的一致性,他们都认为代码完整性不仅对下一代代码构建超级重要,而且对人工智能一致性也超级重要。AlphaCodium实际上是为了提供“下一代”代码的完整性。这或许会体现在,达到预想规范、获取文化活动类文献、达成个人信仰和其他准则。

Friedman表示,谷歌DeepMind在其AlphaGo解决方案中包括了流程引擎的一些方面,但在AlphaCode中没有。他认为可能是因为这种想法不属于“只是单纯地需要一个更好的LLM”这一所谓主流叙事的一部分。

Friedman认为,人工智能不生成工作代码的原因不是因为需要更好的LLM,而是因为我们需要流量。

最后,还是希望能够看到在不断的更新换代中,AlphaCodium能带给我们更多的惊喜。


参考资料

 [1]https://venturebeat.com/ai/new-open-source-ai-coding-tool-surpasses-its-inspiration-google-deepminds-alphacode

微信扫码关注该文公众号作者

来源:夕小瑶科技说

相关新闻

准确率比现有方法高50%!谷歌DeepMind全新深度学习模型AlphaFold 3重磅论文登上《自然》只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星谷歌DeepMind全新ToT基准:全面评估LLM时间推理能力消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑LLaVA-HD全新升级,更快更强!已开源集体出走的Stability AI 发布全新代码大模型,3B以下性能最优,超越Code Llama和DeepSeek-Coder硅谷恐慌:Open AI发布全新视频模型Sora!现实,不存在了小洞不补,大洞吃苦:西交、麦马开源全新「拖动式编辑」框架&数据集全新开票!不仅是北京,广州也很支棱啊!!单场奖金池20万!百度智能云“千帆杯”教育生态行业赛全新开赛!至少降本25%!智云谷全新HUD技术“拿掉”楔形膜,助推普及化全网首发!BCG上线全新AI课程,也太适合0基础留学生了![下载] 安卓版谷歌身份验证器全新发布 基于Material You设计前哨小课学员都在这样用AI!今晚解锁全新玩法!曼岛公寓里的私人庭院竟能这么美?中城西全新豪楼开租!坐拥12条地铁线,顶级管理团队,限时免费月!ICLR 2024 | 冻结住的CLIP仍可作为教师模型!港大提出全新开集动作识别模型“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发【广而告之】海外新说唱总决赛太浪啦!|纽约冠军之夜回顾 - 全新Rap Stars诞生,回国迎战!只想见你,终于见到你!八三夭全新巡演火热开票!超越Mamba、Transformer!TTT:全新架构来袭!幻方量化开源国内首个MoE大模型,全新架构、免费商用每秒执行超40万亿次运算!微软推出内置GPT-4o的全新AI PC“硬刚”,苹果将会如何应对?PC市场是否将迎来换机潮?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。