Bendi新闻
>
18个月,OpenAI这支团队搞出了GPT-4o

18个月,OpenAI这支团队搞出了GPT-4o

7月前
机器之心报道
机器之心编辑部
奥特曼:如果没有他(Prafulla Dhariwal)的远见、才华、信念和决心,就不会有 GPT-4o。

「GPT-4o 的诞生离不开 @prafdhar 的远见、才华、信念和长期以来的坚定决心。正是这些努力(以及许多其他人的工作)促成了我希望会成为计算机使用方式革命的成果。


在 OpenAI 发布新一代旗舰生成模型 GPT-4o 后的两天,OpenAI CEO 奥特曼对参与该项目的其中一位负责人评价道。



紧随其后,联合创始人 Greg Brockman 表示:「GPT-4o 是整个团队努力的结果。特别要感谢 @prafdhar,他坚信能够构建一个全能模型,并在过去 18 个月里通过与 OpenAI 的多个团队展开合作,从而实现了这一目标。」



看到这,估计大家都很好奇,prafdhar 到底是谁,他就是 Omni 团队负责人 Prafulla Dhariwal,也是 GPT-3、DALL-E 2 共同创造者。Dhariwal 表示「GPT-4o(o 代表 omni)是 Omni 团队推出的首个模型,也是 OpenAI 首个原生的全多模态模型。这次发布是整个组织共同努力的结果」。同时,Dhariwal 提到他想特别感谢团队中一些出色的成员,正是他们让这个神奇的模型成为可能!




Dhariwal 口中出色的团队成员到底有谁,整个团队贡献者都有哪些,接下来我们将为大家一一揭晓。


Prafulla Dhariwal




Prafulla Dhariwal 是 OpenAI 的一名研究科学家(也是前文奥特曼特别感谢的人),研究方向主要是生成式模型和无监督学习。他在 2017 年加入 OpenAI,至今已有 7 年多的时间。


Prafulla Dhariwal 本科毕业于麻省理工学院。在 MIT,Prafulla Dhariwal 主要学习计算机科学、数学、物理学,并在 MIT 大脑、思维和机器中心担任本科生研究员。


根据 Google Scholar 显示,Dhariwal 论文引用次数达到 72200 多次,参与的研究包括 DALL-E 2、DALL-E 3、Glow、Consistency Models 等,都是大家比较熟悉的。



James Betker



James Betker 是 OpenAI 的研究工程师,主要研究图像和音频的生成式建模。


在加入 OpenAI 之前,James Betker 在 GARMIN 国际航电瑞士有限公司担任了 12 年的软件工程师,并曾在谷歌担任软件工程师。


Rowan Zellers




Rowan Zellers 是 OpenAI 的研究员,致力于构建通过语言、视觉和声音理解人类和世界的机器。


Prafulla Dhariwal 表示:「Rowan Zellers 的研究工作让 GPT-4o 能够像人类一样自然地观看视频。」Rowan Zellers 也是 GPT-4 研究团队成员之一。


Alexis Conneau



Alexis Conneau 现在为 OpenAI 音频 AGI 研究负责人。Dhariwal 表示 Conneau 比 OpenAI 的任何人都更早地提出了 HER 的愿景,并坚持不懈地执行!


Gabriel Goh



Gabriel Goh 为 OpenAI 机器学习研究员,他对可解释性、机器学习、数据可视化和凸优化感兴趣。曾经参与了 DALL・E 1、DALL・E 3、GPT-4 等的研究。


Ishaan Gulrajani



Ishaan Gulrajani 现在为 OpenAI 机器学习研究者,此前他博士毕业于斯坦福大学,曾经参与过 Alpaca、Stanford alpaca 等的研究。


Alex Nichol



Alex Nichol 在 OpenAI 从事深度学习研究,DALL-E 2 共同创造者,擅长代码、人工智能和 3D 打印。


Li JING



Li JING 是 OpenAI 的研究员,在 GPT-4o 工作中主要进行图像 / 3D 生成方面的研究。


Li JING 也是 DALL・E 3 和 Sora 的研究团队成员。Li JING 的研究工作致力于帮助人工智能理解现实世界并创造新的智能。


Casey Chu



Casey Chu 是 OpenAI 的一名研究员,研究多模态人工智能系统,参与过 GPT-4、DALL・E 2 的研究。此前,他博士毕业于斯坦福大学。


Mark Chen


中间一位是 Mark Chen


Mark Chen 为 OpenAI 前沿研究主管,5 月 14 日凌晨发布会现场就有他的身影,Mark Chen 曾参与过 DALL・E、GPT-4 等的研究。


Jiahui Yu



Jiahui Yu 在 OpenAI 领导感知团队,此前,他在伊利诺伊大学厄巴纳 - 香槟分校获得博士学位。在加入 OpenAI 之前,Jiahui Yu 在谷歌参与的研究包括 Gemini、PaLM 2 等。


Huiwen Chang



Huiwen Chang 于 2023 年加入 OpenAI,此前她在谷歌担任高级研究科学家,本科毕业于清华大学。


A. Jabri



A. Jabri 为 OpenAI 的技术人员,主要研究领域是用于自监督和无监督学习的可扩展目标和架构。此前曾在谷歌 DeepMind 实习。


Christine McLeavey



Christine McLeavey 是 OpenAI 的技术团队成员,主要进行多模态研究工作。她的研究兴趣主要在于音乐生成,她也是 OpenAI 音乐模型 MuseNet 研究团队成员。


Yu Zhang



Yu Zhang 是 OpenAI 技术团队成员,曾在 Google DeepMind 担任了 6 年的研究科学家。


Yu Zhang 本科毕业于上海交通大学计算机科学系,博士毕业于 MIT 计算机科学系。


除了上面提到的这些研究者,OpenAI 官方也放出了完整名单:



完整名单地址:https://openai.com/gpt-4o-contributions/


其中,语言方面的核心贡献者包括:



多模态核心贡献者包括:




感兴趣的读者,可以查看完整名单了解更多信息。





© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

来源:机器之心

相关新闻

18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了OpenAI机密五级AGI路线图曝光!GPT-4仍处L1,内部AI接近博士水平18个月诞生用了 18 个月时间,做 AI 应用从 0 到 200 万用户,从亏损到盈利的全面复盘开源Llama 3.1一夜成最强大模型!超越闭源GPT-4o,OpenAI坐不住了GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云没有等来OpenAI开源GPT-4o,等来了开源版VITA全球首款集成 GPT-4o 的智能眼镜来了,这会是下一个爆款吗?寡姐怒了,GPT-4o系统配音强行模仿,OpenAI回应删除成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好!GPT-4o遭破解!大神搞出越狱版本,OpenAI紧急封杀,安全小组被打脸70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队GPT-4o mini实力霸榜,限时2个月微调不花钱!每天200万训练token免费薅完了!审核长达18个月!『希腊黄金签证』赶不上了···第17期18个月-8岁斯坦福创造性艺术课报名啦!这门课还能帮助提高私校智商测试分数?强烈推荐!复旦团队重大突破登Cell,破纪录复活「冰封」18个月人脑!三体云天明计划成真?OpenAI发布GPT-4o模型卡:概述AI安全和风险缓解措施;波士顿动力人形机器人又整新活,一口气做8个俯卧撑丨AIGC日报OpenAI 发布 GPT-4o;苹果将在中法德日销售 Vision Pro;特斯拉重招 4 月被解雇的超充员工|极客早知道OpenAI突破性发布GPT-4o!电影《她》真的来了|亮马桥小纪严选远离硅谷、不靠风投!18人团队逆势搞出超人气数据库,CTO 一人5年多写了15万行代码OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次​Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。