Bendi新闻
>
网传Ilya Sutskever的推荐清单火了!掌握当前AI 90%

网传Ilya Sutskever的推荐清单火了!掌握当前AI 90%

1月前

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【Mamba/扩散/多模态】交流群

添加微信:CVer5555,小助手会拉你进群!

扫描下方二维码,加入CVer学术星球可以获得最新顶会/顶刊上的论文ideaCV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!

转载自:机器之心 | 编辑:小舟

随着生成式 AI 模型掀起新一轮 AI 浪潮,越来越多的行业迎来技术变革。许多行业从业者、基础科学研究者需要快速了解 AI 领域发展现状、掌握必要的基础知识。


如果有一份「机器学习精炼秘笈」,你认为应该涵盖哪些知识?


近日,一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。网友称「Ilya 认为掌握了这些内容,你就了解了当前(人工智能领域) 90% 的重要内容。」



推荐清单:https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE


从研究主题上看,Ilya Sutskever 重点关注 transformer 架构、循环神经网络(RNN)、长短期记忆网络(LSTM)、神经网络的复杂度等。


推荐清单部分截图。


例如,Ilya 推荐谷歌在 2017 年发表的经典论文《Attention Is All You Need》,这是 transformer 架构的问世之作。transformer 架构今天已经成为人工智能领域的主流基础架构,特别是它是生成式 AI 模型的核心架构。


Ilya 不仅推荐原论文,还推荐一篇由康奈尔大学副教授 Alexander Rush 等研究者在 2018 年撰写的博客文章 ——《The Annotated Transformer》。这篇文章以逐行实现的形式呈现了论文的注释版本,它重新排序梳理了原论文的内容,并删除了一些部分,最终展现的是一个完全可用的实现。2022 年 Austin Huang 等研究者又在其基础上编辑整理出一份采用 PyTorch 实现的更新版博客。



在 RNN 方面,Ilya 首先推荐阅读 AI 大牛 Andrej Karpathy2015 年撰写的一篇博客,强调「RNN 惊人的有效性」。



Ilya 还推荐了由纽约大学 Wojciech Zaremba(OpenAI创始团队成员)和 Ilya Sutskever 本人 2015 年发表的论文《Recurrent Neural Network Regularization》。当时,Ilya 还是谷歌大脑的研究科学家。



这篇论文为 RNN 提出了一种简单的正则化技术,阐述了如何正确地将 dropout 应用于 LSTM,大大减少了各种任务的过拟合,包括语言建模、语音识别、图像字幕生成、机器翻译等等。


此外,Ilya 还推荐了 DeepMind、伦敦大学学院 2018 年联合发表的论文《Relational recurrent neural networks》。



在 LSTM 方面,Ilya 推荐了 Anthropic 联合创始人、前 OpenAI 可解释性团队技术负责人 Christopher Olah 2015 年撰写的博客文章《Understanding LSTM Networks》,这篇文章全面细致地讲解了 LSTM 的基本知识,并阐明 RNN 取得的显著成果本质上是依靠 LSTM 实现的。



在「复杂度」方面,Ilya 重点推荐了《Kolmogorov Complexity and Algorithmic Randomness》一书中讲解「算法统计」的部分。柯尔莫哥洛夫复杂度为计算理论提供了一个用于探索问题固有复杂度的框架,可帮助研究人员更好地设计和评估 AI 模型。



在这份推荐清单中,我们还看到了一些著名 AI 学者的经典论文。例如,2012 年 ImageNet 图像识别大赛中图灵奖得主 Geoffrey Hinton 组的论文《ImageNet Classification with Deep Convolutional Neural Networks》,这篇论文提出了 AlexNet,引入了全新的深层结构和 dropout 方法,颠覆了图像识别领域,甚至被认为开启了深度学习革命。Ilya 也是这篇论文的三位作者之一。



还有 2014 年,DeepMind Alex Graves 等人提出的神经图灵机(NTM)。NTM 将神经网络的模糊模式匹配能力与可编程计算机的算法能力相结合,具有 LSTM 网络控制器的 NTM 可以从输入和输出示例中推断出简单的算法,例如复制,排序等。



此外,Ilya 还推荐了神经网络应用于基础科学(化学)的研究论文、扩展定律相关文章等等,并推荐了斯坦福大学计算机科学课程 CS231n:用于视觉识别的卷积神经网络。



感兴趣的读者可以查看原推荐清单,了解更多内容。


参考链接:https://twitter.com/keshavchan/status/1787861946173186062

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复:何恺明,即可下载本课程的所有566页课件PPT!赶紧学起来!

CVPR 2024 论文和代码下载

在CVer公众号后台回复:CVPR2024,即可下载CVPR 2024论文和代码开源的论文合集


Mamba、多模态和扩散模型交流群成立

扫描下方二维码,或者添加微信:CVer5555,即可添加CVer小助手微信,便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。


一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer5555,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

来源:CVer

相关新闻

网传Ilya Sutskever的推荐清单火了,掌握当前AI 90%终于有货了!火遍全网的「冰感深睡枕」,有钱人都在睡…超低价抢!快过年了!两份爆火全网的故宫贺岁套装与绝美敦煌日历带回家!外网爆火!斯坦福Essay课的质量太高了华人 AI 创业神话破灭?从最火的生成式 AI 产品到全网群嘲,只用了 110 天刘雯「北京千万豪宅」火了!内景曝光后,全网沸腾:每一坪都有RMB的味道!把这座爆火的中国“网红”城市推荐给多伦多人!他们这么说...惊天爆料!查尔斯国王已“逝世”?凯特王妃成现实版“消失的她”?全网传疯,越来越离谱了…曾经火遍全网的清华大学“双胞胎姐妹花”回国了,都是博导!杨紫的“蝴蝶腰”火上热搜!全网炸翻:她什么时候,变这样了!!!全网爆火、一杯难求的Stanley cup出事了!生产商自爆其含有毒致病物!全网爆火、一杯难求的Stanley cup出事了!生产商自爆其含有毒致病物!还能用吗75亿元!今年自动驾驶领域最大融资来了:90后剑桥博士带队,微软、英伟达为其站台,这家英国 AI 独角兽被首相视为“全村的希望”75亿元!今年自动驾驶领域最大融资来了:90后剑桥博士带队,微软、英伟达为其站台,这家英国AI独角兽被首相视为“全村的希望”OpenAI将终止对中国服务,宁德董事长回应网传896工作制,宝马将为电车加入模拟音效,AI冲上一本线,这就是今天的其他大新闻!这太荒谬了!高达90%的小费快把加拿大人折腾疯了!丢人!中国爸爸为给保姆免费升头等舱大闹航班!都传到外网了!GPT王炸升级!全网独一份的AI大模型教程(资料+工具)400G来了!骨干网光通信的最新趋势终于“塌房”了!这个网红干的事,天理不容!外网爆火AI课程上线!BCG官方出品,留学生4小时即可拿证!可恶!太自私了!为了拍摄完美的网红打卡照片!他们摇晃樱花树,使花瓣落下....引起公众...国产大模型卷翻机器人!这些火遍全网的机器人,都装上了星火「大脑」200亿的大网红,扛不住了!
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。