Bendi新闻
>
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

6月前

微信扫码关注该文公众号作者

来源:量子位

相关新闻

Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定Karpathy又整活儿了!一天训练出GPT-2、成本还骤降100倍,网友:dream老黄把价格再打下来OpenAI把微软电网搞崩!GPT-6被曝25年发布,训练刷爆10万张H100突然哑火!从人气爆棚到低价甩舱:昔日豪华“邮轮游”,竟成“吃苦训练营”?小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品ICML 2024 | 大语言模型预训练新前沿:最佳适配打包重塑文档处理标准ICML 2024 | 大语言模型预训练新前沿:「最佳适配打包」重塑文档处理标准马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o名单公示、训练计划:上海新青年山地马拉松集训营(名校户外)首批拟录取营员名单、初步训练计划再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升IJCAI 2024 | 多智能体强化学习新范式:个性化训练与蒸馏执行最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍一款手游有400+个AI角色!腾讯游戏新系统炸场GDC:训练成本大减90%Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果华为悬红200万全球求解难题引热议,网友:虽然不会,但是感觉自己亏了;马斯克的超级算力愿景:xAI将建计算超级工厂训练Grok突发!美国拟限制中国公司使用其云数据中心训练AI模型;TikTok、英雄联盟开发商裁员;哄哄模拟器爆火 | AI周报小扎All in 开源AGI:正训练Llama 3,年底将有35万块H100开源AGI智能体人人可养成:AGI对齐新思路,让智能体在人类世界中接受训练公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4Andrej Karpathy提出未来计算机2.0构想: 完全由神经网络驱动!网友炸锅了GPT-4o干掉初创全网实测,马斯克Karpathy等大佬纷表不服:OpenAI不过如此GPT-4o mini实力霸榜,限时2个月微调不花钱!每天200万训练token免费薅
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。