全球首个芯片设计开源大模型诞生!5年重塑5000亿美元半导体行业
新智元报道
新智元报道
【新智元导读】全球首个芯片设计开源大模型SemiKong正式发布,基于Llama 3微调而来,性能超越通用大模型。未来5年,SemiKong或将重塑价值5000亿美元的半导体行业。
全球首个专为芯片设计专用的AI开源大模型诞生了!
今天,在Semicon West 2024大会上,Aitomatic发布了首个SemiKong半导体行业设计的新模型,将革新半导体工艺和制造技术。
SemiKong是由Aitomatic与FPT Software合作开发,在处理行业特定任务时,表现优于通用大模型,如GPT和 Llama 3。
https://www.semikong.ai/
这家公司表示,SemiKong有望在未来五年内,重塑价值5000亿美元的半导体行业。
LeCun大佬随即转发了这一开源芯片设计的AI模型。
新模型的代码权重已经放在的Hugging Face、GitHub上,供所有人下载。
地址:https://github.com/aitomatic/semikong?tab=readme-ov-file
Aitomatic的CEO Christopher Nguyen表示,公司选择开源的做法,在因竞争保密而臭名昭著的半导体行业,属于史无前例的一件大事!
在他们看来,在基础层共享研发成功的好处,远远超过保密带来的价值。同时,他们也希望看到在公司/工具/工艺/设备特定层以上的专有差异化和竞争。
最后,CEO感谢了为这种工业规模合作做出贡献的AI Alliance成员,并且着重感谢了Llama-3这样的开源基础模型,同时向LeCun等人表示致意。
Llama 3微调,8B参数
根据官网的介绍,SemiKong模型专门接受过半导体领域知识的训练。
它基于Llama 3 Instruct微调而来。从放出的代码权重,可以看出SemiKong有8B的参数。
SemiKong的训练过程主要分为3个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。
在行业相关的基准上,SemiKong优于许多通用LLM。而且,为那些打造适合自身的专有模型的芯片公司,提供了一个有价值的基座。
SemiKong在准确性、相关性和对半导体工艺的理解上,得到了显著的改进。
如今业内愈发公认,即使是小模型,在特定领域的应用中也能超越更大的通用模型。
显然,无论是在加速创新还降低成本方面,8B的SemiKong在整个半导体价值链中都潜力极大。
CEO Christopher Nguye在一份声明中表示,「SemiKong将重新定义半导体制造。由AI Alliance推动的这种开放创新模式,利用了集体智慧来应对行业特定的挑战。在Aitomatic,我们正使用SemiKong创建特定领域的AI智能体,以前所未有的效率解决复杂的制造问题」。
SemiKong的出现,可以逐渐降低半导体生产成本,未来几年内消费者可能会看到更强大的智能手机、笔记本电脑和智能家居设备以更低的价格上市。
下一个更强大的SemiKong版本计划在今年12月推出,首个针对工艺特定模型预计在9月发布。
半导体行业,进入新时代
SemiKong的诞生,背后离不开人工智能联盟的托举。
而CEO Christopher Nguyen本人,也是AI Alliance的领导者之一。
IBM 研究院AI开放创新负责人Anthony Annunziata强调:「AI联盟的开放协作模式,是实现这一突破的关键。SemiKong DRAFT v0.6的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。」
与之相关的业内人士,纷纷对SemiKong予以极高的赞许。
东京电子与人工智能联盟产品生命周期管理总监Atsushi Suzuki表示:「作为与人工智能联盟合作的行业专家,我相信SemiKong代表着人工智能在半导体制造领域的应用向前迈出了重要一步。」
东京电子公司的高级专家、半导体的早期提出者Daisuke Oku表示:「SemiKong是半导体开源人工智能一段激动人心旅程的开始。Aitomatic的创新方法,有潜力为我们的行业带来巨大飞跃。」
FPT Software首席人工智能官Phong Nguyen表示:「FPT Software很高兴能够成为其中的一部分,我们渴望探索该模型的潜在应用,特别是激发全球人工智能和半导体的融合。我们相信,我们的参与将巩固FPT Software作为全球半导体行业未来领跑者的地位。」
微信扫码关注该文公众号作者