Bendi新闻
>
从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
5月前
让语言模型「轻装上阵」。
第一种策略是使用初等运算代替 MatMul,例如,在卷积神经网络 (CNN) 中,用有符号加法代替乘法; 第二种方法是使用二值或三值化量化,将 MatMul 值在累加之前要么翻转要么清零。比如脉冲神经网络 (SNN) 使用二值激活,而二值化网络 BNN 使用量化权重。
论文地址:https://arxiv.org/pdf/2406.02528 项目地址:https://github.com/ridgerchu/matmulfreellm 论文标题:Scalable MatMul-free Language Modeling
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
马斯克:已从所有系统中删除了CrowdStrike;FF董事会携贾跃亭致信,鼓励全体股东在公司年度股东大会上投票丨汽车交通日报直上云霄——从 1 亿到 10 亿的投资路径养出孩子好情绪从这10招做起!2024的读书计划,从这10本好书开始|第三届行读图书奖1月书榜从20亿数据中学习物理世界,基于Transformer的通用世界模型成功挑战视频生成美国科技公司创始人在庆祝活动中从高空摔下身亡大厂年终奖安排曝光,腾讯年终奖最高5个月月薪+;半导体大厂将10亿美元制造业务从中国撤出;字节百科名医网停运丨雷峰早报四个人的百年中国:他们从大陆走出,在流亡中见证时代惊险!4岁男童从5楼坠楼 摔在混凝土上…从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用从种族冲突到女性觉醒,在上影节锁定这部戛纳获奖佳作Visa、万事达卡用户注意!你有可能从1.97亿美元的和解金中分一杯羹她瞄准数智化医疗科研服务,从大厂基层员工成为10亿级规模临研平台创业者拜登推进10亿美元对以军援 从批准到交付或需数年危险!客机在JFK起飞后,紧急滑梯竟从飞机上脱落!就掉落在纽约!客机在JFK起飞后,紧急滑梯竟从飞机上脱落!就掉落在纽约!43岁建筑工人在波士顿市中心工作时 从脚手架上坠落身亡用户说 | 从“跑断腿”到“云上飞”:锐捷云桌面助力盐城市第三人民医院信息化运维“轻装上阵”别去市区和湖心岛,会变得不幸~周末遛娃10个好去处:避开人从众就算赢在王府井书店,发现一本好书,值得从政之人看看从万亿帝国到抓人退赃,中植系何以至此?好低调一大学:从QS100守门员上升10名…从现在起,别让自己输在基本功上年度书单丨用180场直播,从几千本书里,挑出了10场好书