Bendi新闻
>
「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
4月前
新智元报道
新智元报道
【新智元导读】13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
虽然13.8看起来更大,因为它小数点后的数字更少,但13.11实际上更大。这是因为13.8相当于13.80,而13.80小于13.11。
Python中用9.11减去9.9的结果是-0.79。这一偏差是由于Python中处理浮点运算的方式造成的,这种方式可能导致小的精度误差。实际的预期结果应该是0.21。
LLM全军覆没
9.11=9 +1/10+1/100=9.11
9.9=9+9/10=9.90
我们可以看到,9.11比9.90大0.01(百分之一)。
prompt的影响,真的很大
为什么会这样?剖开LLM大脑
微信扫码关注该文公众号作者
来源:新智元
相关新闻
“河南男女妲己”事件冲上热搜!举报者身份曝光后,全网愤怒:伤风败俗的到底是谁?新型“婚姻关系”冲上热搜:结婚究竟有什么好处?“微软蓝屏”冲上热搜,全球大翻车,到底咋回事?11岁甜馨「霸气护妈」冲上热搜,她怎么变这样了?“985学霸留学花30万,回国工资5500元”冲上热搜:到底值不值?安徽“水泥封尸案”突然冲上热搜!真相大白后,所有人沉默了“氯雷他定”冲上热搜!网友懵了:我的救命药怎么了?医生提醒→“大地磁暴预警”冲上热搜,它会威胁卫星吗?冲上热搜!“单价跌破10元”!价格真的跳水了?美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出「负分男友」成功挽回“河南男女妲己”事件冲上热搜!后续来了,全网愤怒:伤风败俗的到底是谁?“人口出生率今年或迎小阳春”冲上热搜,2024年有望出现人口总数反弹拐点?“爆买”日本的中国买家又冲上热搜?日媒报道,他们从奢侈品店买到售楼处……冲上热搜!价格腰斩了,“还会继续降”!有网友直呼:“原来论颗吃,现在论盆买!”冲上热搜!凯特王妃现身辟谣“中刀死亡”传闻!又被扒出是替身?威廉“小三”炫富全靠中国?凭颜值上热搜!顶级精英男娶金融女,他们才是“智性恋”的天花板?她美到一部戏火了12年,却突然“丑”上热搜?这些毁脸习惯不注意,养生再勤也白搭“北京暴雨”冲上热搜!早高峰道路严重拥堵,颐和园、香山公园等临时闭园凭一盆“麻辣烫”冲上热搜!这座隐藏在西北的宝藏之城,实在太猛~江疏影“爆仓”上热搜?最新回应37岁嫁百亿富豪,近照曝光却“丑”上热搜!当妈的狠狠理解:原来嫁豪门也是这状态“天生坏种?!”热搜上的四川“超雄”孕妇引全网关注, 背后是赤裸裸的人性……热搜上的“小孩帝国”曝光,看得我脊背发凉上海离谱的“街头讨饭”一幕冲上热搜:中国年轻人,越来越紧了