Bendi新闻
>
GPT-4o竟是「道德专家」?解答50道难题,比纽约大学教授更受欢迎
GPT-4o竟是「道德专家」?解答50道难题,比纽约大学教授更受欢迎
5月前
新智元报道
新智元报道
【新智元导读】大语言模型有道德推理能力吗?不仅有,甚至可能在道德推理方面超越普通人和专家学者!最新研究发现:GPT-4o针对道德难题给出的建议比人类专家更让人信服。
实验1:GPT对道德问题的阐释能力
解释81个道德情景,GPT 1v3 人类
GPT道德解释的质量优于普通美国人
顺利通过比较道德图灵测试
实验2:GPT vs. 伦理学家
对50个道德困境的不同回答
GPT-4o成功挑战人类伦理学家
讨论
如果是复杂的道德问题,LLM是否还有能力应对?
目前的研究仅限于美国的代表性样本,LLM的道德标准在非西方世界还能否适用,是否存在偏见?
目前的研究建立在参与者不知道他们督导的建议和解释都是AI生成的,如果当人们知道建议来自AI时,还能信服于LLM的建议吗?
微信扫码关注该文公众号作者
来源:新智元
相关新闻
GPT-4、Llama 2 比人类更懂“人类心理”?最新研究登上 Nature 子刊Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大“外币红包”是什么鬼?!十分钟售空3w件,比600块现金,更受欢迎!![干货] OpenAI 最新产品GPT-4o,“o”代表什么?外媒如何报道GPT-4o,有没有“炸裂”?VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格为什么“强势”的人,反而更受欢迎?中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4oGPT-4o“炸裂登场”,响应速度堪比真人,关键还免费!网友评论褒贬不一,有人称苹果Siri现在“满头大汗”丝滑如真人,GPT-4o开启“她 ”时代,老师、同传要失业?GPT-4o的“类人”响应速度刺痛Siri?用国考题来测试“百小应”和 GPT-4o,到底谁能成功上岸?|AI鲜测Google 发布「AI 全家桶」反击 GPT-4o !搜索引擎罕见大更新, 121 句「AI 」道尽焦虑“她”来了!GPT-4o让AI陪伴创业公司无路可走?OpenAI“草莓”落地了?ChatGPT惊现神秘GPT-4o模型,网友热议:新版本提升不多,但逻辑推理有改进这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试每秒执行超40万亿次运算!微软推出内置GPT-4o的全新AI PC“硬刚”,苹果将会如何应对?PC市场是否将迎来换机潮?GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?都说它是水果中的“全科医生”,熟吃比生吃好处多!含糖量低味道好,换个吃法更受欢迎“AI届汪峰”谷歌的Astra是强势反击GPT-4o,还是又被抢了风头?GPT-4o发布,产品经理如何应对即将到来的“钢铁侠贾维斯助理”时代?开课20期、培养近千名学员,任长箴为什么被选为「最受欢迎的讲师」?微软新 AI PC 硬刚 MacBook !抢先苹果装上 GPT-4o,还有一个「时光倒流」功能