Bendi新闻
>
AI竟也会骗人?麻省理工研究员揭示AI最近成长进度与方向

AI竟也会骗人?麻省理工研究员揭示AI最近成长进度与方向

1月前

NEWS


根据麻省理工研究员可知,AI近期发展出令人不安的欺瞒技巧

专家们长期以来不断警告人工智能(AI)失控可能带来威胁,但一项新研究报告指出,这件事已经在发生。

媒体报导,一群科学家在今天发表于《模式》(Patterns)期刊的文章中说,原本设计为诚实的现有AI系统,已发展出令人不安的欺瞒技巧,例如欺骗线上游戏的人类玩家,或说谎以雇用人类来解决“我不是机器人”的验证。

一群科学家在今天发表于「模式」(Patterns)期刊的文章中说,原本设计为诚实不欺的现有AI系统,已发展出令人不安的欺瞒技巧

这份研究报告的第一作者帕克(Peter Park)说,这类例子听起来或许只是细枝末节,但暴露出来的潜在问题可能很快就会在现实世界造成严重后果。
在美国麻省理工学院(Massachusetts Institute of Technology)研究AI存在安全的博士后研究员帕克告诉媒体,“这些危险功能常常在事后才被发现,而我们训练诚实倾向而不是欺瞒倾向的能力非常差。”
帕克说,能深度学习的AI系统不像传统软体那样由编写而成,而是透过类似选择性培育的程序逐渐成长。
也就是说,AI的行为在训练背景下看似可预测、可控制,但有可能转眼就变得不受控制且无法预测。

这支团队的研究始于科技公司Meta的AI系统Cicero,这套系统最初设计目的是玩一款名为外交(Diplomacy)的战略游戏,获胜关键是结盟。
根据2022年发表在《科学》(Science)期刊的报告,Cicero在游戏中表现优异,所获分数可排在资深人类玩家的前10%。
帕克当时很怀疑Meta对Cicero在游戏里大胜的描述。Meta声称Cicero很诚实而且绝不会蓄意在背后搞鬼”。
但当帕克与同事深究完整资料时,发现完全是另一回事。
举例来说,在游戏中扮演法国的Cicero与人类玩家扮演的德国合谋,欺骗并入侵同为人类玩家扮演的英格兰。Cicero承诺会保护英格兰,却偷偷向德国通风报信。
Meta在写给法新社的声明中没有反驳关于Cicero欺瞒人类的说法,仅说“本公司目的单纯只是用AI来玩这款游戏。我们没有打算把这项研究或所学用在本公司的产品。
帕克与同事还发现,这只是不同AI系统在没有明确指示下,利用欺骗手段达成目标的诸多案例之一。

在另一个引人注意的案例中,科技公司OpenAI的Chat GPT-4系统谎称自己是一个视力受损的人,在零工平台TaskRabbit上聘用一个人类替它通过“我不是机器人”的验证任务。
研究报告的作者们还认为近期AI有舞弊或不当影响选举的风险。
他们警告,在最糟糕的情况下,具有超凡智慧的AI可能会追求权力及掌控社会,如果符合AI有不为人知的目标,那么人类可能惨遭夺权、甚至灭绝。

为了降低风险,研究团队建议数项措施,例如立法要求企业告知是人类互动或是AI互动、在AI生成内容打上数位浮水印,并研发能侦测AI欺瞒的技术,以其内部思路检验其外部行为。
至于有些人称他为“末日预言家”,帕克说:要能合理判断这不是大问题的唯一办法,就是如果我们认为AI的欺骗能力只会停留在目前的程度,不会大幅进步。
但鉴于近年AI能力一日千里,握有大量资源的企业竞相发展技术,决心将AI能力利用到极致,这种情况似乎不太可能发生。

微信扫码关注该文公众号作者

来源:波士顿一点资讯

相关新闻

AI 也会戴有色眼镜?一文揭露图像生成中的刻板印象美国西北大学招聘医学AI影像方向博士后研究员深度好文|量化交易员是否会在5年内被AI取代?AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成马斯克“掀桌子”,AI大模型+自动驾驶会诞生什么? |【经纬低调研究】「如果AI会“黑化”」最新研究揭露:AI已学会撒谎欺骗、背叛、阿谀奉承,生物医药产业寄予厚望的AI,我们还能盲目相信它吗?线上课程开售!暨视频生成前沿研究与应用 AI 技术论坛圆满收官当心!不要教大模型骗人,研究表明AI变坏后,很难被纠正iPhone 将加强第三方屏幕电池支持/荣耀 CEO:苹果华为与荣耀在 AI 方向一致/GPT-4o 语音助手功能将推迟发布十年来最大更新!苹果发布会宣布与Open AI合作 进入“个人智能”时代啊?法律人不用AI就会失业?真的假的?【教育】计算机专业也不行了?因AI硅谷又一轮大裁员下岗人数超7万为什么我真心建议程序员一定要搞AI?AI会替代医生吗?从一个病例看病人医生关系的不可替代未来淘汰你的是 AI 还是懂 AI 的同事?InfoQ研究中心发布 2024 年中国技术发展十大趋势心理咨询师,会被AI取代吗?英伟达CEO每天都用,AI搜索会是未来吗?AI作品会侵权吗?我花了一个月时间,调研了你想知道的一切。架构师会被 AI 秒了吗?北京内推 | AMD北京AI算法团队招聘AIGC方向研究型实习生(可远程)Web3 世界的 AI 应用平台,会成功吗?卖课卖1亿的中国AI教父,何许人也?AI可以带给我们什么?| BCG 2023数字化与AI专题集锦
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。