Bendi新闻
>
生成式AI手机长什么样?

生成式AI手机长什么样?

11月前
实习记者:徐    豫
编辑:吴洋

Key Points


Galaxy S24是全球首款生成式AI手机,搭载Gemini Nano;


和微软的Copilot类似,Galaxy S24的AI功能也是操作系统级的;


Galaxy S24的Home键成为生成式AI的一大功能入口。


所有硬件厂商都在思考如何为生成式AI设计一款硬件的时候,三星先将大模型——Google的Gemini Nano放进了最新款手机里。
北京时间1月18日凌晨,三星在美国加州举办发布会,发布全球首款生成式AI手机Galaxy S24。这款手机可以在用户打电话的过程中完成实时翻译,还能以「生成」的方式修图,同时,它有一个实体AI键——Home键,背后的支持模型就是Gemini。

发布会主题叫「开启移动AI的新时代」,意思是生成式AI来到手机了。

整场发布会一小时十分钟,Google平台与生态系统高级副总裁Hiroshi Lockheimer的演讲就持续了约20分钟,中途打开直播的人可能会误以为这是Google的发布会。不过这种「结盟」现象你应该已经见过了,去年11月7日的OpenAI开发者大会上,微软CEO纳德拉同样出现并与OpenAI CEO Sam Altman聊了会儿天。
三星手机如今在中国已经没什么存在感了,其市场份额跌到了1%左右,但是,让大模型在手机这样的小型设备中运行,Galaxy S24抢到了业界的里程碑。此前,大模型对算力的要求使其只能部署在算力庞大的云端。
通过三星Galaxy S24,Google展示了让大模型跑在手机上会是什么样,不过它展现出来的功能似乎不多。

通话实时翻译

相较于市面上需要口头或手动录入谈话内容的翻译软件,三星Galaxy S24能够在通话时提供实时双向语音翻译,并且可同步在手机界面上显示原文和译文,即便对方使用的不是Galaxy S24。

比如,当英语使用者Heejin想约西班牙语使用者Esmeralda共进晚餐,Heejin用英文输入并发送「明晚7点有空去吃晚餐吗」,西班牙语翻译和英语原文会同步出现在输入框和对话框;Esmeralda直接用西班牙语回答「7点正合适,我已经迫不及待想和你见面了」,其英文翻译也会实时展现给Heejin。

通话过程中不用操作手机,只需要在一开始设置好通话语言就可以。

目前,该「24小时私人翻译」可以任意转换13种常用语言,覆盖英语、汉语、西班牙语、韩语、法语、德语、印地语、意大利语、日语、波兰语、葡萄牙语、泰语和越南语。

Circle to Search

聊天、浏览社交媒体,甚至查看PPT文档时,只要你对屏幕上的任何内容有进一步了解的意愿,都可以伸出手指、圈中它,按下Home键——相当于一键召唤Google,无需切换应用程序,Galaxy S24能即时给出相应的搜索结果。
比如你正在浏览一张身着橙色高筒靴的模特的照片,好奇模特穿的靴子的品牌或价格。过去,你需要截屏、退出当前应用、切换至购物App按图片检索,才能获得相应结果。Galaxy S24的「Circle to Search」功能不需要切换任何应用程序。

图片、网页、屏幕、聊天过程中……一切皆可先圈住(Circle),再用生成式AI搜索。

三星Galaxy S24的实时翻译、「Circle to Search」功能都基于Google去年12月发布的Gemini Nano大模型。Gemini系列模型包括Nano、Pro、Ultra 3个版本,Gemini Nano是其中最小的版本,适用于移动设备,比如手机。Gemini Pro适合个人电脑,而Ultra版本的Gemini须部署在有庞大算力的云端数据中心。

生成式修图

「Circle」这个动作还被用于三星Galaxy S24系列的AI图片编辑。
发布会现场演示的操作中,一位全身篮球行头的男子原地起跳准备扣篮,演示者「Circle」该男子后,男子就在图像中被「抠出来」,只需移动抠图,男子在图像中的位置就从距离篮框很远的地方被移动至篮框旁边,而整张图的背景可以被AI生成的像素即时补全。并且,Galaxy S24可以在AI的帮助下为视频插入帧,从而将常规视频转换为慢动作。

人物抠出后,背景是重新生成的。

这些功能与Adobe去年5月在Photoshop中推出的「生成式填色」(Generative Fill)功能相似,只不过Galaxy S24的AI修图尚未提供「根据文字描述生成图像」功能,而Photoshop的「生成式填色」允许用户选中图像中的某个区域,用文字描述想要新增或取代的物件、背景,其背后AI就能为相应区域生成用户描述的物体或背景。

指环来了

在发布会的尾声时,三星卖了个关子,透露公司正在研发一款名为「Galaxy Ring」的智能戒指。三星将其视为「功能强大且易于使用」的健康和保健设备,但尚未公开上市时间、价格等消息。
2023年,三星申请了一项智能环专利,该工具预期提供心电图和智能家居控制功能。按计划,Samsung Health将与Galaxy生态系统合作,于今年晚些时候推出全新的智能健康服务,参考指标建立在对用户的睡眠、活动、静息心率和心率变异性的测量之上。

指环预计今年发布。

Galaxy S24系列共有3款,分别是Galaxy S24、Galaxy S24 Plus和Galaxy S24 Ultra,售价为799.99美元、999.99美元和1299.99美元,即日起接受预订。
在手机行业,三星全球销量冠军的位置刚刚被苹果拿走。IDC的数据显示,2023年苹果手机出货量2.346亿部,市场份额超过20%;三星出货量2.266亿部,市场份额为19.4%。
在生成式AI领域,Google正在努力追赶OpenAI的模型水平。进入更多端侧设备、成为系统级AI是Google的核心策略之一。三星Galaxy S24可以被视作Google端侧AI战略的样板,此外,Google旗下自有手机品牌Pixel也将于1月31日起上线类似的生成式AI功能。
目前,OpenAI还没有针对手机这样的小型设备推出可以在本地运行的模型,其GPT-4模型进入的最小端侧设备是个人电脑,比如Copilot,它由OpenAI的投资者微软基于GPT-4推出。三星发布Galaxy S24前半个月,微软刚刚宣布要在搭载Windows系统的电脑上安装一个名为「Copilot」的实体按键,位置就在右侧Alt键的右边。有了该按键,用户同样可以一键唤出AI——只不过响应的大模型不是Gemini,而是GPT-4。
Google大模型的目标是安卓系的移动终端,而微软的目标是Windows系的桌面终端。


-END-



识别下图二维码,

即可购买《第一财经》杂志2024年1月刊


微信扫码关注该文公众号作者

来源:第一财经YiMagazine

相关新闻

中国式branding长什么样?小红书先交卷了开创了生成式 AI 新时代的他们,正在做什么?20%的杨幂+80%的泰勒长什么样?小红书风格化AI来了,可兼容SD和ControlNet澳大利亚3-5年的商务签证长什么样?怎么申请?鼓励DIY, 或用老牌持牌机构靠谱服务刚刚落成的塔吉克议会大楼长什么样?想毁掉自己的人,都长什么样?年薪80万的数据分析师简历长什么样?台湾秘密逃生隧道,长什么样?​与比尔盖茨家为邻 华盛顿湖畔千万级豪宅长什么样?一次连贯的品牌升级长什么样?百事可乐用宇宙心跳写下满分答案LIFE前瞻 | 面向未来的教育长什么样?快来一场头脑风暴吧!一百多岁的天价古董美容品长什么样?突然爆红的上海100.9万元/m²的房子,长什么样?有人专门赶来拍照打卡世界各地的清明节,究竟长什么样?旧金山湾区的诗与远方---硅谷精英的后花园房子长什么样?【探索】原来上海交通的路名牌经历了四代演变!它们分别长什么样?花50万设计的鼠标,长什么样?又来了?!生成式AI在文娱界到底能掀起多大波澜?ChatGPT王位难守?全球TOP100生成式AI应用重磅刷新:40%首次上榜,AI 陪伴来势凶猛CES2024 深度观察:智能戒指、脑电波传感、生成式AI的新时代? |【经纬低调分享】杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA终端智能是什么?手机将变成超级AI助手?AI时代需要什么样的教育?你想用AI创作什么样的影视作品?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。