Bendi新闻
>
一台好用的AI手机,需要哪些基本功?

一台好用的AI手机,需要哪些基本功?

7月前

2011年10月4日,苹果在位于库比蒂诺的总部迎来了一个重要时刻:因为这里正在举办新任CEO库克上任之后的第一场大型发布会:虽然这次没有发布外界期待已久的iPhone 5,但iPhone4s仍然让当时的不少媒体对其赞叹不已——原因就是其首次搭载的Siri所展示出的潜力,让不少人愿意相信:这就是智能手机的终极形态。


用户也被新奇的Siri所折服,iPhone4s发布三天后,销量就达到了400万台,创下史上iPhone销量最快达到这一数字的记录。彼时有人问刚刚上任的库克:iPhone4s的那个“S”代表着什么,库克的回答是:“S代表Siri”。


如今回看,Siri已经不再是手机人工智能的代表作,各种“人工智障”的回复已经在过去十年间成了各国网友的造梗来源,但它毫无疑问仍是无数人第一次接触到“人工智能”这个概念的契机,很好地完成了科普人工智能概念的使命:长按按键、呼出语音助理的动作已经深入人心,成为一代人的时代记忆。


十二年过去,虽然很多设想中的使用场景如今仍未到来,但在ChatGPT颠覆世界之后的2024年,我们看到几乎所有的手机端人工智能的形态,都仍然离不开语音这个重要的交互载体,甚至最初引领这场潮流的苹果,也选择在这一时刻放弃造车的“泰坦计划”、再次全力投入自研大模型之中。



但与其他手机厂商不同,苹果这一次选择了押注端侧大模型,Google也在去年发布的Gemini中特别提到了对Android系统的集成能力;开发者可以更方便的调用Gemini的端侧AI能力,进而做更多的第三方App适配。


在这一点上,OPPO与苹果、Google最新的战略在某种程度上达成了共识:在去年首发的安第斯大模型中,AndesGPT就主打端侧推理优化能力,在通话摘要、文生图领域首次强调了智能手机端侧算力的存在。


但对于普通智能手机用户来讲,为更好体验而非噱头买单,始终是消费电子的核心价值所在。即使市场普遍看好,让AI手机真正走向实用的谜底,仍然需要手机厂商来回答。


更好用的手机与系统


在ChatGPT发布之后,不到一年的时间内,手机AI成为了手机厂商追逐的“圣杯”:几乎所有主流手机厂商都开始跑步入场,但跃跃欲试的手机厂商们很快就发现:AI手机要做的,远不止是直接加一个大模型接口这样简单


按照彼时乔布斯收购Siri时的设想:未来语音助理将能帮iPhone用户完成大大小小的各种日常工作,从帮你定闹钟到帮你下外卖订单、打车,再到帮你规划日程安排。这些都将会是下一代智能手机的标配功能。


这些设想放在今天仍不落伍:如今用户之所以会对AI手机的概念感到兴奋,原因与当时“乔帮主”的设想无异“智能手机终于有机会,变得更智能”。在拍照用户眼里,AI手机将会是比现在更好用的新相机,随手一拍即可满足自己的各种风格化与内容生成需求;对办公族而言,AI手机意味着能将更多原本需要“专业团队”介入的工作,仅需一部手机即可搞定。


这些听起来似乎尚有些科幻,但这其中蕴含着的能量,已经足以成为下一次对智能手机的革命——正如彼时iPhone第一次发布会,台下观众在乔布斯重复了三遍之后才意识到,原来他将要发布的是一台能将iPod+手机+浏览器三个需求一次解决的神奇设备。



到了2024年,OPPO创始人陈明永也说出了“AI手机时代将成为继功能机、智能手机之后,手机行业的第三阶段”这样的判断。这一判断的基础源自于AI目前已经展现出的、打破App边界的潜力,一些原本需要同时开启办公软件、微信、Word文档以及浏览器的场景,如今只需要数句对话就可以搞定。


但这些设想中的场景,对于ChatGPT等只能依赖App存在于手机中的生成式AI服务来讲,最大的难点是无法触及手机系统底层能力。


在诸如修图、文件生成、通话内容实时翻译、生成摘要这些功能背后,无一不需要手机系统的深度支持。


举例来讲,过去一年AIGC领域最火爆的“出圈”案例,无疑是在小红书爆火的AI修图:包括ColorOS 14中整合的AI生成肖像照,或是快速消除照片背景中的路人这些非常实用的功能,以一种近乎降维打击的方式,让不少使用者第一次产生“AI震撼”,率先成为“从尝鲜到常用”的AI应用场景。按照OPPO发布的数据,OPPO相册中更新的AI消除功能,人均使用次数已经达到了每日15次之多。



这些应用场景虽然已经先一步改变了生活,但这些操作目前还停留在应用内的AI功能整合,可我们对AI手机的设想显然不止于此,如果AI手机能够仅凭一句话即可帮你从海量照片中准确找出你想要的那张呢,或者能够自动加工处理工作文档等更高度复杂的任务呢?


这些问题实际上是将难点带回了手机操作系统与硬件设计的部分:似乎只有在智能手机手机时代积累了足够硬件制造经验与手机操作系统设计经验的厂商,才能理出用户的实际需求;在足够简洁智能的操作之下,复杂的AI整合能力与云端算力缺一不可。


参考智能手机渐进式取代功能机的历史,眼下AI手机想要真正取代智能手机,最简单的回答是:从现有的功能入手


按照OPPO对AI手机的定义,AI手机想要比现在的手机提供更好用的体验,应该拥有以下四个特征:


  1. 能高效利用计算资源,满足生成式AI的计算需要;

  2. 能敏锐感知真实世界,了解用户与环境的复杂信息;

  3. 有强大的自我学习能力;

  4. 具备更充沛的创作能力,为用户提供灵感与知识支持。


在这个框架下,传统的App架构仅仅加入AI功能整合并不够:为了在AI手机中更好用,都需要进一步打通手机的交互架构,为用户提供更便捷的AI功能体验。手机中的AI才能变得更聪明,更懂你的日常生活,并根据此作出灵活的安排。



即使是现有的功能,想要真正做到好用并“拿来即用”,也需要与手机的AI能力做到更深层的衔接,才是AI手机在竞争中的核心竞争力。


AI手机的基本功


当前,AI手机发展的最大瓶颈仍然是云端计算的高昂成本:作为一款完全基于云端运行的生成式对话机器人,OpenAI每天仅支持运行ChatGPT的服务器与带宽成本就超过了十万美元,每个月的日常运行成本,足以训练GPT-3两到三次。


即便云端运行成本居高不下,但手机用户在日常使用手机时仍有大量琐碎、需要AI介入提升效率的场景;在这样的矛盾当前,苹果与OPPO同样选择的端侧大模型,似乎已经成为AI手机的“最优解”。


但当下,想要实现端侧更好的AI能力,手机厂商仍然需要与硬件芯片厂商紧密合作甚至自身也要有一定的芯片设计能力,才能根据大模型的运行条件定制芯片,来尽可能满足算力的需求,同时提高大模型的运行效率:这就是当前OPPO在Find X7系列上为了迎接AI而采取的策略。而OPPO Find X7已经是全球首个搭载端侧70亿参数语言模型的智能手机。


或许有些人会质疑:“智能手机性能过剩论”不是已经被提出好多年了吗,为什么如今的智能手机运行端侧AI大模型仍然缺乏足够的算力?


这实际上是陷入了对硬件发展与用户使用需求进化的误区:今天的智能手机已经获得了超越十年前的电脑数倍的性能,但用户对智能手机的期待也在变得水涨船高。即使是小到抠图这样的需求,只要涉及到云端处理,产生的带宽与服务器成本目前仍然难以大规模应用。


目前,OPPO基于从硬件到软件的优化,端侧在处理相关应用场景时,能够实现毫秒级的响应速度,同时也能做到根据用户操作微调图像的提取选择;而ColorOS 14新增的AI通话智能摘要,也依赖于端侧大模型的部署,才能实现在不影响用户正常使用手机通话的同时,精准识别当前通话内容生成摘要。小布助手的100+项AI能力,距离外界一开始设想的“完全体Siri”也只有一步之遥。



但端侧AI的应用同样充满挑战:在不同架构、性能的SoC芯片之间做好适配,同样也是在考验着手机品牌的AI优化能力,也是AI手机最重要的基本功。


目前,OPPO已经率先完成了高通/联发科双平台的适配工作,同时也在通过设立AI中心的方式,整合研发资源,加强人工智能的能力建设与研发。集合整个公司的力量,将人工智能视为智能手机下一个时代最重要的战略,并且愿意在此方面投入不惜任何限制的资源,用All in AI手机的方式,打造出更适合AI手机生长的科技环境。


眼下,OPPO拿出的这些手机AI功能,已经成功地激起用户尝鲜的兴趣,OPPO深耕多年的AI领域积累,终于使其在智能手机的下一次革命中,领先其他竞争对手一个身位,率先用各种足以让用户常用起来、难以离开的AI工具,建立起更牢固地用户黏性,


或许我们仍然离乔帮主设想中的“下一代智能手机”还有很远的距离,但随着诸如端云结合大模型、OPPO AI消除等功能的不断问世,AI手机也将逐渐与更强的硬件进行更多的整合,AI手机也将能提供更加垂直精确的用户服务,渗透进更多用户的日常生活中。


可以预见的是,在接下来1-2年内,AI手机将会更加快速地渗透包括拍照,文档/图片音频多模态内容处理,以及语音辅助等领域,并在这些能力上不断加码。


在这个过程中,手机始终会是最重要的载体,下一代AI手机将能利用更加强大的模型与算力生成各种图像/视频或复杂表格/PPT内容,让手机真正从工具,变身成为钢铁侠的“贾维斯”。


这场我们已经等了12年的革命,终于揭开帷幕。


-果壳商业科技传播部出品-

-广告-


微信扫码关注该文公众号作者

来源:果壳

相关新闻

多地推出首付“极限优惠”,警惕这一风险;你期待苹果的AI手机吗?唐顿移民问答| 英国雇主工签牌照的维护有哪些内容?需要从什么时候开始准备?搭建100000 个 H100 的集群,需要哪些芯片?AI 创业者,需要怎样的 AI 算力?关于 GPT-4o,还有哪些你需要知道的信息?iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?美国奥数国家队总教练罗博深教授线下讲座 | 不被 AI 替代,孩子需要哪些核心能力?AI时代需要什么样的教育?纪录片拍摄的核心阶段需要注意哪些问题?雷军班与巅班,AI时代需要什么样的教育?让人欲罢不能的品牌联名,需要哪些专业人才?职场上需要提防哪些人?好为人师的就是一种嫖过娼的人,手机里会留下哪些蛛丝马迹?让人欲罢不能的品牌联名背后,需要哪些专业人才?视觉错觉也能识别?被忽略的 Gemini 1.5 Flash 有哪些神奇表现?|AI 鲜测首批现场体验 AI Pin 的人:为什么我不换台手机呢?想要“杀死”智能手机的AI Pin凉了:3个月退货量比销量还高!人手一个智能助手的未来离我们还有多远?AI手机的杀手级应用,安卓手机会比iPhone提前出现?为什么我们的思辨课能让孩子两眼放光?报名课程,家长需要考虑哪些因素?| 双场直播「All in AI」的魅族,发布了一台标准的中端手机在和 AI 搜索对话的过程中,哪些回答引发你继续追问?印度外包、AI降本……地狱模式下的北美,还有哪些WLB天花板公司?「大力未必出奇迹」:AI算力集群背后的逻辑透露了哪些关键要素?AI浪潮下,国外的艺术设计学科正在发生哪些变化?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。