苹果正大举进军人工智能。
北京时间6月11日凌晨1点,苹果2024年全球开发者大会(WWDC)正式开幕。按照往年惯例,每年的WWDC大会,苹果都会将重心放在对新版系统的介绍上,本次也不例外,苹果发布了包括iOS 18、iPadOS18、macOS15以及visionOS2等在内的一系列软件更新。
在这其中,生成式AI功能无疑是最大的亮点。会上,苹果围绕AI功能宣布了“苹果智能”(Apple Intelligence),该AI系统适用于iPhone、iPad和Mac等操作系统,它可以优先置顶推送、校对一些文本、生成图片等。与此同时,AI指令也可以跨应用运行(例如邮件、地图、日历和存储在本地的个人信息等)。
直播截图
苹果方面举例称:“假设我的一个会议被重新安排在下午晚些时候,我担心这会耽误我准时去观看女儿的表演,那么苹果智能系统就能处理相关数据,帮助我或者提醒我,我的女儿是谁、她几天前发来的表演细节、我开会的时间和地点,以及从我的办公室到剧院的预计交通状况。”
此外,在苹果智能的加持下,苹果语音助手Siri的表现显著增强,也是此次WWDC的一大看点。并且,用户在使用Siri和一系列应用期间,可以要求系统调用ChatGPT来进行回应。对此,“ChatGPT之父”——山姆·阿尔特曼(Sam Altman)在社交媒体上表示:“非常高兴能与苹果合作,ChatGPT今年晚些时候将整合到苹果设备中!”
不过,苹果投资者似乎对此次发布会反应平淡,北京时间6月11日凌晨,苹果股价收跌1.91%。上周,英伟达市值一举突破3万亿美元,正式超过苹果,成为美股第二大市值科技巨头。但这不只是两者股价的比较,更是AI强劲成长势头与消费电子面临的创新挑战的对比。
苹果AI新篇章:Siri迎来革新,与OpenAI构建合作
发布会开场后不久,苹果率先介绍了对今年2月发售的头显产品Vision Pro进行的首次重大软件更新,即visionOS 2,新系统能带来更沉浸式的使用体验。例如,在照片APP中,用户可以将现有照片转换为空间照片;在visionOS 2的加持下,Vision Pro上Mac虚拟显示器的显示分辨率和尺寸更高,支持超大画面效果,能让用户仿佛身处私人影院。此外,针对开发者,苹果此次推出多项全新的API(应用程序编程接口)和框架,能更方便地制作特色应用。
除了推出新的Vision Pro软件版本,苹果还公布了Vision Pro的全球发售计划。其中,将于6月28日将Vision Pro引入中国、日本和新加坡,其次是澳大利亚、加拿大、法国、德国和英国,这5大地区的发售日期为7月12日,届时苹果Vision Pro将拥有更大的客户群。记者查询苹果国内官网注意到,Vision Pro 256 GB的售价为29999元起,该价格高于美国地区售价。
直播截图
不过,本次大会上最令人关注的是苹果在AI方面的进展。据苹果方面介绍,从相机、相册、日历、备忘录,到浏览器、电子邮件,苹果系统中几乎所有原生应用都将被AI赋能。
6月10日,知名苹果分析师郭明錤在社交媒体上谈及了苹果的人工智能战略。他认为,本次WWDC结束后,苹果将不再被视为AI行业的落后者。AI将在苹果主要的应用中无所不在,苹果的用户界面设计优势将充分展现,Siri的改善是最大卖点之一。
过去,对大多数iPhone用户来说,Siri功能有限,人们多数时候只会用Siri来设置闹钟或者在Spotify上播放歌曲,而不是将其看作一个真正的数字助手,但如今,生成式人工智能版本的Siri得到了重要的更新。
据悉,通过苹果智能带来的新设计和功能,Siri应答更自然、更切题,也更契合用户的个人情况。此外,用户还可以与Siri进行文字交流,在文本和语音之间随心切换,用最符合当时需要的方式与Siri沟通。此外,用户在使用Siri和一系列应用期间,可以要求系统调用ChatGPT来进行回应。
此前,苹果公司被曝出正与OpenAI敲定一项协议,今年将后者的部分技术引入iPhone。借此,苹果将能提供由ChatGPT支持的“聊天机器人”,并将其作为iOS 18中人工智能功能的一部分。
谈及双方的合作,TrendForce集邦咨询分析师曾伯楷对记者表示,由于AI供应链既广且长,在术业有专攻的背景下,产业大厂通过更多的合作与结盟以强化自身AI服务已是目前趋势。“事实上,苹果针对AI领域有开发Ajax LLM框架,也持续研发ReALM(Reference Resolution As Language Modeling)技术,该模型的参数规模较小,使其不需将数据回传至云端进行运算,除了不会产生延迟外,也提升个人信息的隐私和保密性,对于其语音助理Siri的性能提升极具潜力。而在聊天机器人与实时协助方面,OpenAI已具备先行者优势,且模型与技术相对成熟。不过,苹果身为产业大厂,在产品服务相对核心的部分会需要有高度的掌控权,因此,推论苹果在后续AI的发展上会保持较先前更为开放的状态与各家厂商合作,共同打造AI生态圈,但在核心的部分则会采用自家技术。”
不过,在郭明錤看来,苹果与OpenAI之类公司的合作可能主要停留在AI Wrapper(包装)层面。“双方合作推出的AI服务/功能重点在于,是否具备‘独特且可持续的竞争优势’,这就意味着与苹果合作的厂商,必须在某种形式上与苹果是独家合作,而且苹果也能部分参与控制合作厂商大语言模型的研发进度,以确保服务品质与未来升级。否则,任何合作所推出的AI服务/功能,都很容易被竞争对手模仿,优势也无法持续。但对类似OpenAI这样的领导厂商,上述合作条件是很难接受的。”
他还认为,长期来看,正向看待苹果对AI的投资,有助于硬件换机潮与服务业务,但短期内可能不容易看到AI对营收与利润有显著帮助。
端侧AI落地面临多重挑战
自2022年底ChatGPT掀起AI大模型浪潮以来,生成式AI正以前所未有的速度进化,走进各种终端,影响各行各业。有人喊出2024年是AI手机元年的口号,头部手机厂商也纷纷高喊“All in AI”。在近日举行的阿里云深圳AI峰会上,北科瑞声创始人、国家重大人才计划特聘专家刘轶指出,电脑、手机、手表等终端是离用户最近的信息入口,大模型与终端的结合将加快AI技术普及。
事实上,相比苹果,目前安卓阵营厂商在AI方面的布局已经进入近乎白热化的阶段。其中,OPPO推出安第斯大模型,参数量从70亿到1000亿,可以部署在端侧和云端;小米MiLM大模型参数从13亿到60亿,主要部署在端侧;vivo蓝心大模型的参数量从10亿到1750亿,可以部署在端侧和云端,在模型训练方面,vivo基于阿里云训练的蓝心大模型,千卡大模型预训练性能接近LLaMA水平,且蓝心大模型已对其手机的AI影像、智能助理、图文创作等场景进行了优化。
不过,大模型的出现并持续迭代,也为端侧落地带来新的变量和挑战。在前述阿里云深圳AI峰会上,OPPO AI技术战略规划总监陈晓春表示,一方面是时延,例如在海外手机漫游场景下如何完成端侧的实时翻译能力;其次是高隐私,端侧的意图推理具备一定隐私属性,那么,(挑战在于)在端云协同之间如何完善安全保障措施;第三,如何平衡功耗和成本。“模型在端侧运行不需要那么大,那么遇到多种感知和大模型结合的情况下,很多小尺寸甚至传统方案就要引用进来。”
此外,随着AI功能的大量引入,对设备性能的要求也将提高。据苹果方面介绍,Apple Intelligence(苹果智能)测试版将于今年秋季作为iOS18、iPadOS 18和macOS Sequoia的内置功能推出,仅支持iPhone 15 Pro、iPhone 15 Pro Max以及搭载M1或后续芯片的iPad和Mac设备。
虽然AI手机对硬件配置要求颇高,但从当前AI落地的应用方面来看,无论是苹果还是安卓手机厂商,在AI应用场景方面仍主要集中在文档总结、图片处理、信息检索、文本翻译等,功能趋于同质化。
曾伯楷认为,AI消除、整理等的确已趋向基本功能,然而AI仍能凭借提升芯片效能、提升相机性能、成像增强、人脸辨识、游戏体验等部分强化手机(功能),进而优化消费者的使用体验。若以应用端来看,如何让虚拟助理更加智能化仍是厂商目前努力耕耘的领域。
“具体来看,AI在手机的应用,就短期而言,为生成式AI被整合至操作系统与语音助理,强化其理解与回答的能力;在中期部分,整个产业会完成前期部署并积极寻找杀手级应用;长期而言,当杀手级应用正式出现后,预期此时相关应用将百花齐放,品牌厂为了使杀手级的AI应用得以在装置端上运行得更顺畅,将积极实现AI on Edge的愿景。因此,对厂商来说,即便现阶段的应用类似,但并非同质化的红海市场,各家模型的精准程度、数据算力、响应质量、接口操作等都有所不同,这些将成为厂商竞争力的分水岭,同时也是其未来开发杀手级应用的基础。”曾伯楷说。
值得关注的是,对广大中国用户来说,今年秋季苹果新机内置的iOS 18的AI功能将以何种形式呈现,仍有待观察(与类似OpenAI的企业合作开发的AI服务/功能在某些市场或有无法使用的风险)。作为参考,此前,三星在发布AI手机Galaxy S24时,选择国内的百度和美图作为本地化的AI合作伙伴。