2026年6月9日星期二

iPhone 一夜变成 AiPhone,但 AI 手机的未来不在手机里

国行用户还是没有 Apple 智能。

更新到 iOS 27 的开发者测试版本后,对国行 iPhone 来说,最大的变化是可以设置调休闹钟,外版用户则迎来了一个独立的 Siri App。

这两年,我们一直在吐槽国行 iPhone 没有 AI。

但如果今天真的要买一台手机,AI 恐怕还不是大多数人的首要考虑因素。

▲虽然都在说 AI 手机,但大多数手机的卖点还是在相机和电池等方面,包括苹果在 17 Pro 上的主要亮点也是后置三摄

大家会比较影像、续航、性能、外观,甚至颜色,却很少有人因为「这个 AI 特别强」而下单。

一个有点矛盾的现实是,AI 手机已经喊了两年,但什么是 AI 手机,行业和用户都还没有形成共识。

就在这个背景下,苹果这次把新版 Siri 推到了系统层。

它有了独立入口,也支持连续对话、文件上传和上下文理解。

从功能看,这些能力并不新鲜,很多用户会觉得它只是补上了 ChatGPT 两三年前就已经实现的部分。

真正值得关注的是,苹果终于给出了自己对于 AI 手机的答案。

目前,对 AI 手机而言,行业里目前存在两种理解。

一方面是手机变聪明了,从智能到人工智能。相机能够识别物体,照片能自动扩图、修改视角,搜索框里换了大模型驱动的 AI 引擎,快捷指令用简单的自然语言就能搭出来。

这些改进确实让体验变得更好,可是我们跟手机的关系似乎并没改变。这一路线增强的是功能,而第二种路线改变的是交互。

我们不用自己的操作,对着手机把想做的事情说出来,系统级的助手,会像 Codex 一样,自动启用 Computer(Phone) Use、Chrome(App) Use 的能力, 调度不同的应用,把事情做好。

过去两年我们一直在讨论,也是所有厂商都难做好的,全在第二件事上。

四种 AI 手机

问题在于,当 AI 真正开始替用户操作手机,它立刻会碰到权限、应用生态和责任归属的问题。

谁有资格代替用户执行操作?App 愿不愿意开放能力?出了问题谁负责?

于是,不同厂商开始走向完全不同的路线。

「被限制」的豆包手机

豆包手机刚出来那会儿,确实收获了很多关注。它通过系统权限拿到的能力,可以直接模拟用户点击。一个需要 50 步点击的任务,大概能跑出八成的成功率,能力边界是当时市面上,所有打着 AI 手机旗号的产品中最宽的一个。

但它也最容易踩雷,纯粹的依靠模拟点击,一边是效率的问题,更严重的是合规的问题。

效率上,通过识屏的方式找到应用的不同按钮,然后再操作系统进行点击,这种流程被拉得极长。即便可以预先录入一套常见应用的交互方式,但 App 一旦更新,界面重新排布,就又需要再来一次,还可能失效,需要重新学习训练。

合规上,豆包手机在去年年底被微信、支付宝集体风控。豆包手机也发布声明回复,所有的权限都在系统允许的范围内操作,后续也主动收缩了操作范围。

应用需要确保自己的用户信息安全,无可厚非。现在就连 Codex 上的 Computer Use,都无法正常操作电脑版微信,一旦检测到非人类的点击操作,微信就会自动退出。

豆包手机的正式版还在打磨,路线也正在从纯视觉操作向接口协同演进。

国民级的超级应用选择 AI,会成为手机的重要部分

微信,就在 WWDC 前,联合五大手机厂商推出了 A2A(Agent-to-Agent)助手能力。

手机系统 AI 助手解析出用户意图后,通过加密、受控的协议向微信发起「呼叫」,微信在自己的沙盒里原生执行「发消息、打电话」这两个基础动作,系统 AI 碰不到任何聊天记录。

这更像是一种停火协议,手机厂商承认,不能绕过超级 App 的边界;微信也承认,系统级 AI 助手正在成为新的用户入口,完全堵住并不现实。

更有意思的是,微信同一天还面向小程序开发者开放了微信 AI 生态接入指引。

开发者可以授权微信 AI 接入自己的小程序,其中有两种模式,「自动模式」让平台读取源码、分析页面、直接操作;「开发模式」让开发者自主声明能力,经审核后被微信 AI 调用。

两种模式可以同时开启。微信现有超过 400 万个小程序,如果大量接入,微信 AI 调度的能力范围将远超「发消息打电话」,点外卖、打车、订票、买东西,一整个小程序生态都有机会实现。

把这两件事放在一起看,微信的策略就很清楚了,手机厂商想把微信变成自己助手能调度的一个 App,微信想把自己变成一个更大的 Agent 平台。

双方都在开放能力,但都希望把入口掌握在自己手里。

XX Intelligence 和 XX 助手

再看 Android 和 iPhone,方向其实一致:AI 不再是一个 App,而是在系统里流动。

Google 在 I/O 之前的 Android Show 上直接说,Android 正在从 operating system 变成 intelligence system。

Google 的优势很明显:它既有 Android,也有 Gemini,还有搜索、Gmail、Calendar、Chrome、Google Play 和车机、手表、眼镜。它完全可以做一个跨屏的 Gemini 操作层。

从这个角度看,Google 争夺的已经不仅是一部手机上的 AI 入口,Gemini 承担的是整个 Google 生态的交互层。

当用户发出一个需求,调用的可能是搜索、地图、邮箱、浏览器,也可能是电脑、手机、车机和眼镜上的能力。

AI 手机只是这张网络里的一个节点。

Siri AI 不会是一个「ChatGPT 式」的 App

苹果选了一条更慢的路。

Siri AI 的新能力强烈依靠 App Intents。开发者要把自己的内容和动作用结构化方式交给系统,比如「我能创建一笔费用」、「我能预约会议」、「我能编辑这张图」。Siri 再用自然语言理解用户意图,调用这些动作。

苹果还把 App 内容接进 Spotlight 的语义索引,让 Siri 能理解手机里的个人上下文。这套逻辑和微信小程序的「开发模式」很像,开发者声明能力,平台负责调度。

区别是,微信只在小程序生态里做,苹果要把它放到整个 iOS App 生态里。

▲ Craig 在 WWDC 主题演讲结束后的媒体交流会上谈到 Siri AI 时说,「我们认为 Siri 不是一个独立的聊天机器人,一个你去那里闲聊的,不整合的地方,Siri 是一个集成的、对话式的工具。」

苹果的底层模型也补了一大块。第三代 Apple Foundation Models 包括端侧模型、私有云模型和图像模型,其中端侧 AFM 3 Core 是 30 亿参数,AFM 3 Core Advanced 是 200 亿参数的稀疏模型,按任务激活 10 亿到 40 亿参数。

更复杂的任务交给 Private Cloud Compute。苹果也提到新一代 AFM 是和 Google Gemini 合作定制的,最重的云端模型还用到了 Google Cloud 上的 NVIDIA GPU。

▲ 苹果昨天发布了第三代基础大模型|https://ift.tt/g5EXFRe

苹果终于把过去两年欠下的 AI 账补到了系统层。

它的优势是整合最深,Siri、Spotlight、App Intents、照片、信息、Safari、快捷指令,这些东西都在系统里。一次系统升级,就能改变 iPhone 用户「找东西、办事情」的默认路径。

但它的限制也很清楚,App Intents 取决于开发者适配多少,Siri AI 真实可用性还要等 beta 之后验证。

国行用户还要面对地区限制,而部分端侧大模型的能力,支持的手机产品也只有 iPhone Air 和 iPhone 17 Pro 系列。

AI 手机的天花板,不在手机里

今天各家争的,还是手机和 App 之间那一层:谁能替用户办事,谁批准,谁执行,谁担责。

从豆包、微信、Google 到苹果,虽然它们给出的答案并不相同,有的选择模拟操作,有的选择开放协议,有的选择统一调度层,也有的选择让开发者声明能力。

共同点在于,AI 手机正在从「回答问题」走向「完成任务」。

但再往后看,AI 手机的天花板可能不在手机里。

端侧模型正在变小,推理芯片正在变强。1.58-bit、2-bit 这类低比特量化不断降低模型占用,手机上能跑的模型会越来越大。现在很多端侧能力还只是修图、听写、摘要和简单问答,几年后,手机本地模型处理个人上下文、隐私任务、轻量代理工作,会变得更自然。

更大的变化,是手机会变成调度算力的入口。

我们不一定要在手机上完成所有工作,但可以用手机发起任务:让电脑里的 Codex 写代码,让云端的 Claude 做研究,让家里的设备准备环境,让车机继续导航,让眼镜把现实世界变成输入。

Googlebook 已经把这个方向摆出来了:手机里的 Android App、文件和 Gemini 能力,可以延伸到笔记本。苹果如果把 Siri AI 做扎实,后面自然会接 AirPods、Apple Watch、Vision Pro,甚至传闻中的眼镜和桌面机器人。

手机要变成什么,现在还没人说得准,但它正在从「装 App 的地方」,变成我们「随时能调动算力的入口」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/a5wd7ct
via IFTTT

2026年6月8日星期一

微信发布Skill 文档,数百万小程序,一夜之间变成了 AI 的手和脚

微信的 AI,终于动了。

就在苹果 WWDC 的同一天,微信做了一件可能比苹果更重要的事,发布了一份朴实无华的公告:《关于开发者接入微信 AI 生态的指引》。

从今天起,小程序开发者可以给出授权,让微信 AI 完成读取、操作和调用小程序的功能。

微信给了两种接入方式,一「自动模式」,门槛几乎为零,开发者打开一个开关,平台自己读源码、分析页面、搞懂小程序能干什么,然后 AI 就能直接上手操作,一行代码不用写。

另一种叫「开发模式」,开发者自己开发定制化的 Skill,通过审核后被 AI 调用。两种可以同时开启。美团已经宣布接入。

这不能只是理解成又一个新功能上线,而是要看到,微信正在把它的整个生态——数百万小程序、微信支付、服务通知、公众号——变成 AI 的执行层。

扒一扒 Skill 文档,微信 AI 是怎么调小程序的

微信开放文档里公开了小程序接入 AI 的 Skill 技术规范,仔细看,里面藏着很多设计细节。

首先,架构本质上就是 MCP,做过 AI 开发的人会立刻认出来:mcp.json 声明每个原子接口的功能和参数,SKILL.md 描述整个业务流程怎么跑,这和 Claude、Cursor、VS Code 里的 MCP+Skills 架构几乎一模一样。微信没有另起炉灶,而是采用了行业正在收敛的标准。

其次,微信给了一套很清晰的「注意力权重」体系。AI 在决定调用哪个接口、生成什么参数的时候,最优先看的是接口返回的 content(五星),其次是 mcp.json 里的接口 description(四星)和参数 description(四星),SKILL.md 排最后(三星)。这意味着开发者写在哪里比写了什么更重要——同样的一条规则,写在接口返回里和写在 SKILL.md 里,AI 给的权重完全不同。

第三,接口返回有一条核心规范:「事实+动作」两段式。先告诉 AI「发生了什么」,再告诉它「下一步做什么」。如果只写动作不写事实,AI 可能把「展示卡片」理解成「准备调下一个接口」而跳过用户确认。这是一个踩过很多坑之后才会总结出来的规则。

第四,参数传递优先用 ID 而非自然语言。比如门店传 storeId 而非省市街道,饮品传 drinkId 而非饮品名称。这直接减少了 AI 的推理负担和参数歧义。

这套设计透露的信号是:微信已经在实战中跑过足够多的 case,知道 AI 调用外部服务的坑在哪里,并且把这些经验固化成了开发者规范。

实际上,如果对比同样以「生态」著称的微信小程序和苹果应用,微信对自家生态有一种「上帝视角」,这是一切实现的前提。

怎么比苹果 AI 还重要

今年苹果在 WWDC 上发布的新版 Siri AI,令人有些失望。尽管底层接入了 Google Gemini,Shortcuts 支持自然语言创建,却没有引起太多讨论。

细看就会发现差距:苹果做的是让 AI 在 iOS 系统内协调一些原生功能,一旦涉及到第三方应用、那些装在你手机上的 App,它就会捉襟见肘。

比如饿了么,它的代码跑在饿了么自己的服务器上,苹果读不了。Siri 想调用饿了么,必须饿了么的工程师主动来对接 App Intents 这套接口,一个一个谈、一个一个接,中间耗时耗力。

而微信做的是让 AI 直接操作数百万个第三方服务,因为小程序不一样。每一个小程序的代码,从开发者提交、到微信审核、到最后在用户手机上运行,全程都在微信的技术体系里。微信在审核阶段就能把代码扫一遍,自动分析「这个小程序有哪些页面,能干什么事,输入输出是什么」。

所以「自动模式」才能成立——开发者一行代码不用写,开个开关,微信自己就能把你的小程序翻译成 AI 可以调用的工具。微信的基础架构天然支持这样做,它拥有「上帝视角」,能够基于中心化实现调度。

这个架构优势,苹果没有,Google 也没有。

同样值得注意的,还有前阵子传出来,微信正在与华为、荣耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手能力,用户可以通过手机语音助理直接发起微信音视频通话或发消息。

对内,微信 AI 可以调用数百万小程序;对外,手机厂商的 AI 助理可以调用微信。微信正在成为 AI 时代的超级连接器——不只是一个做了 AI 功能的 App,而是一个让所有 AI 都能接入的服务中枢。

「微信 OS」的旧预言

小程序推出的时候,很多人戏称微信要做「微信 OS」。当时这更像是一个修辞——小程序替代了一部分 App 的功能,但本质上还是一个「轻应用平台」。

更偶然的是,当时设计的中心化审核机制,是出于控制质量和安全。但九年后,这个当初被批评为「管控过度」的设计,意外地成了 AI 时代的基础设施优势。分布式的 App 生态(苹果/Android)当时看起来更「自由」,现在反而成了 AI 接入的障碍。

一个旧的预言,由于新时代的技术——AI——的出现,有了颠覆性的变化。

之前写 OpenClaw 和飞书的时候,我提过一个判断:IM 是 AI Agent 最天然的入口,因为对话本身就是人与 AI 最自然的交互方式,而 IM 自带的服务生态(机器人、支付、小程序)让 AI 不只能「聊」还能「做」。飞书已经在往这个方向走,上线了 Bot API 增强和 AI Agent 节点。

不过,飞书是企业协作工具,覆盖的是办公场景。微信有着截然不同的广度——14.32 亿月活,数百个细分领域的小程序,从点外卖到挂号到买机票到缴水电费,几乎覆盖了一个人日常生活的全部服务需求。

如果微信 AI 真的能流畅地调用这些小程序完成任务,那它就不再是一个聊天工具加了 AI 功能,而是一个用自然语言操作的操作系统。

用户说一句「帮我订明天下午三点从北京到上海的高铁」,AI 拆解意图,调用 12306 小程序查票、选座、微信支付完成下单,全程不出微信。这条链路理论上今天就可以跑通。

当然,理论和现实之间还有距离。AI 调用涉及支付场景的服务,容错率接近零——点错一杯咖啡是小事,买错一张机票就是大事。底层模型的准确性要求远高于对话场景。这也是全球 AI Agent 落地面临的共同瓶颈:从「能聊天」到「能办事」,中间隔的不是技术指标,是信任。

但微信至少做对了一件事:它没有从零搭建服务网络。这些年来,ChatGPT 在做的事是先有一个聪明的脑子,再一个一个去接 Shopify、DoorDash、Stripe,每一个都是从零建立的连接,到今天交易相关查询的占比还不到 3%。

真正将要发生的变化,对大多数用户来说,可能是悄无声息的。某一天你在微信里敲打一句「帮我订今晚九点去上海的票」,然后它就订好了,你甚至不知道背后调了哪个小程序,走了什么支付流程。

这种「无感知的完成」,才是AI Agent真正成熟的标志,微信离这一步,比任何人都近。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/kC4rTVz
via IFTTT

华为为什么要做鸿蒙?可能是目前最通俗的解释

很多人问,安卓又不是不能用,华为干嘛非得死磕鸿蒙?
其实答案很简单:在别人的地基上,永远建不起自己的高楼。
六个关键词,帮你看懂鸿蒙这两年到底做成了什么?

来,看个视频,放松下。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/f4ExAXy
via IFTTT

iPhone 终于支持 Siri AI!但国行无缘首发,闹钟成为最大惊喜

作为库克最后一次主讲的苹果发布会,WWDC26 本身也颇有一种「收尾」的感觉。

从 WWDC24 压大轴的「AI」,WWDC25 唱主角的「UI」,到今年的「AI + UI」两手抓,苹果放慢了脚步,更多是将前两年确定的这些新方向,做深做稳。

特别是 AI,70 多分钟的发布会,将近 40 分钟都留给了 Apple 智能的新进度,不仅有大量的新功能,苹果也给出了自己的新主张:

真正有益的 AI,应该以用户为核心。

iOS 27 主打一个求稳

今年的 WWDC 有一个显著变化:不再按不同设备平台,将发布会分成 iOS、iPadOS 或 macOS 的独立板块,而是直接发布跨系统的新功能。

这也预示了一种大方向上的调整:苹果未来的系统更新,将从「设备」转变为「功能」为主线,以后更会贴近 AI 大模型的能力,推出更新。

去年引入的「液态玻璃」设计语言,虽然让人激动,也带来了性能和可读性的问题,因此 iOS 27 的一个首要任务,就是要搞好优化,提升系统的基础品质。

在 iOS 27、iPadOS 27 和 macOS 27,用户可以直接通过滑块自定义「液态玻璃」的透明度,甚至可以恢复到类似以前版本的低透「磨砂玻璃」。

苹果也对图标进行了进一步打磨,通过「液态玻璃」叠层和光折射效果,为原本就晶莹剔透的图标增加细节。

系统界面进一步精装,系统底层的体验也没有落下,这次 WWDC 苹果也大谈优化。

最直观的表现,不管是 iPhone、iPad 简单的划动,还是 Mac 四指上划打开调度中心,这些简单的操作响应和动画都会更顺畅,相信 iOS 26 的掉帧 Bug 终于要解决了。

苹果表示,iPhone、iPad App 的开启速度将提升 30%,这不仅限于苹果的第一方应用,得益于系统底层的优化,第三方应用的响应速度也会有明显提升。

更多系统操作的速度也会更快,比如拍摄新照片后,进入相册可浏览的速度提升了 70%;AirDrop 的传输速度最高提升 80%,等等。

苹果也宣布,所有支持 iOS 26 的 iPhone 都能升级 iOS 27,包括 iPhone 11 和第二代 iPhone SE。

另一个横跨多个系统的更新,是「搜索」功能,苹果重构了聚焦搜索、照片和邮件应用中的搜索能力,安装新系统后,后台会对全设备存储的信息进行「索引」,知道设备上有什么、内容在哪里,因此搜索会更个性化和智能。

近几年,苹果生态的围墙开始松动,iOS 27 进一步开放了 iCloud 共享相册,将支持 Android 和 Windows 设备上传和共享照片。

还有一个很小,但相信口碑会不错的更新:升级 iOS 27 后,AirPods 新增自定义均衡器,用户可以个性化调整耳机的音效。

这次 WWDC 的另一个重点,在于「儿童安全」,以「儿童账户」为核心,系统会立即启用与孩子年龄匹配的保护措施,阻止一些网站和媒体浏览,家长可以进一步管控孩子的 App Store 使用,和联系人方式。

爱范儿上手 iOS 27 Beta 版后发现,还有更多 WWDC 上没说,但非常实用的更新。

比如一个「史诗级」功能:自带的时钟 App,终于支持节假日闹钟,「调休」也会算作工作日开启闹钟了。

天气 App 也重新设计,各种指标有了更清晰的呈现柱状图方式。

其实多项更新单独看都不大,放在一起却能看出 iOS 27 的优先级:减少操作摩擦,修复旧体验,同时为 AI 入口腾出空间。

今晚的主角,还得是重振旗鼓的 Apple 智能。

苹果迟到的 AI 反攻,从 Siri 开始

如果说 iOS 27 是系统层面的修修补补,Apple 智能就是苹果重新抢回 AI 时代的系统入口。

过去两年,苹果在 AI 上的被动不难理解,ChatGPT、Claude、Gemini 等海外御三家已经把用户对 AI 助手的期待抬高了一大截,用户已经不再满足于语音问答,而是开始习惯于多轮对话、文件分析、图像理解乃至更复杂的任务执行。

因此,这次 WWDC 的重心毫无疑问落在了 Apple 智能。 耐人寻味的是,苹果高管 Craig Federighi 表示,一些公司似乎在为了 AI 本身推进 AI,而没有足够关注 AI 最终要服务的人。

(所以,这是在点谁呢?)

苹果给出的 AI 答案是「围绕用户」。Apple 智能要深度整合进日常产品,理解个人上下文、常用 App 和屏幕内容,同时从设计之初保护隐私。

为了支撑这套系统,苹果今年与 Google 展开了更深合作。

双方利用 Gemini 系列模型背后的技术,共同创建下一代 Apple Foundation Models。这些模型会用于苹果内建的 Apple Intelligence 体验,并适配两类运行环境:一类在设备端运行,另一类通过私有云计算在服务器端运行。

从短期看,苹果引入 AI 外援,算是间接承认了自己在通用大模型上的差距,但长期看,这也是一种用时间换空间的聪明策略。十几亿设备带来的使用反馈、请求分布、端侧体验和开发者调用方式,只要经过隐私保护和合规处理,就会成为苹果迭代模型、调度系统和端云架构的重要依据。

此外,苹果还针对最强的 Apple Silicon 系统优化了能力更强的端侧模型,它可以理解并生成语音,也能同时理解文本和图像,并带来更准确的系统级听写、更好的自然语言理解,以及更有表现力的语音反馈。

更明显的变化,发生在入口层面。

在 Siri 被苹果收购 16 年后,它终于重新拥有独立 App 的形态,产品逻辑也明显向 ChatGPT App 靠近。

用户可以在新版 Siri 中查看已有对话,延续之前的话题,也可以开启新的对话。Siri 的对话历史会通过 iCloud 在 iPhone、iPad 和 Mac 之间私密同步。

考虑到用户过去的使用习惯,传统入口仍然保留。用户可以继续说 Hey Siri,也可以按下侧边按钮调用 Siri。

真正体现 iOS 27 交互变化的,是 Siri 与灵动岛的深度整合。

现在只要从屏幕顶部中央向下滑动,灵动岛就会向下展开,变成一个暗色文本框,能搜索,能提问,光标闪烁的颜色也使用了 WWDC 2026 宣传图中那种发光渐变效果。

在这里,用户可以打字问天气、查网页,也可以直接下达复杂指令。

苹果也通过三个场景展示了新版 Siri 的核心能力——充分展现了 Siri 从单纯的问答工具,升级为能够理解屏幕内容、调用个人信息并持续完成任务的系统级 AI 助手。

新版 Siri 能把搜索、提醒、音乐、导航等能力串联起来。你可以查询世界杯赛程,并让 Siri 策划观赛派对、生成菜单、起草群聊邀请;也可以追问演出购票方式、设置抽签提醒、播放歌手新单曲。

在屏幕感知和个人情境上,Siri 还能识别照片中的具体地点,并结合朋友发来的地址信息规划路线。

值得一提的是,WWDC 上所有 Siri AI 的演示,基本都采用了一镜到底的拍摄模式,你能明显感受到 Siri AI 思考的速度没有那么快,还能看到测试版动效的各种掉帧。

保留这些不完美的细节,就是为了告诉你,这次的演示是真实的,避免重蹈 2 年前的覆辙。

哦,对了,在支持最先进端侧模型的设备上,Siri AI 还会获得两项额外能力。第一项是全新的语音体验。Siri 的声音会更自然,也更有表现力。用户还可以自定义 Siri 的语音,包括表达强度和语速。

第二项是系统级听写能力提升。新听写在拼写、标点和大小写方面更准确。由于它内置在键盘中,用户可以在整个系统里使用,包括发消息、写日记、记录想法等场景。这些更新也会扩展到 CarPlay 和 AirPods。

Siri AI 的入口也进一步扩展到 Mac、Apple Watch 和 Vision Pro:用户不仅能在 Mac 上直接选中文件、图片或文本向 Siri 提问,完成报价对比、生成表格、起草邮件等操作。

视觉智能也同步进入 macOS 和 visionOS,既能识别屏幕内容和日程信息并建议加入日历,也能结合 Vision Pro 的空间计算能力,直接理解用户眼前的物体与场景,例如判断背包是否符合随身登机要求。

Apple 智能接管生态入口,但国行用户还得再等等

至于使用范围,苹果称,这些跨 App 的 Apple Intelligence 新功能,将支持所有 Apple Intelligence 已支持语言,并随最新软件版本免费提供。

不止于系统级的基础能力,Apple 智能也深入到每个具体的 App 中。

Safari 浏览器

得益于苹果 AI 能力,Safari 浏览器用起来会更顺心。

全新的 Safari 浏览器能够检测用户打开的网页,按相似主题进行自动分组。

用户还可以通过自然语言,告诉 Safari 自己关注的内容,比如商品上新、放票,更新会及时通知用户。

更「AI」的功能是自定义扩展生成功能,利用自然语言生成浏览器的扩展,比如自动保存美食网页中的食谱。

iMessage、邮件 和日历

AI 也进一步融入了更多系统应用:它能够自动理解短信和邮件中的上下文内容,主动提供操作建议,例如识别活动日程后一键加入日历或提醒事项,聊天中提到相关内容时,也会自动推荐合适的照片发送。

而在日历中,用户甚至可以直接用自然语言创建和修改行程,只需一句话描述活动主题、地点、时间和参与人,系统就能自动生成完整事件,也能快速调整固定日程安排。

电话

近几年,厂商都在借助 AI 改造最传统的「通话」功能,苹果也不例外。

用户和商家进行通话时,AI 会自动抓取、提示用户的个人资讯,例如和航空公司通话提供订票的邮件详情,和餐厅通话提供预订的日程信息。

家庭

在 WWDC 上,苹果也预示了一部分「智能家居生态」的未来。

首先是「家庭」App,AI 会自动识别、归类智能家居的最新动态,并整合为一个事实更新的动态通知。

更有趣的能力在于视觉,利用摄像头智能家居,家庭 App 能理解、描述画面,并能从多个摄像头中调取相关片段组成时间,用户也可以用自然语言搜索特定场景。

快捷指令

快捷指令的自定义功能很强大,但复杂的门槛让普通用户望而却步。

最新的快捷指令,会利用 Apple 智能理解自然语言描述,自动组装各种所需步骤,后续也能用自然语言描述修改。

相机

视觉智能被整合进相机应用中,切换到相应的模式,就能让 Siri 看到相机前的内容,进行智能识别,可以用来记录饮食状况。

图乐园

新版图乐园将基于更强大的图像模型,能够生成更高质量的图像,并支持更丰富的风格,包括写实风格。

从发布会上的例图来看,全新图乐园的产出质感确实比前一个版本更优秀,更有「果味」。

图乐园的编辑也更加灵活, 用户可以圈选某个对象,利用自然语言修改重构。

照片

更强大的图像模型,也为照片应用带来了全新的 AI 编辑功能。

首先是「消除」功能更加强大,可以消除更复杂、更庞大的物体,这有待进一步实测。

新的编辑功能有两个:「扩展」和「重构」。

「扩展」就是 AI 扩图,能够利用 AI 补充更多画面。

比较有意思的是「重构」,通过将平面照片转化为空间照片后,可以改变被摄物体的角度。

图乐园和照片的 AI 编辑功能将会有每日使用限制。苹果称,用户可以通过大多数 iCloud+ 订阅计划获得更高访问额度。iCloud+ 也将包含对兼容 Home 摄像头的 Apple Intelligence 支持。

过去 iCloud+ 卖的是存储、备份和隐私服务,接下来它很可能会变成苹果 AI 的付费入口,苹果不会让用户觉得自己在为一个聊天机器人续费,而是让 AI 成为 iCloud+ 的新价值。

上线节奏方面,开发者可以从发布会当天开始试用新版 Siri。普通用户将在今年晚些时候获得 Siri AI Beta 版本。Siri AI 会先支持英语,并较快扩展到更多语言。

不过,Siri AI 初期不会在欧盟的 iOS 和 iPadOS 上提供。

至于我们心心念念的国行版本,基于监管要求,Siri AI 和其他新的 Apple Intelligence 功能也暂时不会上线。我们也第一时间上手了国行开发者预览版,除了液态玻璃设计的升级,AI 功能几乎可以说是「原地踏步」。

同样值得注意的是,苹果口中「最强大的端侧模型」,目前仅支持 iPhone Air 和 iPhone 17 Pro 等有限机型,隔壁为了苹果 AI 入手 iPhone 16 Pro 的同事,已经哭晕在工位上。

面向开发者,苹果的核心思路也很明确:让第三方 app 接入 Siri,把 Apple Intelligence 从系统能力扩展为生态能力。

通过 App Intents,开发者可以开放 app 内的信息和功能,让 Siri 成为不同应用的统一入口;而更新后的 Foundation Models framework,则进一步开放了端侧模型、图像输入、Custom Skills 以及服务器模型调用能力,让 AI 逐渐成为苹果生态的底层基础设施。

简言之,WWDC26 的重点并不是 Siri 终于变聪明了多少,也不是苹果接入了哪一家大模型,而是苹果开始把 AI 重新写进 iOS 的系统逻辑里。

过去的系统更新围绕设备展开,今年则明显转向模型能力:理解屏幕、读取个人上下文、调用 App、生成内容、完成跨应用任务。iPhone 仍然是核心,但它正在从一个运行 App 的终端,变成 Apple Intelligence 调度个人数字生活的入口。

Apple 智能的魅力,肯定不是模型能力,更像是「信任」。

从发布会到官网,苹果 AI 叙事,强调的始终是隐私、端侧处理、私有云计算和个人上下文。用户使用苹果 AI,首先是因为在 iPhone 里,因为它和系统绑在一起,因为用户愿意让它读取照片、邮件、日程、信息和 App 数据。

未来十年,最重要的 AI 设备大概率仍然是智能手机;苹果要做的,是让 iPhone 继续成为那台用户最愿意信任的 AI 设备。

当然,以上这么多这么丰富这么吸引的全新苹果 AI ,对于我们来说,还得等到真正「准备好」的那一天。

作者:苏伟鸿、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/WdmfR8g
via IFTTT