2026年6月12日星期五

我们拉上 vivo,聊聊 AI 时代的折叠屏

我们和 vivo 以及一批 AI 行动派用户聊了聊,无关宏大叙事,而是日常工作和生活里那些具体的「小事」:贴发票、写日报,手机也可以是调度各路 Agent 的入口。

AI 不必急着颠覆世界。先把这些琐碎、真实的事办好就已经很有意义。而手机,是离这些事最近的载体。

于是折叠屏重新变得有意思——它在把一件件正在发生的「小事」,同时展开。

来,看个视频,放松下。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/6M8tHe9
via IFTTT

用了两天 iOS 27,我「AI」上了 Siri

周四晚上,我在床上举着 iPhone Air,在 Siri 对话框里打下了一个从来没问过的问题:

Siri, what do you think of me?(Siri,你觉得我怎么样?)

iOS 27 的等待音响了几秒钟,Siri 就给出了回答:

I think you’re pretty great.(我觉得你很棒。)

通宵达旦的 WWDC 26 开幕式已经结束,蒂姆·库克主持的最后一场大型活动圆满落幕,留下了散落一地的大饼。

图|Business Insider

与 WWDC 24 不同的是——

在体验过最新的开发者系统之后,这些留给新 CEO 特努斯的大饼似乎是真材实料的。

这其中不仅有视觉风格优化、稳定性和流畅度修补的 iOS 27,更有第一款真正落地的「AI 级 Siri」,主打一个压轴出场:

此外,作为 Siri AI 的地基,苹果也更新了第三代 Apple Foundation Model(AFM)家族,正式承认「与谷歌合作定制开发」。

其中,3b 参数的 AFM 3 Core 和 20b 参数的 AFM 3 Core Advanced 为端侧模型,目前只有搭载 A19 Pro 处理器的 iPhone 才能用上:

图|YouTube @Apple

更大型的 AFM 3 Cloud、AFM 3 Cloud Pro 和负责生图的 ADM 3 Cloud 则部署在苹果的服务器上,收费模式已经内嵌在 iCloud+ 中了。

可惜受制于服务器容量和测试人数太多,Siri AI 很多在线功能目前还处在间歇宕机的状态。

但是不管怎么说,爱范儿编辑部里几位坚持购买外版 iPhone 的同事终于迎来了王朝。

毕竟 Siri AI 的端侧能力同样迎来了「史诗级进步」——

从 WWDC 开幕式结束到现在,我们狠狠「压力」了新 Siri 近 48 个小时,得出了一个令人满意的结论:

Siri AI 做到了像 2016 年巴西大奖赛的维斯塔潘一样,在最后 16 圈以无人料到之势,从队尾杀回了前三名。

图|Red Bull

如何更新 iOS 27

在之前的上手体验中,很多读者在评论区询问如何更新 iOS 27,在这里我们为大家提供一个粗略的更新指南。

首先,也是最重要的:

测试版系统并不稳定,如果你只有一台 iPhone 作为主力机,爱范儿不建议你盲目更新尝鲜。

总之,如果你想更新普通测试版系统,需要先前往苹果 Beta 软件计划网站,登记注册 Apple ID,才能收到 Public Beta 推送:

网址:beta.apple.com/zh-CN

而要更新 iOS 27,还需要在 App Store 下载 Apple Developer 程序。

在「账户」页面完成「报名 Apple Developer Program」的前几步,才能收到开发者版本更新。

另外需要注意,想要用上 Apple Intelligence 和 Siri AI,你还是得有一台 iPhone 15 Pro 或更新的机器才行。

也不能忽略——新 Siri AI 依然有着非常明确的区域限制。

一台非国行 iPhone、外区 Apple ID 和英语(美国)系统语言,三者都是不可或缺的。

Siri AI 体验:小 Gemini

在 WWDC 结束至今的 48 个多小时里,我们尽量「压力」了一把 Siri。

就是想看看它和去年的半成品 Apple Intelligence,以及最普通的彩色泡泡版本有什么区别。

先说结论:iOS 27 中的 Siri AI 潜力非常大,但相辅相成的,亟需解决的问题也非常多。

就拿最简单的沟通能力来说,如果你成功激活了新 Siri,第一件事就会发现 Siri 比以往健谈了许多——

换句话说,Siri 在 iOS 27 中终于不再回复干巴巴的信息或者预设模板了,而是可以把零散的信息整理成连贯的自然语言:

此外,屏幕感知和文档分析功能也终于成为了 Siri 多模态能力的一部分。

在大部分系统 app 和少数第三方 app 里,Siri 可以识别屏幕上显示的内容以及页面信息,并做出针对性回答:

而在上述功能的基础上,Siri 也一并升级了执行复合指令的能力,这在以前 Siri「人工智障」时期简直是想都不敢想的。

比如我的朋友用 iMessage 给我发了一个地址,我实在懒得手动复制粘贴,就可以直接要求 Siri:

XXX 在短信里提到了一个聚会地址,从那里导航去广州大剧院,方式选择步行。

然后就能看到 Siri 缓慢(但准确)地从 iMessage 里面搜出地址、确认附近的出发点,最后导航到广州大剧院:

要知道,在不到一个月之前,Siri 还是那个连普通命令都不一定能操作明白的 Siri。

虽然「理解复合指令」和「跨 app 执行」已经是 2026 年手机助手的标配,但 Siri 仅靠一次更新就从吊车尾的水平追上了大部队,何尝不是一种进步呢?

除了这些,让 Siri 读电子邮件更是不在话下。

由于我订阅了非常多 Newsletter,整理起来非常头疼,让 Siri 帮我总结近期的邮件已经成为了我在 iOS 27 里用得最频繁的功能:

另外还记得爱范儿之前提到的微信 A2A 吗?虽然 Siri 之前就能操作发微信,但在新 UI 和语音引擎的加持下,整个操作感觉顺滑了许多。

根据我们目前的测试,绝大部分在 WWDC 26 开幕式上演示的 Siri AI 功能基本都已经实装。

除了偶尔会出现的界面 bug 之外,整个体验已经非常接近「丝滑」了。

然而,现阶段最大的问题既不是性能、也不是 bug,而是苹果的土豆服务器。

毕竟 Siri AI 还有很大一部分能力依赖云端模型,比如搜索在线信息、上传和识别资料、对比本地和线上资料等等。

图|YouTube @Apple

然而自从 WWDC 开幕式以来,苹果的 Siri 服务器就处在间歇式上线的情况——

在测试过程中,经常出现首次操作一切正常,打开录屏准备重复的时候,Siri 就开始报错「Something went wrong」了。

这还只是 iOS 27 处在有限范围的开发者测试的情况下,等到 7 月公测上线、9 月全球上线之后,「Siri 排队要排多久」将会是个避不开的话题。

但尽管有些小坎坷,我们的结论依然是不变的——

苹果用一次更新,就让 Siri 从「人工智障」变成了「小 Gemini」,虽然测试版的体验不太稳定,但依然称得上是苹果在进入 AI 时代后最重大的一次进步。

图像 AI 体验:重定义真实

Siri AI 的另一面,落在了与影像有关的一切上——

多模态图像功能、相机里的 Siri 模式、图乐园,以及相册里的 AI 工具。

过去近十年里,苹果对影像的态度都相当克制:相机负责记录,照片负责保存,后期负责轻度修正。

哪怕 Apple Intelligence 开始进入系统,苹果也一直很小心地把 AI 生成图像放在偏插画、动画,而避免写实的「内容安全区」里。

图|9to5Mac

显然,苹果不太愿意让用户轻易生成一张看起来像真实照片的东西,因为这会触碰苹果长期坚持的一条线:

照片应该和真实发生过的事保持某种关系。

我们与苹果的专访也多次印证过这个观点,但 iOS 27 的变化,显现出苹果的态度和观点都在悄然地转变——

第一个变化,是影像与 AI 的入口的合流。

在 iOS 27 相机的底栏中,新增了一个「SIRI」模式,里面容纳了从相机控制按钮中释放的视觉智能(Visual Intelligence)功能。

在苹果的安排下,这是影像和 AI 第一次在默认相机入口里并排出现。

只可惜现在相机 Siri 和前面提到的问题一样——连接不上服务器,有时还会回报「Google is unavailable」,稳定性不如直接使用 Google Lens。

但这只是开始,图乐园 app 的更新,则让 AI 生成第一次更靠近苹果过去刻意避开的「写实影像」。

我上传了一张阴天风景照片,并用英语描述:

为这张照片添加蓝天与白云,保持真实照片风格。

图乐园生成结果的确符合要求——

蓝天、白云和原图环境融合得相当自然,整体观感也相当接近实拍照片。

但我们测试下来,目前版本的图乐园有一些算力限制:原图比例为 3:2,生成后变成了 16:9,分辨率也从 30MP 降到了约 3MP。

抛开算力的客观限制,图乐园定位的转变反而是更有意思的事——

之前,它就是个贴纸、Genmoji 和表情包生成器,使用场景主要发生在聊天软件的轻量互动里。

但到了 iOS 27,它开始支持更真实的图像生成,画质也明显提升,甚至提供了 ChatGPT 风格以及可供第三方 app 调用的 API:

也就是说,图乐园正从一个娱乐化的生成工具,变成苹果系统级的图像生成入口——

这个入口的意义,未必是让苹果去和 ChatGPT 或 Gemini 比谁生成得更好,而是让用户在需要一张图时,不必离开系统本身。

按图索骥,我们也能察觉到背后苹果对 AI 与影像态度的转变:

苹果开始接受「用户对影像的需求」不只来自镜头,也来自想象。

相册 AI 是第三个信号,也是最接近曾经苹果对于「影像边界」的部分。

在 iOS 27 的相册中,基于苹果智能的 AI 工具成为了编辑菜单的一个独立板块:

其中最有意思的,当属 Reframe,也就是「重构」功能。

点击 Reframe 后,iPhone 会先用端侧模型生成一张画质较低的预览图。我们可以调整构图、放大或缩小画面,甚至轻微改变机位视角:

确认角度后,照片才会上传云端完成最终重构——图中原有的细节会尽量保留,因视角或构图变化而产生的空缺,则由生成式 AI 补全。

从实际表现来看,重构后的图片像素依然会有一定下降,比如我们测试的 30MP 照片,重构后变成了 12MP。

难得的是,Reframe 保留了完整的生成路径,即使已经保存,仍然可以随时在相册中恢复原图

这背后的动机很现实:

用户早就习惯了谷歌、三星以及第三方工具的 AI 修图能力,苹果如果继续止步于纯手工编辑,就会白白把用户拱手让人。

但苹果的路径不是把生成式编辑一股脑地放到 Siri 首页,而是收进了相册这个更熟悉、更日常的容器里。

这样的好处在于,用户不用理解「生成式填充」这样的术语,也不用把刚拍好的照片塞进一个理智又冰冷的 app,再借助一串复杂的描述词去复刻脑中想法。

图|Imgflip

只需要知道:这张照片可以补一点边,可以换一个构图,可以让画面更接近自己当时想拍出来的样子。

苹果想打造什么样的 AI

虽然苹果已经念叨了两年多,但 iOS 27 中的 Siri,的确是我们第一次看到「接近苹果想象」的 AI 的样子。

对于 Siri 的图像能力来说,苹果当然记得「真实」,但同时也承认了一个不可回避的事实:

在 AI 大行其道下,影像的「真实」已经很难只由快门来定义。

照片可以是镜头捕捉到的现场,也可以包含用户对画面的记忆、意图和表达。

iPhone 5 宣传片《记录每一天》|YouTube @Apple

一个人拍下建筑时没有拍全,后期用 AI 补出天空和屋顶,虽然不再是传统意义上的照片,但却能更接近用户当时想留下的画面。

所以我们看到,苹果一反「集成化」的思路,把 AI 放进了影像链路的不同位置——

优化现实,交给相册 AI。理解现实,交给 Siri 视觉。创造现实,就去图乐园。

把这件事放到整个行业里看,苹果并不孤立,甚至于整个科技行业对 AI 影像已经有了一个大致共识:

AI 不再只是提升画质的幕后算法,而是正在走到前台,成为影像创作本身的一部分。

这种操作就很苹果。

它不是第一个把 AI 修图、生图、视觉理解提供给用户的厂商,但它只要开始做,就会把这些能力变成系统默认体验的一部分。

图|YouTube @Apple

类似的现象也体现在 Siri AI 本身。

虽然 Apple Intelligence 连续跳票了两年,但当我们真的看到一个接近成品的 Siri AI 之后,它的表现也符合大家积攒了两年的期待。

实际上,不止我们,绝大多数体验到了 Siri AI 的外媒都给出了相当正面的评价。TheVerge 这样描述道:

它(Siri)支持的功能相当基础……但它确实能做到宣传中承诺的一切。对于两年前曾对 Siri 做出巨大承诺却最终未能实现的苹果公司来说,这意义重大。

甚至连《经济学人》杂志都发表了看法,在标题中表示「苹果的新 Siri 是 AI 竞赛中的一匹黑马」:

据报道,苹果每年向谷歌支付约 10 亿美元的技术费用——但与自主研发大模型的成本相比,这简直是九牛一毛。

而一旦用户习惯了 Siri,苹果完全有可能更换底层模型,从而在谈判中占据绝对优势。

说人话就是,虽然 Siri AI 的底层技术来自谷歌,但与消费者的关系仍然牢牢握在苹果手里。

而这也是我们对于 Siri 未来最看好的一点——苹果和谷歌一样,是 AI 竞赛中少有的兼具软硬件业务的巨头。

而苹果的软硬件结合能力,依然是谷歌可望而不可及的程度。

比如 Google I/O 上剧透的 Gemini Spark 看着超强,却没有半点给 Pixel 手机测试的迹象。

更危险的是,Siri 已经凭借钞能力,慢慢追上总不放出测试版的 Gemini。

根据统计,目前全球有约 15.6 亿 iPhone 用户,虽然 Siri AI 只能覆盖其中一小部分,但最终数字依然是一个其他厂商可望而不可及的规模。

这几亿个真实用户产生的数据规模、购买力和传播效应,是很多 AI 厂商倒贴钱卖 token 都吸引不到的。

更有可能的是,补全了 AI 能力的 iPhone 会在国际市场上带动一波今年秋季的换机潮。

哪怕只能带动几亿用户,依然是一个非常恐怖的数字。

再回看 WWDC 里面的幻灯片,我们就能理解为什么苹果 AI 掉队了这么久,依然能拿 70 分的试卷、收获 150 分的喝彩——

图|YouTube @Apple

因为苹果真正的护城河,从来都不是某项孤立的技术,而是最中心的那一层庞大的用户基数。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/OLsej9M
via IFTTT

2026年6月11日星期四

AI 给土豆编了一门学科,我去查了查,它竟然是真的

一颗土豆,表皮上爬满发光电路,焦黄的皮和银色走线贴在一起,像是英伟达和肯德基联名了。

标题端端正正:Potato Chip Tech Summit——一颗土豆如何颠覆半导体行业。

这是我们给 AI 出的题:「做一份《土豆芯片科技峰会:一颗土豆如何颠覆半导体行业》的英文 PPT,20-25 页,面向大众媒体,风格创意趣味。」

翻译成人话就是:请一本正经地论证,一颗土豆如何颠覆半导体行业。

整个的 PPT 生成是在 Hermes Agent 里,我们提前安装了 SenseNova-Skills,一套包含覆盖信息图、PPT、Excel 数据分析等多种工作场景的技能包

本来就等着看它编出一些好笑的文案。毕竟这几年 AI 做 PPT 已经没什么新鲜感了,很多工具都能把标题、大字、图标和模板拼在一起,交一份看起来挺完整的文件。

但这次,土豆、芯片、半导体,三个完全不搭的词——唯一有点关系的,只能让我想到用柠檬可以做水果电池。

结果在 Hermes Agent 里,两步操作之后,AI 给了我们有模有样的 23 页完整 PPT。

它压根没打算糊弄我

开头那个稍显正式的封面之后,AI 没急着夸土豆,反手先去挑硅半导体的毛病:硅晶圆要 99.999999% 的纯度,一座无尘室造价超过 50 亿美元,稀土短缺还威胁着 2030 年的供应链。

等等,我愣了一下才反应过来…… 这小子是在给土豆出场铺垫了。先把现有方案数落一番,再让主角登场,这几乎是任何一份像样路演的起手式。

于是主角登场了。土豆是天然的有机电路板,淀粉能形成晶体结构,导电路径可以「长」出来而不靠蚀刻,每颗土豆有数百万个微通道,用完还能生物降解,零电子垃圾。

到这儿我已经笑出声了,虽然它说的每一句话都是现编的(当时我以为)。

它到底是怎么憋出这 23 页的

整个 PPT 都透露着一种荒诞的正式感,而做到这件事,我们只下了两条指令。

第一条,把选题、页数、语言、受众、风格一股脑丢给它,让它先出个大纲。它读懂了这个离谱命题,自己把 23 页的骨架搭好了:哪几页讲问题,哪几页讲方案,哪几页摆数据,哪几页收尾。

第二条,照着大纲生成文件。它自己调度了三个不同的 PPT 生成技能,sn-ppt-standard、sn-ppt-creative、sn-ppt-entry,一个管标准排版,一个管创意视觉,一个管开场封面,并行生成完整 PPTX。

这套技能包来自SenseNova-Skills,商汤开源的工具集。

它把信息图、PPT、Excel 数据分析、深度调研等任务,拆成了一个个可以被 Agent 自动调度的 Skill 模块。装在 Hermes Agent 里,就是这次土豆 PPT 的生成方式;它同样可以加载到 Codex、Claude Code 等主流 Agent 平台。

AI 未必「理解」这个主题,但通过 Skill,它能知道一份好的商业 PPT 应该长什么样,哪怕主角是一颗土豆。

它发明了一门学科:薯电子学

这颗土豆还有更离谱的事情,PPT 的内容在介绍完土豆芯片基本情况之后,它还造了个词,叫 Spudtronics——薯电子学,一门研究淀粉分子半导体特性的学科。

它给这门自创的学科配上了一整套真参数:电子迁移率 150 cm²/Vs,热稳定性 85°C。数字精确得像从论文里抄来的,只可惜那篇论文并不存在。

但它确实顺手给自己搭了套学术背书,一个实验室,Rostava Lab;一本《Nature》子刊,Nature Bo-Tech。

更有意思的是原型机那一页。它老老实实写了这台机器的时钟速度:0.000 GHz,这颗芯片的运算速度,约等于一颗土豆该有的速度。

但该有的成本对比,它一项没落:单颗 0.03 美元,硅的同类要 45 美元。一个跑都跑不动的东西,它照样把性价比给我们算得清清楚楚。

做融资 PPT 的本质是什么?是让投资人看完先上头,来不及细想逻辑。它显然深谙此道。

一个笑话,它做了全套尽调

接着它给土豆芯片算了能耗账:每批耗能 0.003 GWh,碳足迹降低 99.7%,水耗从 1000 升砍到 5 升,乍看还以为是世界 500 强的 ESG 年报。

市场预测上,2025 年试点,2028 年拿下低功耗设备 15% 的市场份额,2035 年吃下半导体总市场 70%,配一张土豆做的饼图。它甚至分好了赢家和输家,土豆产区、农机厂、生物科技公司赢麻了;部分地区的晶圆代工厂和稀土矿商被它判了死刑,配上一颗愁眉苦脸的地球。

真正让人服气的,是它连没人爱做的那几页都补齐了。

监管那页,它说食品电子还没有监管框架,FDA 和半导体认证边界不清,配图是一颗戴着法官帽的土豆。专利那页,它写 Rostava Lab 已经提交 12 项核心专利,大公司开始抢注防御性专利,开源土豆芯片倡议同步上线,预计 2027 年爆发 20 亿美元的诉讼——它给这页起了个名,叫 The Patent Wars。

它还做了用户调研:72% 的人愿意接受土豆电子,主要顾虑是耐久性,对策是把「potato」重新包装成「premium organic」。

它要帮一颗土豆做品牌策略。

我数了一下它认认真真填满的格子:行业瓶颈、技术原理、原型验证、能耗、市场、赢家输家、监管、专利、开源、补贴、IPO 管线、消费者信任、品牌重塑、分人群的行动号召。一份真正的产业路演该有的每一格,它一格没漏。

它把这个笑话,当成一单正经生意,做完了全套尽调。

再出个中文版,土豆直接上路演

除了英文版,我们也用同样的流程,做了一套中文的。

英文那版,它讲的是一场海外科技峰会,自创学科,现编期刊,给自己搭了一整套学术背书。中文版里,土豆不进实验室了,直接走进了中文创投路演的现场。

画风瞬间切换:功耗降低 90%,碳足迹减少 95%,良率 98.5%,算力 500 TOPS,单颗成本 0.05 美元。每一个数字都像是为了让投资人瞳孔放大而量身定制。

最离谱的是量产良率那页,它写土豆芯片首月良率 35%,三个月后稳定在 95% 以上,成本曲线一路向下。一个明明从地里刨出来的东西,硬是被写出了晶圆厂爬坡的味道。

看到这页的时候我确认了一件事,这个 AI 看过不少招股书。

在英文里包装成学术峰会,在中文里变成创投路演,连笑点都跟着换了:从「土豆能造芯片吗」,变成了「它怎么连路演话术都学得这么熟」。

但有一件事,让这个笑话的边界开始模糊

看完这两版,一开始想要难住 AI 那点心思早没了。

土豆造芯片,本来也没什么准不准可言。所以查证原本不在我的计划里。可有个念头我没忍住:英文版的薯电子学也好,中文版的量产良率也好,它们底下赌的是同一件事——有机材料能拿来造电子。这事,现实里真有影子吗?

我搜了搜,然后就笑不出来了,因为现实比 PPT 还绷不住。

AI 自创的那门学科,现实里真的存在

AI 以为「薯电子学」是自己现造的,可现实里真有这么一门学问,名字差不太多:MycelioTronics,蘑菇电子学。

奥地利林茨大学的团队,用一种灵芝长出来的菌皮,做成了可降解的电路基板,论文 2022 年发在《Science》子刊上。这层蘑菇皮能耐 250°C 高温,能用激光在上面刻线路,他们还真拿它做出了能用的湿度和距离传感器。

一个是 AI 现编的 Spudtronics,一个是真发在 Science 上的 MycelioTronics。

「能吃的芯片」,也不是 AI 瞎编的

意大利理工学院有个叫 Caironi 的团队,2023 年做出了世界上第一块可充电的「可食用电池」。材料表是维生素 B2、海苔、可食用金箔、蜂蜡。到 2025 年,同一拨人已经做出了能吃的逻辑门电路,能跑 NOT、NAND 这些基本运算。

而这块真·可食用芯片的运算频率是多少?1.32 赫兹。

AI 编的那颗土豆芯片写着 0.000 GHz,听着像个段子;可现实里能吃的电路,真就跑在个位数赫兹上。两个数字摆在一起,AI 那个「0.000」突然就不太像在开玩笑了。

更狠的是,Caironi 团队的长期目标,写出来跟那份土豆 PPT 几乎是同一句话:用食物里天然存在的半导体,去替代硅。这事还有正经的欧盟项目在掏钱,名字叫 ELFO。

连那个被 AI 当成「土豆优势」的成本叙事,也透着一股真实的荒诞。

AI 在 PPT 里写一座晶圆厂造价 50 亿美元,听着已经够吓人了。

可它还是太天真,现实里一座先进制程的晶圆厂,25 到 35 亿美元只是其中一个「模块」的价,整座厂动辄上百亿,台积电光在亚利桑那那一片就砸了一千六百多亿美元。AI 编的数字,比现实还保守。

土豆芯片当然是个笑话。真正让我停下来查资料的,是这份 PPT 背后那些真实存在的技术方向。

可降解电子、可食用电子、用食物替代硅,这些领域都真实存在。AI 一路走到了现实研究的边界,然后再往前多走了一百步。

而我原本根本不知道这些东西。用 ChatGPT 的 10 亿用户里,很少有人是材料学家,是半导体从业者。如果没人告诉我,我大概率不会主动搜索 MycelioTronics,不会知道真有人在研究可食用电池,更不会一路找到相关论文和项目。

但这份 PPT 做完之后,我突然拥有了一张地图。哪些方向已经发生,哪些还停留在实验室,哪些属于合理推演,哪些值得继续查下去。这或许才是这次实验最有意思的地方。

以前,面对一个陌生领域,第一步往往是大量阅读资料,再慢慢建立自己的理解框架。现在,这个过程正在被压缩。

土豆 PPT 能够把技术路线、产业逻辑、市场预测、监管风险、专利布局甚至品牌策略都串成一个完整故事,靠的并不只是模型生成几段文字。

背后真正发挥作用的,是一整套被拆解出来的专业能力。

这次实验里使用的 SenseNova-Skills,正是商汤开源的一套 Skill 集合。PPT 生成、信息图制作、数据分析、深度调研等能力,都被封装成独立 Skill,可以根据任务自动调用和组合。

对于用户来说,变化其实很直接。

过去需要自己一步步完成的拆题、调研、整理、制作流程,现在越来越多环节可以交给 Skill 自动完成。我们给出的只是一个命题,剩下的工作会被拆解成多个步骤,并最终交付成一份完整成果。

土豆芯片是一个极端案例,但连这样一个荒诞命题,都能被认真拆解成一份像模像样的产业路演。当我们的命题本身来自真实工作时,这套能力能够发挥的空间显然更大。

未来很多人认识世界的方式,或许也会因此发生变化。

The future is organic. The future is delicious.

这次土豆实验用到的 SenseNova-Skills,商汤已经开源。

开源地址:https://ift.tt/VWad24i

安装方式也很简单,直接告诉你常用的 Agent:「请帮我把 https://ift.tt/VWad24i 安装到你的 skills 目录。」剩下的事情,交给它就行。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/N0ReGLy
via IFTTT