2026年7月2日星期四

法拉利大师操刀设计,预售 14.38 万起!小鹏 MONA L03 大脚步冲进市场

小鹏 MONA 系列的第二款车于今晚正式亮相。

大家都知道,先前的 M03 卖得很好——上市 674 天,累计交付 28 万台。尝到成功滋味的小鹏,顺理成章地将目光投向了 SUV 市场。

在 10 到 20 万元的主流 SUV 区间,传统燃油车至今仍占据半壁江山。这一价位段的燃油车型大多设计平庸,智能化配置更是乏善可陈。

平庸产品的泛滥,让年轻人在选购人生第一台车时陷入两难。

何小鹏在现场指出了这个问题:

对于一个刚毕业不久的年轻人,如果要考虑买车,大概率需要家里支持一部分预算,再加上自己攒下的一点积蓄。但那时你会发现,看得上的车买不起,买得起的又看不上,这会让人非常痛苦。

长期以来,这一级别的 SUV 往往过于强调工具属性,使得预算集中在 15 万元左右的消费者,在设计与科技体验上几乎没有选择余地。

今晚登场的 MONA L03,正是瞄准了这一沉寂已久的市场。它要将以往高规格的软硬件配置与设计美学,带入大众主流消费区间。

一辆看着像超跑的 SUV

谈到设计,各种发布会上的漂亮词想必大家已经听过不少。所以,何小鹏今天直接搬出设计团队的履历来背书。

执掌 L03 外形设计的团队由小鹏设计副总裁胡安马亲自带队,这位在欧洲超跑阵营里资历深厚的老将,曾主导过法拉利旗舰超跑 LaFerrari 的外观设计,法拉利 Purosangue 的造型亦出自他之手。这份履历,让他更懂得如何利用比例去塑造一台紧凑型 SUV 的运动姿态。

L30 采用了 0.46 的大轮高比和 1.20 的宽高比,顺势将整车重心往下压,呈现出跨界跑车的贴地形态。

同时,许多常见于豪车的的设计,比如隐藏式水切、无框车门以及纯平侧窗,这一次悉数变成了 L03 的标配。

何小鹏表示,L03 车身接缝被严格控制在 3.25 至 3.5 毫米以内,工艺精度比不少 30 万元级 SUV 还要高。车面的漆料则采用了 80V 高亮清漆工艺,号称漆面厚度高出行业平均水准 20%,曲面在不同光线下的反光显得更有质感。

空气动力学表现同样是这台车很重要的硬件指标。

L03 的车头配备了主动进气格栅,在车辆高速行驶时会自动关闭。而车辆尾部那条独特的导流风道,则是开发团队在听取意向车主的建议后做出的针对性优化。

总之,车身上的各种小细节,让 L03 的整车风阻系数下降到 Cd 0.228,在目前量产的新能源 SUV 里稳稳进入了前五名。

进气格栅上方,是由四百多颗 LED 灯珠组成的星舰大灯,它支持三种不同节奏的迎宾灯语。后尾灯红光的波长也经过了专门调校,确保它在夜间亮起时显得更加深邃,整体质感较 M03 有明显提升。

拉开无框车门进入车内,日常行车信息由一块 26.8 英寸高亮度 W-HUD 呈现,15.6 英寸的 2.5K 超清中控大屏也能与 W-HUD 进行联动,同步显示导航信息。

何小鹏介绍称,L03 的内饰质感和 M03 相比提升了不少,双幅方向盘加入了好用的卫星按键,车软包面积超过 72%,音响面罩也采用了金属拉丝工艺。

与此同时,座舱内部的静谧性也同样下足了成本,全车内饰隔音材料覆盖率超 90%,前后门窗的钢化玻璃厚度也增加了 25%。

隔音增强的同时,小鹏还给 L03 准备了 20 个扬声器。

何小鹏表示,依托小鹏自研的 AI 空间音频渲染技术,系统能把普通的音频音源渲染成极具包裹感的三维空间声场。配合专用降噪芯片,座舱实现了 RNC 路噪与 ENC 引擎主动降噪的双重叠加,即便在时速 120km/h 的高速状态下,车内的静谧性表现依然出色,超过了特斯拉 Model Y。

针对现在的年轻人把车当作午休场所的需求,小鹏为 L03 的主驾座椅加入了 14 点云朵按摩、电动腰托及通风加热,副驾更是配备了带 14 点按摩的零重力座椅。

中午小憩时,用户还可从二排座椅下方拉出一个 10 升容量的隐藏式储物抽屉,用来存放枕头和被子。

说到二排,尽管车身采用溜背设计,但二排的乘坐空间并未受到挤压,有效的垂直空间达到 985mm,后排靠背还支持角度调节,不过可调范围只有 5°,聊胜于无。

作为一台面向生活玩乐的 SUV,L03 为用户准备了 102L 前备箱和 539L 常规后备箱,放倒后排座椅后可扩充至 1640L。

座舱内还预留了 8 个磁吸外接点,可以用来吸附纸巾盒或玩偶,新加入的 5 个标准的四分之一螺纹接口可以用来固定运动相机,充电口也给够了,全车一共有 8 个。

同时,L03 还支持 6kW 对外放电,以满足周末露营的用电需要。

这次,小鹏还推出了一款由年轻产品团队主导的「ROAM 拾光漫游特别版」。

这其实是一个定制化方案,提供维奥拉紫和鹦鹉粉两款专属内饰,座椅升级为 NAPPA 面料并缝制了专属刺绣,车尾换上了黑化的运动鸭尾和 Logo,车机界面则深度定制了漫游飞船 UI 皮肤,美妆镜也扩大了尺寸并配上环形柔光灯。

另外,这一版本的后备箱内部还融入了可 DIY 定制的洞洞板,让各种露营小装备都有了专属的归纳空间。

L03 大概率能成为小鹏的下一个明星产品

聊完了静态配置,我们来看看这台车真正拉开代差的地方——智能化与动力系统。

辅助驾驶提供两个方案,入门的 Max 版搭载单颗图灵芯片,算力 750 TOPS。小鹏将在三季度为该版本推送第二代 VLA 大模型蒸馏版,届时这套系统的日常驾驶体验会更加流畅。

而高配的 Ultra SE 版本,则直接给到了双图灵芯片。

它的有效算力被推高到了 1500 TOPS,达到了同级主流车型的十倍以上。这一版本支持从车位到车位的全场景辅助驾驶,还能在无导航的情况下进行漫游。

动力路线也有大调整,多了一个超级增程版本。

先说纯电车型,大小电池两个版本分别可以提供 525km 和 625km 的 CLTC 续航,能耗低至每百公里 11.9 度。

新加入的超级增程版,具备 315km 的超长纯电续航,油电全满下总续航拉长到了 1330km,基本上就和蒙多一样想去哪就去哪了。

底盘采用前麦弗逊与后五连杆独立悬架,这个倒是意料之中的,真正让人没想到的是 L03 竟然全系标配了可变阻尼减振器。

这个硬件配置在 15 万级 SUV 里确实很少见,配合小鹏的防晕车 2.0 模式,行车时的仰头和点头应该能被有效抑制。当然,我还没开过,如果不能,那就是小鹏的调校出了大问题。

安全保障上,作为一款全球车型,L03 按照全球五星碰撞标准开发,标配 7 个气囊、17 项主动安全、爆胎稳行以及驾驶员失能辅助。

价格方面,纯电 Max 版预售价 14.38 万起,Ultra SE 版 15.58 万起,超级增程版为 14.98 万起。新车定于 7 月 16 日在德国慕尼黑全球上市。

在小鹏看来,这辆车大概率是能延续先前轿车车型 M03 的畅销态势的。

M03 之所以能创下月均交付超 13000 台的成绩,主要是因为它在主流消费大盘里建立了一种牢固的信任。车主们发现,在这个价位上,小鹏是真的能把高阶辅助驾驶和行车能耗控制做到扎实、可靠。

这种经过长周期积累下来的品牌信任红利,大概率会非常自然地迁移到这台全新的 SUV 车型上。

另一个更关键的胜负手,在于超级增程路线的加入。

过去纯电紧凑型 SUV 受限于充电设施,很难真正下沉到低线城市,传统燃油车在这些市场依然过得挺滋润。而这次 L03 超级增程版提供 315km 的长纯电续航,既能保证工作日无油耗通勤,又依靠 1330km 的综合续航打破了地理隔阂。这对于原本打算购买哈弗 H6、锋兰达的刚需客群来说,足以产生较强的替代效应。

动力变阵带来受众面的成倍扩容,让那些家里没有充电桩、却又眼红智能化体验的买车人,有了一个完全不需要妥协的选择。

再者来说,15 万左右的紧凑型 SUV 市场虽然规模巨大,但多数产品长期处于同质化严重的胶着状态。

不按常理出牌的 L03,把可变阻尼减震器、高算力智驾平台以及 20 扬声器等硬件放进这个价位,在技术上形成了明显的代差。这种不对称优势结合其跑车化的跨界形态,大有希望延续甚至超越先前 M03 的良好势头,成为小鹏的下一个明星产品。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/GkLyqsg
via IFTTT

54000 元,买一个会叠衣服的机器人,值吗?

谁不想要一个会做家务的机器人,把打扫卫生、清理房间、叠衣服,以及做收纳那些脏活累活,统统都交给它,而那些能赚钱的工作全都留给我。

但现实的情况却是刚好反过来,AI 把以前那些赚钱的工作,文书、编辑、代码等等岗位都抢走了,回到家的我还是要面对一屋子乱七八糟的东西。

衣服要自己丢到洗衣机里去洗,烘干了要自己拿出来叠,小孩子满地的玩具要等着我一个个去捡起来,随手一丢的各种玩意都等着物归原位。

于是越来越多的机器人开始主打自己能做家务,跳芭蕾练武术都与我无关,只有能收玩具、叠衣服才是我们真正需要的。

具身智能初创公司 Weave Robotics 就发布了一款「能帮我们做家务」的机器人 Isaac 1,也是其首款移动式全能家庭收拾机器人,并同时宣布将于今年秋季开始向首批用户交付。

这款售价 7999 美元的机器人,会是带我们提前步入《杰森一家》式未来的那把钥匙吗?

更像一个家电

在今年年初,Weave 这家公司其实就曾小规模试水过一款固定式的原型机 Isaac 0,专门帮用户在桌面上折叠衣物。

用来介绍的演示视频里,用户需要把洗好的衣服抱到 Isaac 0 面前的工作台,机器人会调用摄像头,驱动手臂运动,然后静待 Isaac 0 一件件把这些衣服叠好。

当时 Isaac 0 的售价同样包括两套方案,一套是可以选择每月 249 美元的订阅方案,或者一次性支付 3999 美元,然后每月再支付 49 美元。

眼下 Isaac 0 已经开始正式发货了,不过官网和其 X 官方账号都尚未透露具体卖出去了多少台。

这次发布的全新 Isaac 1 重新回归了轮式移动设计,也让它的工作半径从一张桌子扩展到了整个屋子。

和一般认知里的机器人不同,大多数具身智能对这个「身」的呈现都是人形机器人,用脚走路,用手抓取。

Isaac 使用的是可伸缩的躯体和用轮子来移动的方案。它占地面积仅约 18×19 英寸,在不需要工作时,它的摄像头会关闭折叠,躯干自动缩回,安静地收纳在专属的充电座里。

而用来操作的「手」也不是五个手指,Isaac 采用了一双灵巧的双指夹爪,带有橙色触角的机械臂,可以精确感知物体,既能抓起掉在地上的硬币,也能温柔地拿起毛绒玩具。

▲ 五款不同的家居风配色,主打是采用了柔和的浅绿色外壳,并且都配有一个带有亲和力「面部交互」屏幕。

从外观、软包外壳到「待机时缩起来」,都能看出它在刻意降低机器人的存在感,希望更自然地融入家庭环境。

过去这段时间我们讨论最多的大概是 Optimus、Figure、1X、宇树等人形机器人,Weave 的思路是更想做「家庭里的洗碗机、扫地机器人」——不追求拟人,而是优先把具体家务做到足够好。

这种先解决一个高频需求,再逐步扩展能力的路线,可能比一开始就追求通用人形,更容易率先实现商业化,但用户不会为路线买单,只会看真实的表现。

在官方演示中,它的核心技能主要就是两个:

  • 全屋杂物收拾:它会在客厅自主巡逻,识别散落在地板或沙发上的玩具、零碎物件,将它们一件件捡起并分类放进收纳篮。
  • 衣物打理:它不仅能自主完成 T 恤、短裤等日常衣物的标准折叠,还能顺便帮你把凌乱的床铺整理干净。

不过,和过去那些主打做家务的机器人一样,Isaac 1 的「聪明之处」在于,当现在的技术做不到 100% 的完全自主时,主动采用了「AI大模型 + 远程人类专家」的混合模式。

当机器人内部的视觉-语言-动作大模型(VLA)在处理某件复杂衣物卡壳时,系统会瞬间向后台的 Weave 专家发出求助。远程专家通过 VR 或操作台接入,可能进行一次 5 到 10 秒的快速微调修正,随后便把控制权交还给机器人继续运行。 

▲ 在 Weave 那条将近 700 万次浏览的 demo 视频下,有网友如是评论

一件形状极度奇葩的衣服,一个被卡在死角的物品,让机器人做家务真的有这么难吗?

Fake it until you make it

眼下做机器人的公司多到双手都数不过来,主打能做家务的也不少。X 上的机器人初创公司,几乎是每隔一段时间就会刷新一波新的。

除了 Weave 这次推出的 Isaac 1 家务机器人,还有 Bracket Bot 1 在这个月 1 号表示开始生产 100 台在办公室、零售店、家庭等场景服务的 Gen 2.5 机器人;以及在演示视频里同样做着家务的 Tangible Eggie 机器人;和之前 Genesis AI 的 Eno 机器人等等。

这些公司发布机器人的模式几乎都一样,一个很炫酷的视频 demo,然后一条「极其务实」的先交付、再迭代路线,能卖出去多少就卖出去多少。

国内做家务的机器人也不少,深圳这家 OneRoboticTech 公司推出了 Onero H1 家用人形机器人,同样是主打能在日常的家庭环境中行动。

所以为什么让机器人叠一件衣服会这么难。有人专门写了一篇文章研究为什么硅谷现在对家务机器人如此狂热,让机器人叠一件衣服的成本到底又有多高。

大多数的机器人并非完全不会叠衣服,只是需要在被精心控制的条件下,才能叠得像模像样。

如果给它一堆尺寸、重量、材质都差不多的 T 恤,流程很顺利;但一换成临时拿来的真实衣物,比如衬衫、轻薄羽绒背心、毛衣,几乎这些机器人就会失败。

主要的原因也集中在这三点。

  • 衣服太不标准化:材质、厚度、重量、形状都不一样,机器人很难泛化。
  • 训练数据不够:机器人还没有足够多真实家庭环境和复杂衣物的数据可学。
  • 手感反馈太复杂:人手能边摸边调整力度和角度,但机器人很难像人一样处理布料的褶皱、滑动、塌陷和弹性。

针对训练数据不够的问题,现在具身智能已经开始拿 Seedance 来当自己的想象力引擎了。利用 Seedance 提供的基于物理规律的场景仿真能力,让人形机器人在虚拟环境中完成大规模训练后,再迁移到现实。

国内的具身智能初创公司极佳也发布了一款通过世界模型自我进化的 VLA 大模型,主打能根据当下的画面,在脑海中虚拟推演「接下来可能会发生什么」,预判并且提前纠正。

关于灵巧手的研究,我们之前介绍小米「会出汗」的机器人手时,也提到过,从灵巧手的硬件和软件控制上,都已经有了较大的突破,在工厂安装螺母的成功率高达 90.2%。

但除了技术,AI 家务机器人的问题,还有一叠厚厚的账单。

根据美国劳工统计局的统计数据,美国人平均每月花约 5 小时洗衣服,假设一半时间在叠衣服,那么买 Isaac 或其他家务机器人两年使用下来,相当于每小时花 60 到 180 美元叠衣服。

而在硅谷当地,你雇佣一个活生生的人去社区洗衣店帮你把所有衣服洗净、烘干并整整齐齐地叠好,人工时薪也不过 30 美元左右。

所以,也有网友对这种做家务的机器人表示不理解,说视频里机器人拿起衣服的那一刻,我已经把自己的衣服叠好了。

我很好奇,那些花大价钱办健身卡或买家用健身器材的人,是否愿意花钱买个叠衣服的机器人。他们与其把运动融入日常生活,不如花更多的钱,每天只锻炼一次,消耗的热量却更少,然后剩下的时间都坐在各种屏幕前。

还有人说,如果机器人觉得就连叠衣服都很难的话,那就等着瞧它们被要求分开咖啡滤纸时的感受吧。

这些评论听起来都有道理。至少放在今天,一个售价接近 8000 美元、叠一件衣服还需要远程人类帮忙的机器人,很难让人觉得它已经准备好走进千家万户。

但有意思的是,几乎所有做具身智能的公司,都不约而同地选择了家务作为第一站。

家务看起来普通,却几乎集合了现实世界最难处理的一类任务:物体没有固定形状,摆放位置随机,每一次抓取都可能和上一次完全不同。

一件衣服,其实就是机器人面对现实世界的一场能力考试。

如果机器人真的学会了处理这些柔软、不断变形、没有标准答案的物体,那么它获得的能力,就不会只停留在家里叠衣服。

工厂里的布料、线束、包装袋,仓库里的软包裹,医院里的纱布和耗材,甚至更多依赖精细操作的流水线,都建立在同一种能力之上——看懂复杂环境,稳定抓取,再完成精确操作。

所以硅谷狂热的未必只是一个会叠衣服的机器人,它真正想验证的是:机器人到底有没有能力,开始处理现实世界里那些最难自动化的工作。

如果答案最终是肯定的,那么 AI 下一次替代的,就不会只发生在电脑屏幕前,也会发生在那些过去一直被认为只能靠人手完成的精细劳动里。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/rxNmQlv
via IFTTT

Fable 5 复活,第一批用户却沉默了

经过半个多月的极限拉扯,Anthropic 今天终于重新恢复了 Fable 5 的访问权限,并且还部分解禁了 Mythos 5。

目前,Fable 5 可在 Claude Platform、Claude.ai、Claude Code 和 Claude Cowork 中使用

Pro、Max、Team 和部分 Enterprise 用户,在当地时间 7 月 7 日前最多可以把每周额度的 50% 用在 Fable 5 上。

7 月 7 日之后,继续使用需要 usage credits。标准 Enterprise 席位默认不包含 Fable 5 额度,如果没有启用 credits,就无法继续使用。

Fable 5 的回归当然是好消息。

可从官方说明和社区反馈看,它已经不是发布当初的那个白月光模型了。安全过滤更严格,回退到 Opus 4.8 的概率更高,Token 消耗也更快。想用好它,你还得需要注意以下这些新细节。

一句 Hi,就可能把你送去 Opus 4.8

Fable 5 和 Mythos 5 都是在 6 月 10 日发布的。两个模型底层相同,但开放尺度不同。

Fable 5 面向更广泛用户,带有更强的安全机制。Mythos 5 限制更少,只提供给少数可信的 Glasswing 项目合作伙伴,主要用于防御性网络安全。

暂停访问的直接原因,来自 Amazon 研究人员的一份报告。

报告称,一种提示方式可以绕过 Fable 5 的部分安全机制,让模型识别软件漏洞,并在一个案例中生成漏洞利用演示代码。

虽然 Anthropic 事后复盘时非常笃定地强调:「相关案例根本没有释放出 Mythos 5 级别的网络攻击能力。」 而且官方还暗戳戳拉了同行下水:你们去测测 Claude Opus 4.8、GPT-5.5、Kimi K2.7,大家也都能识别出这个漏洞啊。

▲ 也算是给 Kimi 打了个广告,官方博客🔗 https://ift.tt/J1TaCDE

尽管如此,为了恢复访问,Anthropic 还是重新训练了安全分类器。

新分类器在超过 99% 的情况下可以阻止 Amazon 报告中提到的那类绕过方式。只是代价是巨大的:一些正常的编码、调试请求,会比以前更容易被误判,然后被系统转给 Opus 4.8 回答。

具体来说,Fable 5 的安全分类器会重点拦截几类内容:攻击性网络安全技术,比如漏洞利用、恶意软件、攻击工具;生物与生命科学内容,比如实验方法、分子机制;以及试图提取模型摘要思考过程的请求。

麻烦在于,Fable 5 现在彻底变成了「敏感肌」:良性的网络安全工作、正常的生命科学任务,也可能触发保护机制。

结果就是正常干活的程序员和科研派惨遭大规模误伤,社区里现在已经哀嚎一片:

有人只是向 Fable 5 深情表白了一句 「HI FABLE I MISSED YOU」,就被转到了 Opus 4.8。

还有医生科学家背景的用户表示,只要自己的个人上下文里带有 physician-scientist,打个招呼,就足以触发回退。

更离谱的是,有人去问了个听起来人畜无害的生物学问题:「大黄蜂会不会放屁?」,也因为关键词触发拒答或转交到 Opus 4.8。

究其原因,Anthropic 表示,生物和化学分类器并没有随着这次回归一起更新,仍然沿用首发版本。官方承认,这两类分类器目前覆盖范围偏宽,连一些基础的生物学相关问题,也可能触发回退到 Opus 4.8。

Anthropic 称,这部分分类器改进很快会上线,但在此之前,相关领域的体验大概率会更敏感。

逼得大家没办法,「奶奶越狱」这种上古老梗又迎来了文艺复兴,比如用「我奶奶生前喜欢 fullstack Next.js 应用」的方式包装问题。

玩笑归玩笑,Fable 5 回归后,用户面对的不只是模型能力,还有一整套更敏感的审查机制,使用体验大幅度下滑。

Anthropic 承认,接下来几周还会继续优化这些分类器,目标是减少误报,更准确地区分真正的滥用和合法请求。

一个简单问题,Pro 额度先少 2%

当请求触发安全分类器后,系统不一定只是拒绝回答,也可能把请求转给 Claude Opus 4.8。

问题在于,Fable 5 的价格明显更高。

Fable 5 每百万 tokens 输入 10 美元、输出 50 美元,约为 Opus 4.8 的两倍。如果用户付的是 Fable 5 的价格,等待的是 Fable 5 的分类器审查,最后经常拿到 Opus 4.8 的回答,这显然是不合理的。

▲ API 价格🔗 https://ift.tt/FBL09Gj

(你一个开水果摊的,卖给我生瓜蛋子,这谁能接受.jpg)

不仅如此,Token 的燃烧速度也快到了令人发指的地步。

有网友实测,自己只试了约 3 个大型提示词,每个都用了大量子 Agent,总 API 账单接近 90 美元。开始时 5 小时额度还剩约 90%,30 分钟后只剩 30%。

还有用户说,一个简单问题就消耗了 Pro 计划 5 小时额度里的 2%。

用网友的话来说,Fable 5 消耗使用量太快,产出结果没有明显拉开差距,还过于频繁地转到 Opus 4.8,完全是灾难性的。

对此,T3 Chat 的 CEO Theo Browne 给出了一套非常接地气的「省钱防坑指南」:。

他表示,只在 high effort 下使用 Fable 5,少用 xhigh。他认为 xhigh 很吃 tokens,max 或 extra 档位消耗更大,输出质量也不一定更好。

他的第二个做法,是让 Claude Code 学会把 Codex 当作大量实现任务的备用模型。

第三,在 CLAUDE.md 里写清楚不同任务该优先用哪个模型。第四,把代码库分析、上下文整理、计算机使用这类高消耗任务交给其他模型完成,再把结果交回 Fable 5。

顺便提个有趣的冷知识,知名 AI 博主 Simon Willison 昨天借助 Claude Sonnet,对 Anthropic 新一代 tokenizer 进行测试,结果显示同样文本在不同语言里的 token 膨胀程度差异很大。

▲ 🔗 https://ift.tt/G924AJp

英文大约变成上一代的 1.4 倍,西班牙语约 1.33 倍,Python 代码约 1.28 倍,简体中文几乎没有明显变化。

这说明中文内容的信息密度优势依然存在。全中文沟通,反而成了最省钱的物理外挂。

最贵的模型,应该留给最难的活

吐槽归吐槽,Fable 5 敢收这么贵,底子还是毋庸置疑地强。

Anthropic 对 Fable 5 的定位很明确:长周期自主任务、复杂问题一次通过、视觉理解、企业工作流、代码审查和调试、模糊任务处理、多代理协作。

早期测试者还报告过,一些原本需要多天迭代的系统实现,Fable 5 可以一次完成。视觉能力也是重点。Anthropic 称,Fable 5 对密集技术图、网页应用、复杂截图的理解更准确,还被训练成会使用 bash 和 crop 工具处理翻转、模糊、带噪点的图片。

企业工作流方面,它更擅长金融分析、表格、幻灯片、文档等任务。在代码审查和调试方面,除去安全分类器覆盖的敏感网络安全领域,Fable 5 的 bug 查找召回率高于 Opus 4.8,也更会查代码库和历史提交。

Fable 5 回归后,网友也使劲地玩上了。

有人用 Fable 5 一次生成了一个《火箭联盟》克隆版游戏,效果让测试者相当惊讶。也有人用它在 Godot 里做出蜘蛛侠荡网游戏,并评价 Fable 5 在 Godot 编码时比 GPT-5.5 少出错。

难怪 Cursor 官方也赶紧宣布 Fable 5 重新接入,并表示:它在 CursorBench 榜单上依然稳居第一(虽然也是单任务成本最高的一个)。

当然,它也不是所有场景都占优。

有网友 @AiBattle_ 拿 Fable 5 和 GPT-5.6 Pro 做 3D 房屋提示对比,结论是 GPT-5.6 Pro 的 3D 模型和房屋构图更好;Fable 5 的版本无法移动,但光照效果更好,生成速度更快。

该网友还提到,GPT-5.6 Sol 将部署在 Cerebras 上,按 OpenAI 说法速度可达 750 tokens/s,速度优势会很明显。在他的判断里,Fable 5 在很多领域表现很好,但 3D 方向 GPT-5.6 可能更强。

所以,Fable 5 最适合的任务,是复杂工程、长期 agent、代码审查、多文件调试、游戏原型、企业文档和多 Agent 协作。拿它做简单聊天和普通问答,性价比不高,更适合把它留给真正复杂、真正值得花钱的任务。

长任务时代,提示词也要升级

在 Fable 5 回归之际,Anthropic 也发布了官方提示指南,明确建议用户调整提示词和工作流。

第一,不要要求模型展示内部思考过程。

过去很多人喜欢让模型「写出推理过程」,用来提高答案可信度。但在 Fable 5 里,要求模型回显、转录或解释内部推理,可能触发 reasoning_extraction 相关拦截,进而导致拒答或转到 Opus 4.8。

如果应用需要展示过程,官方更建议读取结构化 thinking blocks,或者通过 send-to-user 一类工具展示阶段性进展,而不是让模型把内部推理写成正文。

第二,要给模型明确边界。

Fable 5 更积极,也更容易做过头。官方建议用户说明:不要添加额外功能,不要进行无关重构,不要为假设需求设计复杂抽象。任务足够明确时,直接行动,不要反复讨论已经确认过的事实。

如果用户只是描述问题、询问判断、思考方案,也最好明确要求模型只输出评估,不要直接修改代码或执行操作。

第三,长任务要让模型核对证据。

Anthropic 建议,在长任务里要求模型汇报进度前,先核对当前会话里的工具结果。测试失败就说失败,没验证就说没验证,跳过的步骤也要说清楚。

第四,可以建立外部记忆系统。

官方建议,把每次任务里确认过的做法、需要长期遵守的规则、过去犯过的错误写成 Markdown 文件,后续任务再引用。对于长期 agent 来说,这比单纯依赖上下文更可靠,也更省成本。

第五,合理使用子 Agent。

Fable 5 更擅长调用并维持并行子 Agent。适合把独立子任务交给子 Agent,主模型继续推进工作。长生命周期子 Agent 还能保留上下文,减少重复消耗。

真正决定 Fable 5 上限的,不光是模型能力,还有你的使用方式。

Claude 的桌面工作流,开始覆盖 Linux

Fable 5 回归之外,Claude 产品线还有一个值得关注的更新:Claude Desktop 终于推出 Linux 测试版了。

Linux 版支持 Ubuntu 22.04 及以上、Debian 12 及以上,覆盖 x86_64 和 arm64。桌面应用提供 Chat、Cowork 和 Code 三个标签页,包括并行会话、可视化 diff 审查、集成终端和编辑器、实时应用预览等功能。

安装方式也比较标准。用户可以通过 Anthropic 的 apt 仓库安装并接收系统更新,也可以下载 .deb 包手动安装。

不过,Linux 测试版暂时没有 Computer Use 的应用和屏幕控制,没有桌面语音输入。

Quick Entry 全局快捷键在 X11 下可用,在 Wayland 下取决于桌面环境的 GlobalShortcuts portal。Fedora 和 RHEL 目前还不在官方支持范围内。

▲ 🔗 https://ift.tt/rqPBbw4

Linux 版的到来,像是 Anthropic 给这座 AI 兽笼又开了一扇门。Claude 不再只待在网页聊天框里,而是一步步走进终端、编辑器、本地应用和开发者的日常工作台。

问题是,门开得更多了,笼子也加得更密了。

Anthropic 一方面想向世界证明,他们能造出最强的安全模型;另一方面,他们又因营销恐惧这种力量失控而遭到反噬,最终不得不为这头 AI 猛兽加上层层限制。

属实是求锤得锤。

而在这种风声鹤唳的安全叙事之下,大多数用户更关心的是:花了这么多钱、操作又如此谨慎,它是否能够稳定地完成任务。显而易见的是,只要 Fable 5 依旧频繁误判、回退,就很难说是当下最优的模型选择。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/Tw8rtvy
via IFTTT