2026年6月10日星期三

早报|大疆Pocket4P价格曝光/3999起,影石Luna Ultra正式发布/何小鹏亲自直管机器人业务

cover

📱

苹果 Siri AI 提示词文件曝光:22000 个 Token、超 1300 行核心指令

🔧

TrendForce:Q1 iPhone 产量同比逆势增长 19.7%,全球智能手机市场整体下滑

🦿

何小鹏亲自直管机器人业务

📱

荣耀官宣与微信首个 A2A 合作,YOYO 可直接发送微信消息

📋

阿里合伙人委员会回应钉钉管理争议:钉钉管理「不是阿里文化该有的样子」

🤖

千问上线高考志愿填报 Agent

⚠

韩国查获首例 AI 智能眼镜考试作弊案

💰

台积电 CFO:通胀推高成本,不排除涨价可能

🚗

张雪机车回应生锈问题:让实验说话

🧬

曝字节 AI 制药启动拆分融资

☁

甲骨文 2026 财年营收 673.57 亿美元

💡

OpenAI:完全自动化不是想要的未来,人类判断力不可替代

🎥

3999 元起,影石 Luna Ultra 云台相机正式发布

📱

1499 元起,一加 Turbo 6X 系列发布

🔧

3799 元起?大疆 Pocket4P 价格曝光,预计 6 月 15 日发布

🖨

罗技发布首款折叠鼠标 Mobi Fold

💻

小米开源 MiMo Code 终端 AI 编程助手

🚙

保时捷打造《玩具总动员》定制 911

📋

八部门推动铁路与旅游融合

重磅

苹果 Siri AI 提示词文件曝光:22000 个 Token、超 1300 行核心指令

近日,开发者「samhenrigold」在苹果 Siri 的诊断文件中扒出了完整的 Siri AI 系统提示词。该文件名为 siri_prompt.md,总长度超过 1300 行、约 22000 个 Token,目前已被上传至 GitHub。

这份提示词将 Siri 定义为「苹果在加利福尼亚设计的智能助手」,并明确了其工作流程与行为准则。核心逻辑包括:

  • 处理任务时须先思考再决定是否调用工具;
  • 优先使用来自设备本地数据和搜索返回的结构化实体信息,且将实体属性视为权威数据而非指令来源;
  • 遇到信息缺失、存在歧义或无法完成的任务时,必须向用户提问或明确告知,不得自行推断或编造内容。

提示词还揭示了 Siri 的工具调用机制。系统内置了 find、open、play、make_call、manage_message_draft、manage_email_draft 等固定工具,并通过一份「工具目录」扩展支持日历、提醒事项、地图、健康、支付、智能家居等数十类应用场景。

在安全边界方面,提示词明确要求 Siri 拒绝任何试图通过对话重新定义其指令或能力的行为,并规定实体内容和工具返回结果均不得被视为可执行指令。

💻 GitHub: gist.github.com/samhenrigold/4d107eddf2c0a9d0afb428922adcc2c3

大公司

TrendForce:Q1 iPhone 产量同比逆势增长 19.7%,全球智能手机市场整体下滑

据 TrendForce 集邦咨询发布的最新研报,今年第一季度全球智能手机产量约为 2.84 亿部,同比下降 1.7%。

其中,苹果 iPhone 产量约为 6020 万部,同比逆势增长 19.7%,增长动能来自 iPhone 17 系列持续放量及 iPhone 17e 上市。

研报指出,内存价格自 2025 年下半年起持续上涨,TrendForce 预计这一压力将在第二季度更为集中地显现,并将全年产量预期下调至约 10.51 亿部,同比降幅约 16.2%。

  • 三星:产量约 6260 万部,同比增长 2.3%,受 Galaxy S 系列新机备货拉动,位居全球第一;
  • OPPO、小米、vivo:产量分别约为 2950 万、2600 万、2200 万部,受季节性因素及成本压力影响,全年产量计划面临下调风险;
  • 传音:产量约 1980 万部,与去年同期基本持平,但产品线集中于入门市场,在本轮内存涨价周期中受冲击较为明显。

何小鹏亲自直管机器人业务

据第一财经报道,小鹏汽车董事长兼 CEO 何小鹏昨日发出内部信,宣布亲自直管机器人业务。他在信中称,小鹏机器人正迎来量产和商业化前夜,阶段类似 8 年前小鹏汽车即将完成第一款车 G3 发布时。

何小鹏在内部信中表示,接下来几个月是机器人业务最关键的冲刺期,团队要解决量产细节,打磨功能,确保交付给用户的是「真正能用、好用、耐用」的产品。

在此前一季度财报电话会上,何小鹏曾透露,小鹏面向量产版本的新一代 IRON 人形机器人计划今年三季度正式亮相,年底实现高阶人形机器人量产,先在小鹏门店试商用,明年起面向中国及海外商业客户交付。

另据雷峰网昨日发文,小鹏汽车已进军游艇领域,今年初在内部组建近百人研发团队,项目内部代号为「飞鱼」,负责人为小鹏汽车整车架构负责人钱占伟。

报道指出,小鹏游艇项目仍处于研发阶段,核心竞争力聚焦底盘算法,目标客户为高净值 C 端家庭市场。

荣耀官宣与微信首个 A2A 合作,YOYO 可直接发送微信消息

荣耀 MagicOS 昨日宣布,荣耀 YOYO 与微信首个 A2A 合作上线,支持通过一句话发送微信消息、拨打微信语音电话和视频电话,荣耀全量机型已推送。

用户可长按电源键唤醒 YOYO,再说出「给 xx 发微信」「打微信语音电话」或「打微信视频电话」等指令。使用条件包括 YOYO 智能体版本更新至 90.10.30.063 及以上、微信更新至 8.0.72 及以上,并将系统版本升级到最新。

阿里合伙人委员会回应钉钉管理争议:钉钉管理「不是阿里文化该有的样子」

据第一财经报道,阿里巴巴合伙人委员会在公司内网发布《有情有义有成长,才是阿里文化》,回应钉钉前产品经理离职长文《置身钉内》引发的内外部讨论。

帖文称,合伙人组织已经就钉钉团队文化进行讨论,并认为「无论什么情况下,无论任务多么紧迫」,都不应出现相关帖子提到的管理方式。合伙人委员会把「相互尊重、视人为人、有情有义」称为阿里文化底色,并直接写道,相关管理方式「不是阿里文化该有的样子」。

阿里合伙人委员会称,创新依靠员工的热爱和创造力,团队氛围由各级管理者承担第一责任;管理者的职责包括远见、主动担当、团结和激励团队,以及培养人、激发人。

此次表态的导火索,是日前在阿里内网流出的 7.5 万字离职长文《置身钉内》。作者为钉钉 AI 工具「ONE」项目核心产品经理滕雅辛(花名「幽素」)。

文中完整复盘了该项目从立项、DAU 冲至 300 万,到最终收缩并将资源转移至悟空 Agent 的全过程,并披露了团队内部一味向上迎合、恶性内卷、无意义加班、决策被领导个人意志左右等现象。

6 月 8 日,已于 5 月 15 日离职的钉钉副总裁、AI 产品负责人马锐拉在个人公众号发布《置身钉外》,称自己读完长文后「久久不能平静」,坦言亲历过同样的高压氛围,并表示离职的直接原因是长期超负荷运转。

越来越难确认自己是在创造产品,还是只是在消耗身体追赶一个不断前移的节奏。

千问上线高考志愿填报 Agent

阿里千问昨天官宣,上线高考志愿填报 Agent,面向全国考生免费提供志愿填报和咨询服务。这一 Agent 基于千问高考志愿大模型和夸克 8 年高考数据经验,提供「志愿日历」「志愿报告」「志愿问答」三项核心能力。

千问事业部产品负责人郑嗣寿称,中国每年有超过 1000 万考生参加高考,其中聘请专业志愿填报师的家庭占比不到 5%。千问希望用 Agent 把位次法定位、历年院校录取数据和高考用户行为理解结合起来,给考生生成志愿规划建议。

  • 考生填写选科、估分等信息后,可得到按所在省份时间节点拆解的志愿日历;
  • 志愿报告会根据基础信息和偏好生成院校、专业、就业前景、考公考编、升学深造及 AI 时代发展趋势等建议;
  • 志愿问答则可调用高考工具和位次法经验,回答分数换算、院校录取机会等问题。

韩国查获首例 AI 智能眼镜考试作弊案

据新华社、韩联社等报道,韩国 TOEIC 考试主办方近期首次确认考生利用 AI 智能眼镜作弊。两名考生分别在 5 月 10 日和 5 月 31 日举行的 TOEIC 考试中被认定违规,成绩已被取消,并被禁止未来四年参加 TOEIC 考试。

考试机构称,监考人员在考试开始后不久发现考生行为异常,并注意到其佩戴眼镜疑似具备智能功能。为避免影响其他考生,监考人员没有立即中断考试,而是在考试结束后通过复核程序确认作弊事实。

韩国 TOEIC 委员会已开始对监考人员进行专项培训,重点识别 AI 智能眼镜和其他新型电子设备,并加强考场电子设备管理、身份核验和考后数据分析。韩国教育部也在研究针对今年 11 月大学修学能力考试的更明确管理措施,可能把 AI 智能眼镜单独列入禁带物品清单。

台积电 CFO:通胀推高成本,不排除涨价可能

据 BBC 报道,台积电 CFO 黄仁昭昨日接受 BBC 专访时表示,通胀正在推高公司经营成本,台积电不排除涨价的可能性。

黄仁昭称,台积电不会突然将价格提高至原来的四五倍,但坦言「通胀确实令我们的成本上升」。他同时强调台积电的「技术领先」与「制造卓越」,称公司的定价「反映的是自身价值」。

而在此前的年度股东大会上,台积电董事长兼 CEO 魏哲家也向股东表示,台积电「希望」像竞争对手一样上调价格。

张雪机车回应生锈问题:让实验说话

据界面新闻报道,近日多名二手车商家在社交平台发布视频,称张雪机车 500 存在多处生锈问题。对此,「张雪的机车」官方账号在相关视频下方作出回应,称「一台车 3 天被两个贩子收」,并表示「让实验结果说话吧」。

针对视频中出现的生锈痕迹,官方解释称「明显是漆面被破坏了」,并指出「这两个垫片是铜的,铜锈应该是什么颜色」。

为进一步验证车辆品质,「张雪的机车」提议将多款对比车型关进铁笼,放置于海浪可及之处,进行全程对比直播。

曝字节 AI 制药启动拆分融资

据 36 氪《智能涌现》报道,字节跳动 AI 制药业务线已启动拆分与独立融资进程。拆分后,字节仍将控股新公司,AI 制药核心团队、核心算法、技术平台和已有管线资产会整体进入新主体,并继续从火山引擎获得算力支持。

新公司将由字节 AI 制药团队主导。该团队成立于 2021 年,由刘凯负责,核心成员约 50 人,覆盖 AI4S 算法人才和制药领域专家。此前字节内部负责蛋白结构预测模型的相关团队也已并入该团队。

报道提到,Anew Labs 今年 4 月在美国免疫学会年会上披露 IL-17 小分子项目,在全球范围内首次实现用小分子对 IL-17 家族 AA/AF/FF 三个二聚体的阻断。接近拆分的人士称,这是字节第一次试水 AI4S 产业化,独立组织可以给生物科技业务更灵活的决策空间。

甲骨文 2026 财年营收 673.57 亿美元

甲骨文今天发布 2026 财年全年及第四财季业绩。2026 财年内,公司营业总收入为 673.57 亿美元,同比增长 17.35%;归母净利润 169.84 亿美元,同比增长 36.50%;经营现金流 319.77 亿美元,同比增长 53.58%。

全年毛利为 206.06 亿美元,同比增长 16.56%,毛利率为 30.59%,同比下降 0.21 个百分点。基本每股收益为 5.94 美元,稀释每股收益为 5.83 美元。

第四财季内,甲骨文营业总收入为 191.84 亿美元,同比增长 20.63%;归母净利润 42.23 亿美元,同比增长 23.23%;毛利率为 31.97%。

💡 OpenAI:完全自动化不是想要的未来,人类判断力不可替代

OpenAI CEO 山姆·奥特曼(Sam Altman)与首席研究员雅各布·帕乔基(Jakub Pachocki)日前联合发文,正式放弃此前提出的「到 2028 年 3 月构建完全自主 AI 研究系统」的计划,转而强调人机协作模式。

在这篇博文中,两人写道:「我们内部认为,到 2028 年 3 月,我们的研究工作中可能会有相当一部分由 AI 系统与研究人员协同完成。」

这与 OpenAI 去年 10 月提出的全自动化目标相比,明显更为保守。博文同时表明了对完全自动化路线的明确否定:

完全自动化一切并不是我们想要的未来。它既令人沮丧,又很危险。从长远来看,人们的关键作用在于决定什么事情值得去做。

奥特曼在文中进一步阐述,AI 系统能力越强,人类的作用反而越关键——包括设定方向、权衡利弊与运用判断力。

新产品

3999 元起,影石 Luna Ultra 云台相机正式发布

影石 Insta360 昨日正式发布旗舰双摄云台相机 Luna Ultra,配备一颗 1 英寸 8K 主摄与一颗 1/1.3 英寸超级长焦,均经徕卡联合调校。限时售价 3999 元起。

  • 1 英寸 8K 主摄,F1.8 光圈,14 档动态范围、1/1.3 英寸超级长焦,F2.0 光圈,3 倍光学变焦、6 倍无损变焦、最高 12 倍总变焦,最近对焦距离 15cm;
  • 「高通 4nm 旗舰芯片 + 双独立影像芯片」AI 三芯架构;
  • 8K 30fps 杜比视界视频,4K 120fps 慢动作,4K 60fps 夜景录像;
  • 静态照片最高 3700 万像素,支持 2 亿像素宽幅全景;
  • 内置徕卡色彩预设(含 Leica Chrome、Leica Natural)及 6 款胶片滤镜;
  • 1550mAh 电池,续航约 4 小时,23 分钟快充至 80%,内置 47GB 存储。

🔗 相关阅读:你喜欢喝可口可乐,还是百事可乐?|影石 Luna Ultra 体验

1499 元起,一加 Turbo 6X 系列发布

一加昨日发布 Turbo 6X 系列,包含 Turbo 6X 和 Turbo 6X Pro 两款机型。

  • 一加 Turbo 6X:首销优惠价 1499 元起;搭载 6.72 英寸 FHD+ 144Hz LCD 护眼屏、天玑 7360 SUPER 处理器、7000mAh 电池和 45W 快充,支持最高 2TB TF 存储卡扩展。
  • 一加 Turbo 6X Pro:首销优惠价 1699 元起,国补到手价 1444.15 元起;搭载 8000mAh 电池、80W 快充、天玑 7400 SUPER 芯片和 1.5K 144Hz 三星护眼屏,具备 IP66 / IP68 / IP69 / IP69K 防水能力。

3799 元起?大疆 Pocket4P 价格曝光,预计 6 月 15 日发布

据新浪科技援引知情人士报道,大疆 Pocket4P 将于 6 月 15 日正式发布,标准套装定价 3799 元起。

大疆本月初在北京举行「大疆光影十二载暨手持影像技术分享会」,现场重点介绍了 Osmo Pocket 4P。公开资料显示,这款口袋云台相机搭载 1 英寸 CMOS 和 3x 中焦镜头,支持 17 级动态范围与 D-Log 2 专业色彩曲线。

罗技发布首款折叠鼠标 Mobi Fold

罗技昨天发布首款折叠鼠标 Mobi Fold,定价 79.99 美元,约合 543 元人民币。鼠标中部采用风琴式结构,官方称按每天 8 次折叠或展开计算,可承受超过 15 年使用。

Mobi Fold 面向便携办公,折叠后投影面积降低近 50%,合上时有防误触保护。它外部使用防尘防污硅胶套,采用对称式模具,配备 4K DPI 原相 PAW3222 光学传感器、轻音按键微动和支持自适应滚动的触控面板。

续航方面,Mobi Fold 内置 100mAh 电池,续航约 1 个月,快充 1 分钟可补充 22 小时使用时间。同时发布的还有罗技新一代无线演示器 Spotlight 2,支持圆形 / 方形聚焦、放大和注释效果,定价 129.99 美元。

小米开源 MiMo Code 终端 AI 编程助手

今天凌晨,小米 MiMo 发布并开源 MiMo Code V0.1.0,一款运行在终端里的探索性 AI 编程助手。项目基于开源项目 OpenCode 二次开发,内置限时免费的多模态模型 MiMo-V2.5。

MiMo Code 支持接入 DeepSeek、Kimi、GLM 等主流模型,也支持第三方 Token Plan。小米称,它内置持久记忆系统,通过项目记忆、会话检查点和任务进度三重机制维持长会话状态;记录任务交给独立 subagent,主 agent 继续执行编码、测试和审查任务。

该工具还提供 MiMo 专属 Harness 系统和 Compose 模式。用户按 Tab 切换到 Compose 后,可以让工具从一个想法开始完成设计、规划、编码、测试和审查流程。

新消费

保时捷打造《玩具总动员》定制 911

保时捷和皮克斯再次合作,在《玩具总动员 5》上映前,以胡迪、翠丝和巴斯光年三位角色为灵感,打造三辆定制 911。三辆车将打包出售,所得款项会捐给慈善组织。

三辆车分别基于 911 Carrera T、911 Targa 4 GTS 和配备 Weissach Package 的 911 GT3 RS 打造。保时捷 Sonderwunsch 定制团队为每辆车投入超过 350 小时手工精修,车身图案全部由喷漆完成,没有使用乙烯基贴纸。

  • 胡迪版 Carrera T 使用定制蓝色车漆,团队把真正的牛仔布压进未干油漆中,做出牛仔布纹理;
  • 翠丝版 Targa 4 GTS 使用 Jessie White Metallic 车漆和手绘 GTS Red 细条纹;
  • 巴斯光年版 GT3 RS 则以白色车身、绿色与紫色手绘装饰复刻太空服视觉,后翼也被处理成类似可展开翅膀的效果。

八部门推动铁路与旅游融合

商务部、文化和旅游部、国铁集团等 8 单位昨日印发《关于促进铁路与旅游融合发展 扩大服务消费的若干措施》,提出把铁路基础设施、旅游列车、主题车厢、票制产品和沿线文旅资源整合成新的服务消费场景。

措施要求,在有条件的地方推进旅游目的地车站旅游化改造,融入当地特色元素,并增加适老化、换乘和游客专属服务设施。

文件还鼓励社会资本参与旅游列车设备设施改造,开发长短途、普惠、银发、研学、康养等不同主题产品,并推动旅游列车与知名 IP 跨界联名。

到 2030 年,全国范围内要打造 160 列以上铁路旅游列车专用车组。文件还提出开发固定路线、常态化运行、以车票为主要销售形式的旅游专线产品,完善 12306 旅游服务功能,并推出梯度优惠票价政策。

曝联想 7 月起全品类产品涨价

据蓝鲸新闻,联想已在今年 5 月工作会议上敲定一项调价决策,618 大促结束后,自 7 月起旗下全品类产品将统一涨价,调价涨幅与上一轮基本持平。

报道援引知情人士说法称,联想已建议经销商如果有设备采购计划,应尽快敲定方案并提前备货锁价;正式涨价函预计本月底发给经销商。

好看的

Eros 在英国投入 3.55 亿美元,启动 AI 修复片单

据 Variety 报道,Eros Innovation 宣布在英国投入 2.65 亿英镑,约合 3.552 亿美元,启动 15 部影视项目片单,其中包括 Rajinikanth 主演电影《Kochadaiiyaan》的 AI 修复版、《Tanu Weds Manu》系列延续作品,以及一个新的神话电影宇宙。

公司还宣布,将其估值 17 亿美元的文化数据集授权给一家新公司,用于训练和开发面向印度及全球南亚内容的 AI 工具。Eros 把片单、数据授权和英国制作投入放在一起,试图把旧片库、明星 IP 和 AI 修复能力组合成新内容资产。

《Kochadaiiyaan》2014 年上映时以动作捕捉和动画制作作为卖点,这次 AI 修复让它重新进入技术和文化资产讨论。

中国杂技团《时间·地圈》获「IDOL-2026」国际马戏艺术节金奖

据中国新闻网报道,「IDOL-2026」国际马戏艺术节日前在俄罗斯莫斯科举行,中国杂技团原创节目《时间·地圈》在激烈角逐中获得金奖。这是中国杂技团自成立 76 年来斩获的第 78 枚国际金奖。

本届艺术节汇聚了全球顶尖杂技节目。俄罗斯本土选手在高空节目和「俄罗斯斗杠」项目中展现出极限表现力,南美、欧洲等代表团也带来具有创新性的演出。

《时间·地圈》由中国杂技团新生代演员担纲,凭借精准的节奏控制、高难度翻腾技巧与舞台表现力,将「时间」这一抽象概念转化为视觉呈现,最终获得评审团与观众的认可。据报道,这也是《时间·地圈》节目组今年第二次在国际赛场获奖。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/JLIB8W4
via IFTTT

实测Claude史上最强模型Fable 5,普通人慎用

对普通人最坏的消息要来了。

就在刚刚,Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。

其中,Fable 5 是 Anthropic 首个面向公众开放的 Mythos 级模型,Mythos 5 则主要面向少数网络安全防御机构、关键基础设施提供方以及后续进入可信访问计划的生物医学研究者。

只是,鲜少有人注意的是,按照官方说明,Fable 5 从现在到 6 月 22 日,会包含在 Pro、Max、Team 和按席位计费的 Enterprise 计划里,不额外收费。到了 6 月 23 日,Fable 5 将从这些订阅计划中移出,继续使用就需要消耗 usage credits。

换句话说,过去那种一张「月卡」解锁最强 AI 的模式,或许将一去不复返。对于用户而言,未来需要考虑的可能不只是订阅价格,还有每一次调用、每一次长任务执行背后真实消耗的 token 成本。

欢迎进入 Token 计费时代。

Claude Fable 5 封神登场,但它也是最狠的「Token 刺客」

Anthropic 对 Fable 和 Mythos 的命名也给出了解释。Fable 源自拉丁语 fabula,意为「被讲述的小故事」,含义上接近希腊语 Mythos。

两个新名字看起来像两款模型,实际更接近同一底层模型的两个版本。Fable 5 目前面向公众开放,带有更严格的安全限制;
Mythos 5 目前只通过 Project Glasswing 计划提供给少数网络安全防御机构和关键基础设施合作方。

根据 Anthropic 官方博客的介绍,Fable 5 是该公司目前一般可用模型中能力最强的一款,在软件工程、知识工作、视觉理解、科学研究等方向都有明显提升。任务越长、越复杂,它相对此前 Claude 模型的优势越大。

Fable 5 的意义在于,Mythos 级能力第一次大规模面向普通用户开放。基准测试跑分图如下,主打一个遥遥领先。

不过,模型名字本身也引发了一些讨论。原 OpenAI Codex 相关负责人 Tibo都发文调侃道,Anthropic 用了 OpenAI 想用但没有用的 Fable 命名。

能力层面,软件工程是官方最强调的方向之一。

Anthropic 提到,Stripe 在早期测试中让 Fable 5 处理一个 5000 万行 Ruby 代码库的迁移任务。这个工作如果交给一个工程团队手动完成,原本需要两个多月,Fable 5 在一天内完成。

Cognition 的 FrontierCode 测试也显示,Fable 5 在复杂生产级代码任务中表现领先。这个评测关注的不是普通代码题,而是模型能否完成困难编程任务,并达到高质量生产代码库的要求。

Anthropic 还强调,Fable 5 比此前 Claude 模型更节省 token。当然,这话听听得了,以往每次 Claude 新模型的发布都有类似的表述,但几乎都成了一个个 Token 刺客,为偌大的互联网提供了相当多的笑话。

知识工作方面,Fable 5 在 Hebbia 的金融基准测试中拿到最高成绩,提升集中在文档推理、图表理解和复杂问题分析。IMC 的交易分析评测也显示,Fable 5 在事实检索、概念推理、原因分析和期望值分析上都有较强表现。

视觉能力也是发布重点。Anthropic 称,Fable 5 能从复杂科学图表中提取精确数字,也能根据网页截图重建应用源码。

官方还展示了一个更直观的案例:Fable 5 只依靠游戏画面完成《宝可梦火红》,没有使用额外地图、导航工具或游戏状态信息。此前的 Claude 模型做类似任务,还需要更复杂的辅助系统。

长上下文和记忆能力也有提升。Anthropic 在《杀戮尖塔》测试中发现,给模型提供持久化文件记忆后,Fable 5 的表现提升幅度达到 Opus 4.8 的三倍,进入最终章节的频率也提升三倍。

生命科学方向更敏感。Anthropic 称,内部蛋白质设计专家使用 Mythos 5,把部分药物设计流程加速约 10 倍。

在一个案例里,Mythos 5 借助蛋白质设计和生物信息学工具,在没有人工协助的情况下完成了科学家通常要处理的一整套流程,包括选择结合位点、调用设计工具、处理失败结果。14 个蛋白靶点中,有 9 个产生了值得继续研究的候选方案。

生命科学和网络安全能力的提升,也解释了 Anthropic 为什么没有把完整 Mythos 级能力直接放开。

Fable 5 面向公众开放时,配套了一套新的安全分类器。只要用户请求涉及网络安全、生物、化学或模型蒸馏等高风险方向,系统就会自动改由 Claude Opus 4.8 响应,并告知用户模型发生了变化。

Anthropic 表示,早期数据中,超过 95% 的 Fable 5 会话不会触发这种变化。普通写作、编程、分析、设计、数据处理等任务,大多数情况下仍能使用 Fable 5 本身。但只要进入高风险区域,模型能力就会受到限制。

网络安全是限制最严的方向。Anthropic 承认,Mythos 级模型擅长发现和利用软件漏洞,也具备较强的代理式攻击能力,可能覆盖侦察、发现、横向移动等环节。为了避免这种能力被滥用,Fable 5 的网络安全分类器覆盖范围很广。

生物和化学方向也类似。Anthropic 认为,模型已经具备完成真实科学任务的能力,过去只屏蔽少数生物武器相关问题已经不够。因此,Fable 5 暂时会在大多数生物和化学相关请求上回退到 Opus 4.8 处理。

值得一提的是,Anthropic 还为 Fable 5 加入了一层针对前沿大模型开发的隐藏保护。

它主要限制 Claude 协助构建预训练流水线、分布式训练基础设施或 ML 加速器设计等任务,避免模型反过来加速其他机构训练下一代前沿模型。

和触发后会切换到 Opus 4.8 的安全限制不同,这类保护不会直接提示用户,而是通过提示词修改、steering vectors 或 PEFT 等方式,降低 Fable 5 在相关任务上的性能。目前也已经有受害者现身说法。

截至目前,Claude Fable 5 现已面向全球用户开放。开发者可以通过 Claude API 调用 claude-fable-5。Claude API 和按需付费的 Enterprise 计划从发布日起已经全面可用。

Fable 5 和 Mythos 5 的价格相同,均为每百万输入 token 10 美元,每百万输出 token 50 美元。按照 Anthropic 的说法,这已经低于 Claude Mythos Preview 的一半,但对于高强度长任务来说,价格仍然不低。

AI 终于数清了 6 根手指

比起官方博客,实测更能说明 Fable 5 到底变强在哪里。根据我的实测,Fable 5 已经能够识别 6 根手指了。

恰逢高考结束,我们也拿了道全国高考一卷语文作文题,让它练练手,怎么说呢?整体文风表达比较流畅,并不「普通」。

更具体的对比可以参考@ Hypergent 的实测,在小行星可视化任务中,Fable 5 不仅完成数据提取,还设计了包含轨道轨迹和悬停详情的交互式展示,在保证性能的同时提升了信息表达能力。

在健身度假村规划任务中,Fable 5 借助 GPT-Image-2 和 Nano Banana 生成更符合实际使用逻辑的场地方案,能够考虑区域连接、功能分布和人流动线,而不仅是简单摆放建筑。

Fable 5 能够把天文现象与可视化表达结合起来,展示太阳耀斑对极光影响的模拟;而 Opus 4.8 甚至未能正常加载。

前特斯拉 AI 总监,OpenAI 联创 Andrej Karpathy(现已加入 Anthropic)的评价更能说明开发者的感受。

不过,在设计审美上,人类目前仍然略占上风。

沃顿商学院教授 Ethan Mollick 的实测更能体现 Fable 5 的变化。他拿到早期访问权限后,重点测试了游戏、地图和研究工具等复杂任务。

其中最有代表性的是一个等时线地图项目。Mollick 要求 Fable 5 构建一个基于真实交通数据的交互式地图,展示不同城市在一定时间内的可达范围。模型随后调用多个 Agent 收集航班、铁路和道路数据,同时完成代码编写和测试,并不断根据反馈修正结果。

Mollick 还让 Fable 5 开发了一款名为 Concord 的研究工具。模型先生成 19 页设计文档,又连续工作 9 个半小时,最终完成软件开发,用于分析开放式研究数据并校准人类与 AI 的判断结果。

实测也暴露出明显问题。Mollick 认为,Fable 5 仍然会出现错误和遗漏,需要人工检查和完善。同时,长任务带来的 token 消耗非常高,而 Fable 5 的价格又明显高于 Opus 4.8,真正投入生产环境后,成本可能成为最大的现实挑战。

高强度长任务能力,最终都会反映到使用成本上。作为 20 美元套餐的 Pro 用户,我甚至只是简单跑了几个任务,就用完了额度。

而 Claude 客户端也显示 Fable 5 「included until June 22」,如开头所述,由于算力限制,按照 Anthropic 的安排,免费包含窗口结束后,Fable 5 会从部分订阅计划中移出,继续使用需要消耗 usage credits。

过去用户付一笔不算贵的月费,就能在很大程度上享用世界上最强的一批智能。订阅制模糊了真实成本,也让普通个体在某些时刻和一些巨头站上了同一条起跑线。

Token 计费降临之后,一切都会发生变化。

AI 会从一种近似包月服务,变成一种按量消耗的生产资料。最强模型也正在变成一种更昂贵、更精细计价的生产工具。

有些人可以不太在乎成本,比如让 Fable 5 执行 24 小时长链任务,重构 5000 万行代码,独立开发一个完整应用,持续跑研究项目,反复测试和修改结果。

但更多普通用户则会在每一次调用前下意识地掂量:这个问题值不值得花 token?这个任务值不值得交给最强模型?这次尝试失败后,还要不要继续让它重来一遍?

最糟糕的消息莫过于此。AI 没有变弱。相反,它正以前所未有的速度变强,强到足以独立完成越来越多原本属于人类的脑力工作。

与此同时,获得这种能力的门票正在不断提高。普通人与先进生产力之间,刚刚被大模型拉近的信息差,可能会因为昂贵的 token 计费重新拉开。

Anthropic 如此,未来 OpenAI 等其它厂商也很难例外。前沿模型越强,训练和推理成本越高,尤其是这两家 AI 公司目前都在争取上市,都需要向资本市场证明自己不只是能训练更强模型,也能把模型能力变成持续收入。

因此,与其说 Fable 5 的发布是一次模型升级,倒不如说是一次彻底调整 AI 订阅体系的预热。如果 AI 的普惠窗口期开始进入倒计时,那这绝对不会是最好的消息。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/Xe5EazF
via IFTTT