2026年6月7日星期日

对话 MiniMax 择因:Agent 终会超过人类,我们又将何去何从?

Agent 的世界,四月还是山雨欲来。五月尚未结束,已然血雨腥风。

整个行业的加速快到不讲道理。Vibe Coding 已经不再是新名词,编程这条赛道也从未如此拥挤:Claude Code、Codex、Cursor 贴身肉搏,Trae、Qoder、CodeBuddy 杀成一团。

黑话一个接一个流行起来,支配所有人的注意力。去年还是 skill(技能)的天下,如今 harness(脚手架)站上了王座。

热词之下,模型已经卷到几近一条平直的线:不同的基准测试会给不同的答案,但总体来说,无论是 Opus、GPT,还是 Qwen、GLM、Kimi 和 MiniMax 们,无论是写代码还是执行越来越复杂的任务,都已不在话下。

模型之间仍然存在差距,但拉开模型公司之间真正差距的,早已不再是模型本身,而是套在外面的那层壳。

之前一份研究报告拆解了 Claude Code 泄露的代码,发现真正属于模型决策的代码只有 1.6%,剩下 98.4%,全是管权限、管上下文、兜错的 harness。

为了进一步发挥模型的优势,全新一代的 agent 产品如排山倒海而来。Grok Build、Qoder 1.0、TRAE SOLO 纷纷推出。连一直以来低调沉默的 DeepSeek 都挂出多岗位招聘,组建 agent 开发队伍。

早于业界布局 agent 的 MiniMax,在混战中落下自己的子。桌面端产品先是在 5 月中推出主打全新多 agent 编排架构的 Agent Team 功能。而随着 M3 旗舰模型,MiniMax 桌面端全面升级为 MiniMax Code,再次搅动了大厂、小龙云集的 agent 市场。

Agent Team 的内核是一套 Leader-Worker-Verifier(领导-执行-验证)的「对抗式」架构。负责干活和负责挑错的职责,被拆成不同的 agent,受到经过代码逻辑固化的状态机去管理,彼此之间上下文隔离。

这味药,治的是长程 agent 任务中那些出了名的顽疾:上下文污染、上下文焦虑、agent 之间的「共谋」。

有趣的是,正如前述 MiniMax 并没有等 M3 发布,而是率先在 M2.7 上就将 Agent Team 推了出来。M2 这一代,被 MiniMax 称为「大巧若拙」,模型和脚手架之间的共融共生已经看到了黎明前的曙光。预料之中,M3 只会更强。

近日 APPSO 与 MiniMax Agent  研发工程师择因(周淳辅)做了一场对谈。我们聊了  Agent Team 的设计原则及其所体现的 MiniMax 认知,探索了 Agent Team 的技术内核,浅析其它玩家对于 agentic 模型如何约束与放任。

业界有一种观点正盛:Anthropic 拥有最好的模型和最烂的工程。在择因看来,Anthropic 骨子里不信任模型,预设模型会作弊、耍小聪明,于是到处加以约束。OpenAI 的 harness 核心却是一个极简的 agentic loop。

一个极简框架养出了遵循度极好的模型,一个约束极强的框架却养出了「黑天鹅」。MiniMax 做 agent 的思路,既将两者融合,又不完全相同:要相信模型,给它和人一样的操作权限,但也要在脚手架中加入合理的约束。

这些思路在业界独树一帜,但业界追赶新东西并将之确立为共识的节奏,早已快过于新思想诞生的速度。在 agent 上,MiniMax 没有壁垒——没有任何人有。择因发给我一篇 71 页的论文,告诉APPSO:

「关于 agent 的所有东西,都在这篇论文里了。如果一篇就能说清楚,还有什么壁垒?」

但 MiniMax 仍有绝活。

他们力求以最快的速度不断向整个行业输出新的认知,做共识的领导者、执行者、验证者——这也是为什么 Agent Team 及其背后架构没等 M3,就公之于众了。

究其根本,中国模型公司的「开源」玩法不会一直持续下去。但这并不代表,优秀的认知不应该及时与世界分享。

就像一个 agent 的工作会有它的停止条件,开发 agent 的人们也有停止的那一刻。对于择因,可能会是当 agent 可以实现真正的自进化,并且在几乎任何数字或物理世界的任务上效率和成本优于人类。

从站在第一线的他的视角来看,我们离那个未来并不遥远。

以下是 APPSO与 MiniMax Agent 研发工程师择因的对话。卖个关子:在最后我们提出了一个开放性的问题,并获得了意想不到的答案。

架构即认知

APPSO:Agent Team 为什么没等 M3,直接在 M2.7 上就发布了?

择因:不用非等到和新模型一起发,是我们的意愿,也是自己的节奏,就是希望不停地把最新的认知传达给外界,这件事情很值得做。以及它在我们内部已经使用很久了,一个月的时间,我们觉得可以对外发布了。

APPSO:今天一切的周期都变得很快,一个月已经很久了。

择因:发布时我们模型还没迭代,但是有一批核心用户对我们的 agent 的运行范式感兴趣,所以我们提前发出去吸引他们。核心用户的建设对我们来说非常必要。后面我们也会考虑把我们的 Agent Team 架构开源出来。

APPSO:MiniMax Code 到目前为止的反馈如何?

择因:这次把订阅逻辑理顺了,订了 token plan 就能用 agent。一个多月下来,下载和订阅量有一个比较可观的增长。这其实很有意思,因为如果只是提供 API 的话,用户用模型的门槛高,使用效果也不是最佳。MiniMax Code 能让大家直接感受到模型的完全体,这也是我们一直以来的思路,这一次被验证了,我觉得很好。在 M3 上只会更好。

用户方面有个比较有意思的点,因为我们是全模态,发现很多用户拿 Agent Team 去做长视频生成,有古文爱好者用它来生成大量的诗朗诵音频。这些偏 C 端、兴趣向的使用案例,其实我们没有预料。

很多用户也告诉我们,当 Agent Team 被整个拉起来开始干活的感觉,给他们带来很大情绪价值。

APPSO:真的像是有了几个员工给自己打工的这种感觉?

择因:对。总体上看最近两个月的多 agent 产品,已经是血雨腥风。腾讯那个 (Marvis)「打工」感更强。很明显,在 Agent Team 的共识和落地方面,大家跟的都很紧。

APPSO:你说有人用 MiniMax Code 做视频,会不会以后可以不用专业视频生成工具,不用懂脚本、分镜、首尾帧,直接用 agent 调用全模态模型就能做视频了?

择因:首先明确一下,我说的是偏个人用户、爱好的角度做视频,我觉得是可行的。专业的视频制作,其实让一个 Agent Team 去做, 跑通打个样可以,但如果真的投入工业生产,还是需要分工。比如编导负责 idea、分镜、首尾帧这些关键的东西。给到另一帮人负责丢给海螺或 Seedance 抽卡。

但我认为随着模型能力提升,抽卡这部分的成本,以及后续剪辑的成本,会降得非常低。

我们调研了一下,发现今天让剪辑师剪视频其实比 AI 便宜。甚至市面上有一种服务,他把抽卡和剪辑都打包了,但价格主要是抽卡的成本,剪辑反倒不花钱。实际上他们找了一堆大学生上课学剪辑,交学费,课程任务就是给我把视频剪了。

APPSO:如果更强的模型出来,比如 M3,能比人工剪辑还便宜吗?

择因:我们的模型在能力上可以。但是你要算账的话,还是我刚说的套路,人的成本也会越来越低。

APPSO:MiniMax Code 的 Agent Team 架构,也就是 Leader-Worker-Verifier,听上去很合理,你们先做出来,然后 Claude Code 也跟进了。

择因:我们是从三月开始做的,一开始我和边上同事讨论,一个 agent,它一旦做错了,在上一轮轨迹里面它永远会记得自己做错了这件事。但转念一想,它如果接下来按对的方向去做,其实这段做错了的记忆它是完全不需要的,对不对?

基于这个想法,我们设计了这个新的架构:让干活的和负责验证的 agent 之间分开。验证的时候要有打回的机制,并且要让一个新的「脑子」去打回。

当月我们就把这套架构搭出来了,不过目前那个时候是主要内部使用,大家用得非常不亦乐乎。

APPSO:你们内部用的爽点具体是什么?是解决了之前的痛点,还是效率高、更不容易出错?

择因:我举个最简单的例子,比如你睡觉前给它派个任务,哪怕是极度复杂的工作,只要你卡控的够严格,你的准出标准可量化、可观测,而不是模型自己觉得可以就可以了——只要你做好这些门禁,这群 worker 和 verifier 就能在你睡觉的时候一直跑,睡醒之后就干完了。

可以说三月开始,这种新的开发节奏、新工作方式,就在我们内部出现了。

APPSO:这和传统依赖提示词的多 agent 编排的本质区别是什么?

择因:本质区别是我们的 Agent Team 架构做了一套复杂的自由度限制。

首先运行层面它是一个状态机,是确定性的代码,有严格的限制,它不能跳出这套规范,你可以把它理解为一个更严格的工作流 (workflow)。

在 agent 基建的层面,我们又给了极大的自由度。所有的 agent 之间都可以互相通讯,这和传统的 agentic workflow,有方向的流程图是完全不同的。当然,以前的 workflow 里面也可以带循环,但是核心还是这步走完了下一步。

我举个例子,比方说你用 agent 做开发,环境里少了某个包导致开发受阻,过去的 workflow 上可能就卡住了,而我们的 worker 或 verifier 发现了之后,它可以通过多种健全的机制通知其它 agent 别踩坑。

再比如一个研究类的任务,一开始的研究计划需要 leader 做些初步研究,过去 leader 分配完任务就停止了。但在我们架构下,如果用户有新点子、补充想法可以直接说,leader 能随时启动、去打断当前的 agent team、加一个新编排进去。Agent 工作流可以随时调整,剩下的重活都交给模型就行了。

以及大家知道强化学习逻辑下会出现「上下文焦虑」,当上下文过长模型就不想干活了——不干活就不犯错嘛。而我们这套逻辑让它更严格遵循编排,持续工作直到达到准出标准。

APPSO:你们如何让模型同源的 agent 实现对抗,避免共谋?择因:答案很简单,还是提示词。2026 年的大多数模型遵循能力足够强,提示词变得更可用。我们也会做一些提示词上的「雕花」行为,更重要的是给模型可观测的停止条件,让 worker 和 verifier 分别管理一些事情,比如 worker 的停止条件就是把活干完了,verifier 的停止条件是在干完的活里找到 bug。

APPSO:我的使用体验,有时候觉得可以交付了,但 agent 还在打过来打回去。你们怎么定义 agent 之间的对抗强度?太宽松肯定不好,太严格会无限循环。

择因:我们不会假定所有的用户生产场景,所以先把这套框架抛出来,用户可以自己去定停止条件。至于怎么定,可以通过 Skill,让 agent 根据用户对停止条件的倾向主动总结成 skill,下次运行任务就可以作为判断标准。这个 skill 肯定是千人千面的,不是我们来概括。随着用户长期使用,agent 会越来越懂用户。

我们在 M3 训练中也加入了类似数据,让模型具备主动性,去总结之前的轨迹,根据用户的反馈去提炼 skill,让工作更加可观测。随着模型能力提高,我们可以做得越来越多。

APPSO:MiniMax Code 的一大特点就是 agent 之间上下文隔离,很反直觉,你们是怎么想的?

择因:agent 上下文分为三部分:用户请求、环境里的生产资料、模型执行轨迹。比如当 agent 执行出了错,会把犯的错记下来,但这个记录对另一个 agent 可能是有害的。当上下文变得臃肿,这些轨迹一定会污染别的 agent。

长程 agent 任务跑出几个小时后,几乎全部的上下文都是执行轨迹,所以我们要隔离这一部分上下文。做这个设计就是因为我们预期 agent 会运行很久,既然大部分的信息都是不需要的,为什么不隔离?

APPSO:同时执行几个任务,通过微信、飞书跟 MiniMax Code 查询也不会「串台」,这个体验很独特,是怎么做到的。

择因:你可以理解为在 L-W-V 之外还有一个 IM agent。每个 agent 都有各自的启停触发,IM agent 的启动就是你给它发一条消息,它再去检查正在工作的其它 agent。

我们还有一些更宏大的交互层面的想法,就是所有功能都可以通过说来实现:目前的 agent 产品,比如 Cursor 还有代码编辑界面;豆包或其它 agent 还有各种具体功能按钮,比如新建任务、创建 skill、导入文件——我们觉得这些界面和按钮,以后都可以消失,你想让 agent 做什么只需要跟它说就行。

没有壁垒,全是共识

APPSO:为什么 Anthropic 一天到晚说自己模型多危险,作弊、耍小聪明?是模型没对齐好还是产品 harness 做的不够 robust?

择因:我觉得可能只是 Anthropic 在宣发上的倾向。从个人体感对比,GPT 5.5 明显比 Anthropic 模型干活更彻底,更具有主动性,在真正生产上就是最好的 agentic 模型。它完全不绕弯子,不耍小聪明。

Claude Code 泄露过一版源代码,Codex CLI 也是开源的,你会发现这两家公司在 agent 产品上的倾向性完全不同。Anthropic 就是不信任模型的,他们就是假设模型会出各种问题,于是在各处增加约束。OpenAI 提出 harness 概念更早,你去看 Codex 其实就是一个循环,非常极简。

一个极简的 agent 框架,驭遵循度极好的 GPT 5.5,实现目前最强的编码和 agent 能力;层层约束的框架,用在 Opus 4.7 上,却出现了黑天鹅效应,在超长任务中也会偷懒糊弄,这是我所看到的。

Agent 和模型是长短板的关系,你的 agent 足够强大,可以榨干模型的能力;相反如果模型足够强大,其实 agent 不需要特别复杂,就直接一个循环,给它工具就能用了。

APPSO:新的 Claude Code dynamic workflows 架构出现了 verifier 的设计,以及官方描述把编排从模型上下文搬到可执行代码层面,跟你们的构思「所见略同」。你觉得这种设计哲学的趋同,是 agent 工程的唯一解,还是阶段性偶然?

择因:目前阶段是比较合理的解决方案。其实开发 Agent 是一个比较神奇的过程,收益可能来自于模型能力变强,而非你的框架变优秀了;当然,也有可能是你的框架比较先进,能让模型完成之前无法完成的任务。目前大家采用 verifier 的方案,也是因为和这个阶段模型的能力水平比较匹配。

相同点上,CC的这套 dynamic workflow 是让 agent 自主决策如何编排一群 agent 运行,这和我们的 Agent Team 设计思想一致。同时二者的载体都是文件,或者说 coding,模型通过文件的方式去编排一群 agent 运行。

而不同点,主要在实现方案和玩法:CC 是让主 agent 编排完成后一次性并行执行大量子 agent,能调度几百次。但是它中途不会回头,和用户的互动主要是在遇到阻塞时候的询问。

我们的 Agent Team 在主 agent 编排完成的情况下,用户和主 agent 都能在执行的任意时刻介入进行调整,用户对 agent 的运行可观测,可以随时和具体的某个子 agent 聊天。同时能随时停止和重新继续。更强调人和 agent 用同种方式编排执行。

能确信的是,即使工作形式上类似,实际上还是有很多细节不同,可能是完全两种不同的东西。在 agent 时代,大家开发效率很高、迭代很快,但是决定胜负手的还是所有的细节。模型变快了,但我们得慢下来去知道所有的信息。

APPSO:你怎么看业内有种说法,就是 Anthropic 研究极强,模型很厉害,但他们的工程能力很差,甚至他们自己都说产品是 100% vibe coded。

择因:可能他们内部用的是好东西,只是没把最好的版本给放出来,所以之前泄露的 Claude Code 代码有很多非公开功能。

Harness 在四月份成为了共识,但我们也需要等会用 harness 的新模型出来,比如 M3,这样的产品才是饱满的。一个例子是去年 skill 提出时,当时 Sonnet 4.5 使用 skill 的效果跟后来的 4.6 差距极大——所以,你需要一个懂 harness 的模型才能把它玩得转。我觉得今天整个圈子共识形成得太快了,模型还没有跟上。

APPSO:所以给模型自由度,它其实能做得很好;但如果用人认为合理的架构去框住它,效果不一定好?人类的组织架构方式、对于该如何工作的想象力,是否制约了 agent?

择因:也不一定,现在还为时尚早。多 agent 确实是最近的大热点,大家都在做各自的早期尝试,包括我看到 Slock 那种把几个 agent 拉到一个群聊里的组织方式,都很有意思。

MiniMax 的倾向是人和 agent 应该拥有相同操作权限。在模型能力还没有达到顶尖的前提下,加各种约束、用现有的组织架构去编排它,肯定是为了让它工作的更好。

这里面当然有人性的考虑,你用人能理解的组织架构去编排,看 agent 给你干活,确实给你带来很强的情绪价值。但是从效率维度评价,就不一定合理。比如今天影视工业用人能理解的工作流去编排生成过程,比直接让人剪贵得多。

APPSO:DeepSeek 最近在招人做 harness,做 agent 了,很明显是发力了。你怎么看?

择因:我觉得模型企业做 agent,肯定不是为了做而做。最根本的是 agent 能力跟模型能力实现百分百契合,甚至放大。模型在自己的 agent 里能遵循自己的 harness,用户才能真正感受到模型的强大之处。

Agent 对于模型使用量也有好处。一个模型公司如果有了 agent,它的订阅量就会乘以一个系数;有模型但没有 agent,模型使用量就要打折扣。我相信这个逻辑对于 DeepSeek 和其它发力 agent 的公司也是一样。

APPSO:有个 OpenRouter 的数据,Claude 80% 以上的 token 消费用于编程和技术任务,DeepSeek 主要是闲聊和角色扮演。

择因:我觉得模型公司做 agent 会有许多的动机,但最重要的之一,应该是让自己的模型在更严肃的场景里被用起来。

APPSO:之前你们说没有做 Agent 的企业敢说自己有壁垒,现在呢?

择因:大家越来越重视 agent,并且形成共识的速度会越来越快。Skill 用了半年,龙虾一个半月,多 agent 也就一个月。

前几天有篇华人团队发的论文写得非常好。关于 agent 的一切,其实都在这 71 页的论文里了,叫做 Agent Harness Engineering: a Survey——既然 agent 已经能被一篇论文所概括了,你说有没有壁垒?

APPSO:哪个 agent 对你带来极大启发?

择因:OpenClaw,我觉得是对任何模型公司的 agent 团队的一次存在主义危机。为什么一个此前不在模型公司工作,不如模型团队更了解模型的个人,能做出一款世界上最多人用的 agent?

APPSO:你觉得 OpenClaw 哪做对了?

择因:它很多东西做得很细,就比如说连接飞书、微信,里面其实坑很多。它进而影响了整个行业。甚至在 OpenClaw 出来之前,飞书团队还是以 MCP 这种古老方式维护;OpenClaw 出来之后,飞书团队很快就推出了官方 CLI 和插件,这些接口和协议都是面向模型有好的,而且迭代很快。

APPSO:模型公司想要留在牌桌上的最关键因素是什么?

择因:就我们自己来说,一开始就走在全模态路线上,有完整的自研模型,并把它们直接部署到我们自己的原生 agent产品、创作平台、开放平台中。这种复合优势会给模型公司带来更多机会。

同时,为了不掉队淘汰,可能拼的是组织效率更多一点。如果你的组织效率足够高,大家有一个明确的目标,奔着这个目标去执行,这个公司其实就不会掉队。如果内部组织上扛不住压力了,做不出东西来,可能就会发现自己落后了、没法跟上。

APPSO:你说共识会形成的越来越快。之前 MiniMax 的特色现在快变成全行业模板了,你们接下来怎么做差异化?

择因:我觉得需要投入到细节上,虽然共识形成的很快,但谁能把相同的事情做透更重要。

APPSO:国产模型开源是否达到了目标?你觉得今后前沿模型还会开源吗?开源的红利期是否已经结束?

择因:如果你的模型能力足够强,开源不开源取决于团队的偏好与意志。过去两年里中国模型刚起步的时候,作为追随者,开源的确能够更好地体现价值。

我记得很多同行都公开或私底下表达过,如果有一天模型进入价格战阶段,到时候开源的风气可能会有所消减。

全球来看,开源仍是中美之间的最大区别。即便今后权重、训练框架不开源,你仍然可以把你的创新成果通过论文开放给全世界,不一定非得是模型能力。

APPSO:你们怎么看大厂用赛马甚至养蛊的方式做 agent 产品?

择因:就像我刚才提到的,agent 为什么存在,其实很明确的两个点:一是让模型以完全体形态呈现,放大模型的能力,让它被真正用起来,二是代表你这家公司对「模型该怎么用」做的探索。你的 agent 产品应该能闭环到模型训练上。

如果你堆了大量的 agent 产品,里面有多少是和你的模型能力闭环的?有多少能反馈到自己的模型训练当中?几个agent 团队是在整抢资源还是朝着一个大的目标?其实都是未知数。

总的来说,agent 产品要先能在内部使用再推出去。我也看到,目前 B 端 agent 产品的收益更明确,效果更直接,所以不能否认大厂在这方面的投入。

先交学费再上班

APPSO:人们对于对话助理以及 agent,有很多长久的期待,《Her》里的萨曼莎、钢铁侠的贾维斯。几十年前幻想出的东西今天还没实现,我们距离那样的 agent 还有多远?择因:我觉得其实不远。《Her》是聊天陪伴为主,我印象比较深的是和主角一起打游戏,也就是软件打通的层面,现在做的已经不错了;贾维斯的话,其实和现实世界连接更加紧密。这会有点难,但我很乐观,因为我觉得物理世界的交互协议会比代码层面更加简单。本质上,只要模型的多模态能力足够强就可以。

举个例子就是 GPT Image 2,你会发现它的生图能力几乎和现实世界一模一样。可以预见的是,会有一款全模态模型出现,对现实世界的理解能力是极强的。如果这样的模型去操作物理世界,唯一剩下的就是物理世界怎么把接口给 AI 打开。

距离还有多远?我觉得山雨欲来。

APPSO:你们自己的工作因为 agent 发生了怎样的变化?

择因:建立在 agent 能力自由、有执行规范,并且有一些严格的约束这三件事的前提之上,我们在 agent 自我迭代,也就是让 Agent 自己开发自己这件事上达到了很好的闭环。你会不断试探它的底线,交给它越来越复杂的任务,它的达成效果越来越好,我们的预期也越来越高,进入了一个非常高的正反馈循环。

以及连接飞书了之后,你跟它聊天、它向你汇报工作,这种体验的情绪价值是极强的。

但最重要的,是我们从过去迫使模型、agent 和我们一起干活,变成我们可以更多深度思考我们的工作,对工作进行抽象和模式识别,形成 skill 和规范——每一个人都变成了更加 senior(资深)的工作者。

APPSO:像你说的,如果 agent 越来越强,甚至自我进化,大部分人类都将无法追上它。那到时候人类应该做怎样的提升才能跟得上时代?新的工作范式会是什么样?

择因:Agent Team 上线后我去了新西兰 10 天,那里没有任何的 AI 和 agent,但我过得很快乐。那么我觉得,到时候或许人类只要去享受 agent 提升的效率带来的便捷性就够了,大家完全可以去干其它更感兴趣、更符合人性的事情。

跟你说个现象:有些大厂开始招高中毕业生参与研学了。基于此我还有一个推演:将来大学本科生毕业之后,可能要「付费再上两到三年班」,成为一个 senior 之后,才能开始上班赚钱。

APPSO:你觉得未来的就业市场会成这样?

择因:这是在当前教育体制下,我回答你「agent 效率高过人类」这个问题的一个推演。这个情况在一开始聊的视频剪辑领域,其实已经发生了。

「付费上班」的意思是,首先你的 token 消费可能最初是由自己买单,等同于交学费。如果 agent 的能力真的全面赶超人类,聪明的公司算笔账都不会再招初级员工,这才是最可怕的。到那时候,你要先成为资深员工,而这个过程可能需要自己付费。

当然这是基于现有的教育体制。那么会发生两种情况,一就是大家享受 AI 带来的效率,去创造更多更有人文情怀的事物;二是教育制度层面或许会发生一些创新。

APPSO:太有意思了。最后有个开放问题:如果你能掌握无限制的算力,训练或推理都行,并且可以以亲民的价格向用户提供,你想做什么?

择因:这个回答和 MiniMax 关系不大。我可能会把它用在推理上。

之前翁家翌提到(很多人也提过),人类的命运是可以被计算的:你的基因序列、倾向性、性格、激素水平可以测算;你的家庭条件,父母对你的影响(通过语言和肢体动作)也可以计算;你所处的环境是可量化的,小城市还是大城市、教育水平如何等等——在集齐了这些要素之后,每个当下的人的后续行为都可以预测。

我不是要用这个去预测别人,我希望它成为每个人的分身,可以把我的一切过往经历和生理资料都给它,在遇到决策点时去跟它讨论。

我之前是一个美团程序员,我可以跳槽去互联网公司或者考公(计算机还挺吃香),但这些决策更多因为我的过往认知。但是否存在一些我想不到的可能性,能够被建模、预测出来?

这就是我想做的,我觉得这才是真正解放人类的一环。人有生老病死,我们认为人生是一条单行线。但其实每个分支点都可能展开不一样的平行人生。

以及前面这些没有考虑意外。意外反而是最大的、不可预测的。我希望我做这个东西能够拯救因为意外而导致所有要素不再成立的人。从「肥尾效应」的角度来看,小概率事件才真正支配了我们大部分时间。它能让我们更多的关注点放在这些小概率但颠覆性的事件上,因为大概率的事件是能被算出来的。

APPSO:有点《少数派报告》《超验骇客》,所以你会希望你的每一步都走对吗?

择因:不一定。我更希望能知道我在认知之内能做什么选择,认知之外能做什么选择。

认知之外的就是惊喜。我想做的东西,对你不就是个惊喜吗?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/DmFl3gd
via IFTTT

英伟达:带领 PC,重铸 PC|硬哲学

爱范儿关注「明日产品」,硬哲学栏目试图剥离技术和参数的外衣,探求产品设计中人性的本源。

过去 48 小时,对于 Windows 电脑市场来说可谓地震不断——

不是微软要发 Win 12 了,也不是苹果重新内置 BootCamp 了,而是英伟达要造消费级 CPU 了。

图|Microsoft

更重要的是,老黄插手 CPU(SoC)领域,可不是来和英特尔、AMD 和苹果分蛋糕的……

他是来掀桌子的。

图|YouTube @Nvidia

在刚结束的微软 Build 与英伟达 GTC 显卡技术大会开幕式上,我们见到了来自英伟达的「终极 PC 解决方案」: RTX Spark N1X 处理器。

老黄期望通过 RTX Spark 打造的电脑很简单:

造出目前最全能、最智能、最面向未来十年甚至二十年 AI 潮流的终极 Windows 全能本。

支撑英伟达这一设计的根本逻辑,是老黄在 GTC 开幕演讲上的一个大胆判断——

面向人类用户设计计算产品的时代已经结束,未来我们应该面向智能体(intelligent agent)的需求设计计算硬件。

图|YouTube @Nvidia

下一个 AI 时代属于智能体

开场不久,介绍过 AI 技术如何塑造了当下的产业经济之后,老黄就拿出了他本次演讲的核心观点:

相比单独使用某个 LLM(大语言模型),智能体将是下一个阶段我们使用算力的主要方式(a new kind of computing pattern)。

这个核心观点如此重要,以至于老黄在演讲的前中后期反反复复提起这一页 keynote,将它重复播放了很多遍。

整个演讲上公布的新硬件——比如正式投产的 Vera Rubin 计算平台、企业级 AI 工具包、底层模型等等,全都是围绕着这个核心理论而设计的。

图|YouTube @Nvidia

根据老黄的介绍,智能体之所以能够成为下一阶段的核心算力使用方式,原因主要有 4 个——

1:解放用户生产力

过去几年里,单纯的生成式 AI(Generative AI)虽然能力得到了很大的提升,但并没有拓展出非常多的使用场景。

即使它可以画图、做视频、直接制作各种文件,但本质交互方式依然是用户问一句、AI 答一句。

智能体则不然——它的运作模式中包含「观察、推理、规划、使用工具」的闭环能力,这种模式让人类用户从工具操作者进化成了工具指挥者,可以被看作是一种形式的生产力解放。

2:减少隐性资源消耗

除了自身的运行模式之外,智能体还会彻底改变过去半个多世纪中,人类与计算机的核心人机交互模式

换言之,智能体将曾经需要手动打开程序、点击工具和操作的流程后置了一步,让人的工作从「动手」变成了「动口」,用解释意图(intents)取代具体的操作。

这种变化的意义,在于它结束了「人学习和适应软件」的时代。而一个「软件学习和适应人」的阶段,将会节省大量人类学习和练习使用软件所需的时间资源

3:无视物理数量限制

最「大力出奇迹」的优点是,智能体不会像人类一样,受到各种原因导致的数量限制。

在演讲中,老黄列举了几个例子:AI 编码智能体的出现,让 GitHub 上的代码提交量在 2026 年初同比近乎翻了三倍。

英伟达内部也计划通过部署「数十万个 Cadance 超级智能体」,将芯片设计验证的耗时从数周缩短到数小时。

换言之:只要算力资源允许,智能体就可以将单个人类的能力「超级加倍」,让生产力获得指数级放大。

4:比 LLM 更万能

相比传统 LLM,智能体还拥有一个非常具体的优势——普适性。

智能体的运作模式(模型 + 外壳 + 工具 + 运行环境)在所有应用场景中都是通配的,这种强大的通用性让它可以无孔不入。

比如大规模的云端 SaaS 服务、个人电脑部署、自动驾驶和人形机器人底层系统等等。

也就是说,智能体是 LLM 的一个「万能接口」,它自己就是完整的工具组件、可以直接嵌入具体的生产环节里,不需要人类在中间辛苦地做「回答搬运工」。

图|YouTube @Nvidia

基于以上四点论据,老黄指出了一种「面向智能体」的算力设计思路:

过去四十多年,所有计算硬件都是围绕人类的需求设计的,但智能体的世界以纳秒计算、对于各种资源(比如内存和电力)的需求模式和人类截然不同。

在这样的大背景下,老黄宣布了新一代全栈 POD 超级计算平台「Vera Rubin」的正式投产:

图|YouTube @Nvidia

相比年初在 CES 上首次介绍 Vera Rubin 平台,老黄在演讲中再次强调了这一代架构「专门为智能体设计」的属性。

尤其最新的 Vera CPU,就直接打上了「CPU for Agents」的标签——这颗 88 核心 176 线程的处理器的主要工作,用老黄的话说,是一位「指挥家」。

换言之,Vera CPU 主要控制智能体的调度、工具调用、内存和上下文管理,负责将 Rubin GPU 的巨量算力以最高效率、最低空置、最快速度的方式调度起来:

图|YouTube @Nvidia

在此基础上,其他机柜组件—— BlueField-4 DPU、NVL72 交换机、ConnectX-9 SuperNIC 网卡、Spectrum-6 以太网交换机等等,才能和 Vera Rubin 共同构成这套「面向智能体」的算力解决方案。

图|YouTube @Nvidia

但就像前面说的,老黄除了公布 Vera Rubin 投产之外,同时也将这个「AI 的未来属于智能体」的观点投向了一个更偏向消费电子的领域—— PC。

给智能体设计的电脑

之前提到,老黄今年 GTC 开幕演讲的主旨其实就一句话:

给人类用户设计硬件的时代结束了,我们下一步要面向智能体设计硬件。

但智能体的使用者不止 Oracle、OpenAI、Anthropic、AWS 这些企业巨头,个人 AI 用户的数量同样不可忽视。

为了占住极为分散但规模庞大的 C 端市场,老黄在今年的演讲中公布了英伟达首款面向个人消费市场的 CPU 产品—— RTX Spark 超级芯片。

图|YouTube @Nvidia

老黄对 RTX Spark 首型号 N1X 的介绍相当动情:「它集合了我们 33 年来的全部技术经验,因为它支持所有英伟达已有的技术栈」。

与苹果的 Apple Silicon 思路类似,RTX Spark N1X 是一块集成 CPU、GPU 和统一内存的 ARM 架构 SoC,采用台积电 3nm 工艺制造,CPU 与联发科共同设计。

图|Nvidia

尽管用着上一代 Grace Blackwell 平台,而非最新的 Vera Rubin,RTX Spark N1X 依然可以实现最高 1 PFLOPS(一千万亿次浮点)的 AI 算力。

根据英伟达工程师的介绍,N1X 的整体性能与 RTX 5070 笔记本接近,相比早期泄露的「与 M3 Max 跑分近似」又有了一些提升:

图|YouTube @Nvidia

在产品形态方面,RTX Spark 最主要的平台将会是 14-16 寸的笔记本,合作方也是那几个熟悉的巨头——联想、微软、惠普、华硕等等。

其中当属英伟达与微软的合作最为密切,毕竟 RTX Spark 是要运行 Windows on ARM 的。

而老黄的 ARM 处理器能否追上苹果,微软是其中不可或缺的因素。

相应的,微软也在演讲后更新了搭载 RTX Spark 的 Surface Laptop Ultra 预告片:

图|YouTube @Microsoft Surface

而相比高通的 ARM 架构笔记本,RTX Spark 还有一个得天独厚的优势:它支持所有英伟达已经有的技术,从光线追踪到 DLSS,再到 Cuda 加速和 TensorRT。

换言之,RTX Spark 笔记本不仅有 Win on ARM 上相对优秀的游戏体验,更是能够在本地 AI 工具加速之类的严肃场合提供「货真价实的生产力」。

图|YouTube @Nvidia

更重要的是——按照老黄的说法—— RTX Spark 所驱动的笔记本、小型主机和台式机都是「为智能体操作而设计」的。

除了 Windows 本身和软件商之外,甚至连 Adobe 都宣布将会为 RTX Spark 彻底重构 Premiere 和 Photoshop:

图|YouTube @Nvidia

就拿 Premiere 来说,Adobe 将会在 RTX Spark 电脑上带来一套全新的、以指挥智能体为主的交互模式,以及更多的 MCP 支持

再大胆一点设想,所有剪辑师都熟悉的「时间轴式 UI」很有可能在智能体时代被一个多模态指令框所替代——

听起来很酷,也很可怕。

在 RTX Spark 笔电上运行 Premiere Pro|Tom’s Guide

换言之,AI 不仅重塑了硬件的设计方式,也终于开始重塑一些已成定局十多年的软件 UI 交互规范了。

RTX Spark 的应用场景也不止笔电,在老黄的 GTC 开幕演讲与当天稍晚些的微软开发者 Build 大会上,我们看到了很多以此为基础的小型主机平台。

就比如这个长得神似 Xbox 的微软 RTX Spark Dev Box:

图|Microsoft

AI 需求塑造物理世界

纵观老黄的整个 GTC 演讲,以及同期召开的 COMPUTEX 和微软 Build 大会,我们可以明显地感受到:

AI 从「生成式」向「智能体」的转变,将会重塑人们使用计算机的主要方式,并且这种重塑也反过来影响了计算硬件上下游的设计和形态。

换言之,英伟达不仅定义了下一个 AI 时代的核心问题:「什么是生产力 – 是智能体」,更是为自己的观点拿出了一套相当具有说服力的配套产品。

图|YouTube @Nvidia

而 RTX Spark 的目标,是让新时代的全能本既要本地跑模型,又要兼顾生产力和娱乐——

毕竟支持 RTX 和 Cuda 对于 Windows on ARM 一直是个老大难问题,直到英伟达亲自下场。

只不过在为下一个 AI 时代催生新硬件感到兴奋的同时,我们也需要理性地看待 RTX Spark N1X 处理器:因为它并不是一个非常新鲜的东西

还记得去年的 DGX Spark 吗?里面的「GB10 超级芯片」基本上就是 N1X 的先行版本。

从芯片刻字上看,老黄在 COMPUTEX 上展示的 N1X 生产周期甚至是 2024 年,早期泄露跑分接近 2023 年的 M3 Max 也就不意外了。

图|YouTube @High Yield

虽然所有消费级产品都要等到今年秋天,但看到 RTX Spark N1X 的这些零星信息,也很难不让人微微担心——

一颗 CPU 两年前、GPU 一年前且不满血的 SoC,真能为未来 10 年 20 年的智能体需求准备好吗?

尽管 N1X 既没用上最新的 Vera Rubin 架构,也不如今年的骁龙 X2 Elite Extreme 甚至去年的 AMD Strix HALO,但它标志着一个开端:

一个芯片优先考虑智能体需求、并顺势开始影响操作系统、软件程序,直至硬件商品形态的时代的开端。

至于究竟谁能代表 AI 时代的操作系统,微软选择和英伟达联手,「再给 Win on ARM 一个机会」,明显是意识到了自己被 macOS 和 Linux 夹攻的困境。

图|Microsoft

然而成也 Win on ARM,败也 Win on ARM —— RTX Spark 主动带来全套的英伟达技术适配,并不能解决 Win on ARM 在其他体验上的长期瘸腿。

毕竟一个足够好的面向 AI 的操作系统(比如 macOS),即使它自己不倾向于开放,也会有用户通过逆向工程的方式帮它开放。

而在这一层上,RTX Spark + Win on ARM 所以立足的基点,就显得不是那么稳固了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/4VbxKkl
via IFTTT

早报|苹果发布会限量礼品曝光/字节跳动:没有造车计划/谷歌每月花9.2亿美元向SpaceX租算力

cover

🤖

Gurman:从「AIMLess」到 WWDC 大改版,苹果用两年时间重建 AI 战略

📱

爱范儿已抵达苹果总部

🚗

字节跳动澄清:没有造车计划

🤖

曝 Codex 将整体并入 ChatGPT

🚀

Google 向 SpaceX 租用每月 9.2 亿美元 AI 算力

🤝

英伟达与 SK 海力士达成多年期合作,共同开发 AI 工厂下一代内存

🚙

本田在华销量连续两个月接近腰斩

🚗

高通汽车业务单季营收达 13 亿美元

🤖

京东与腾讯据称将围绕 AI Agent 合作

☁

全球首个预制算力中心底座在青岛投用

💰

本源量子完成近 30 亿元 Pre-IPO 轮融资

💡

心理学家:把认知工作外包给 AI,会「失去对大脑的控制」

📱

小米 17T 系列今天发布

👓

2350 元,加南 Kannan K2 智能眼镜发布

🚙

东风发布无人物流车品牌 OpenVAN

🚗

曝本田 HRC 正开发更硬核的思域 Type R

🤖

OpenCV 5 发布,原生支持 Transformer 与视觉语言模型

🥤

瑞幸回应拿铁去冰不满杯,点单页增加提示

🛍

精品咖啡品牌 Seesaw 被申请破产清算,全国门店仅剩 34 家

🎥

《玩具总动员 5》Taylor Swift 歌曲打破多平台首日纪录

🎬

AI 起源纪录片《大概没什么可担心》将在 Tribeca 展映

重磅

Gurman:从「AIMLess」到 WWDC 大改版,苹果用两年时间重建 AI 战略

苹果将于北京时间 6 月 9 日凌晨召开 WWDC 2026,带来其史上规模最大的 Siri 与 AI 功能更新。

彭博社记者 Mark Gurman 在昨晚发布的 PowerOn 新闻通讯透露,苹果在 AI 领域经历的一段艰难时期。苹果内部 AI 团队曾被戏称为「AIMLess」,折射出外界对其 AI 方向感的质疑。Apple Intelligence 1.0 的失利,叠加竞争对手的快速推进,迫使苹果高层于 2025 年初召开秘密会议,启动整改。

此后,Vision Pro 创始人 Mike Rockwell 接管 Siri,软件主管 Craig Federighi 全面主导 AI 战略,前 Google 和微软工程高管 Amar Subramanya 加入负责模型研究,前 AI 负责人 John Giannandrea 则于今年离职。

WWDC 2026 也是 CEO Tim Cook 在正式卸任前的最后一次重大产品亮相。库克此前承认,Apple Intelligence 的失误程度超过苹果地图事件,并在危机后亲自深度介入 AI 规划。

此次大会的核心看点是全面升级的 AI Siri。苹果计划推出可与 ChatGPT 竞争的独立 AI 助手应用,支持类聊天机器人交互,并引入生成式 AI 图像编辑功能。

系统层面,iOS 27、macOS 27、watchOS 27、visionOS 27 等新版本将同步亮相。底层技术上,苹果已与 Google 达成合作,以 Gemini 模型和 Google Cloud 基础设施替换 Siri 原有技术方案。

大公司

爱范儿已抵达苹果总部

爱范儿已经抵达苹果总部,领到了 WWDC26 伴手礼。依然是经典的三件套:帆布袋,水壶和规徽章贴纸。每年苹果发布会的徽章都或多或少有些剧透,今年则是致敬了苹果 50 周年,满满极客的彩蛋。

  • 骷髅海盗标:这是致敬乔布斯那句「宁为海盗,不做海军」(It’s better to be a pirate than join the navy)。Mac团队当年还曾在研发大楼楼顶挂上了这面海盗旗。
  • 彩虹 50 周年 logo:这是 1977年乔布斯设计的初代彩虹苹果logo,这次和苹果 50 周年的元素进行了结合。
  • 狗牛:这是 Mac工程师圈的顶流吉祥物。低分辨率像素图让它既像狗又像牛,,所以被工程师们戏称为「Dogcow(狗牛)」,还给它起了正式名字 Clarus。它还有专属叫声「Moof!」,是老果粉才懂的可爱彩蛋。
  • Finder 酱:苹果的新晋网红,在社交媒体上已经有不少粉丝自制周边了,这会官方周边也来了。

有意思的是,这次发布会最期待的苹果 AI 没在这次的伴手礼剧透,届时爱范儿会在现场跟大家分享 WWDC26 最新的消息,敬请关注。

字节跳动澄清:没有造车计划

字节跳动日前发布声明,回应近期将「赛豆」解读为「豆包汽车品牌」或「字节跳动造车」的说法。声明称,相关说法不准确,字节跳动没有造车或推出汽车品牌的计划。

字节跳动同时表示,赛豆不是字节跳动或豆包推出的汽车品牌,字节跳动与赛豆没有股权合作。豆包、火山引擎与汽车行业伙伴的合作,主要是向行业伙伴提供豆包大模型、智能座舱等技术服务,用于提升车载智能交互体验。

此前《晚点 Auto》曾报道称,赛力斯正在推进一个全新汽车品牌的筹备工作,法律主体为刚完成工商变更的「赛豆科技」,并会与火山引擎展开深度合作。

曝 Codex 将整体并入 ChatGPT

《金融时报》报道称,OpenAI 正准备对 ChatGPT 进行自 2022 年推出以来规模最大的改版,新版将在未来几周内逐步上线。改版核心是把 Codex 整体并入 ChatGPT,同时接入可画、Booking.com 等外部合作伙伴应用。

报道称,ChatGPT 网站和移动端将加入更多提示词与功能入口,引导用户使用编程工具、图像生成和第三方应用;短期内,用户会看到一个选项,可手动选择由 Codex 还是 ChatGPT 回应需求。

OpenAI 企业产品负责人 Alex Embiricos 解释称,公司进入第二阶段后,目标是把「能帮你在电脑上做任何事情的智能体」推给每一个人。

Google 向 SpaceX 租用每月 9.2 亿美元 AI 算力

据 TechCrunch 报道,SpaceX 在 IPO 前披露与 Google 签署新的算力协议。根据文件,Google 将从 2026 年 10 月至 2029 年 6 月,每月向 SpaceX 支付 9.2 亿美元,使用约 11 万张英伟达 GPU、CPU、内存和相关组件对应的计算能力。

这份协议与 SpaceX 5 月同 Anthropic 签下的算力租赁安排类似,但规模约为后者的一半。Anthropic 当时约定以每月 12.5 亿美元租用 Colossus 1 数据中心可用算力。

Google 对 TechCrunch 表示,这是一份短期过渡协议,用来满足 Gemini Enterprise 和智能体平台超出预期的客户需求。协议还包含退出条款:

2026 年 12 月 31 日后,双方均可提前 90 天通知终止;如果 SpaceX 到 2026 年 9 月 30 日未能交付承诺 GPU 数量,Google 可终止协议或按实际交付数量降低月费。

英伟达与 SK 海力士达成多年期合作,共同开发 AI 工厂下一代内存

当地时间 7 日,英伟达与 SK 海力士官宣建立多年期技术合作伙伴关系,围绕全球 AI 工厂所需的下一代内存展开联合研发,并将 AI 技术应用于半导体芯片的设计与制造。

  • SK 海力士将为英伟达 Vera Rubin AI 超级计算机、Vera CPU、RTX Spark PC 及 Jetson Thor 机器人计算平台协同开发专用内存,由此进入 AI 基础设施、个人 AI 与物理 AI 新市场。
  • 协议支持先进内存供应,以应对较长研发周期与资本投入,使供应跟上英伟达的基础设施路线图。
  • SK 海力士将采用英伟达 CUDA-X 库与 PhysicsNeMo 框架,加速 TCAD、计算光刻等芯片仿真工作流。
  • 借助英伟达 Omniverse、OpenUSD 与 cuOpt 构建晶圆厂数字孪生,推动工厂自主化运营。

英伟达 CEO 黄仁勋表示,AI 工厂是下一轮工业革命的引擎,先进内存对其性能至关重要;SK 集团会长崔泰源称合作体现了双方多年协同的深度。

本田在华销量连续两个月接近腰斩

据界面新闻报道,本田中国 6 月 5 日发布的数据显示,5 月本田在中国的终端汽车销量为 28279 辆,同比下降 48.68%;今年 1-5 月累计销量为 173344 辆,同比下降 32.47%。

这是本田在华销量连续第二个月接近腰斩。4 月本田在中国市场终端销量为 22595 辆,同比下降 48.28%;今年 5 月,本田在华销量再次不足 3 万辆。同月,蔚来、小鹏、小米、问界、理想等多家中国新能源车企交付量均超过 3 万辆,零跑交付量超过 8 万辆。

广汽本田计划从 2027 年开始逐步开启新品投放节奏,推出覆盖燃油、混动、新能源的 3 款全新车型,其中包括基于中国专属新能源平台打造的自研车型,并引入华为、Momenta 等本土供应商补齐座舱和智驾能力。

高通汽车业务单季营收达 13 亿美元

高通日前在无锡举办第四届汽车技术与合作峰会,披露其汽车业务 2026 财年第二季度单季营收达 13 亿美元,同比增长 38%。按年化口径计算,高通汽车业务收入已超过 50 亿美元,高通 CEO 安蒙预计到 2026 财年结束时突破 60 亿美元。

本次峰会上,高通继续把汽车业务从座舱芯片扩展到舱驾融合和车端智能体平台。高通中国区董事长孟樸称「2026 年是智能体之年」;

高通汽车事业群总经理 Nakul Duggal 表示,智能体 AI 从三到五年前的概念逐步进入现实,舱驾融合架构可以让统一底层平台打通车内外传感器和硬件资源。高通当前汽车芯片主线覆盖三个价位段:

  • 骁龙 8775:面向 10 万到 20 万元区间车型,是同时处理座舱交互和 ADAS 计算的单芯片方案,高通称系统级成本可降低约 20%,已获得 9 款车型定点。
  • 骁龙 8397:定位高端座舱平台,AI 算力从前代 8295 的 30 TOPS 提升至 320 TOPS,端侧大模型能力从 10 亿参数提升到 140 亿参数。
  • 骁龙 8797:定位 30 万元以上车型,单片算力 1280 TOPS,支持端到端 Transformer 算法和 VLA 模型,已获得 18 个车型定点。

高通还与卓驭科技联合发布基于 8797 的下一代舱驾融合域控制器,并和诚迈科技、斑马智能、德赛西威、中科创达等六家公司共同启动「车端人工智能 Claw 生态计划」。

京东与腾讯据称将围绕 AI Agent 合作

据钛媒体报道,京东与腾讯近期将围绕 AI Agent 展开合作。报道称,京东的商品供应链与履约服务体系,将与腾讯的入口资源进行对接。

这次合作的具体方向,是把京东 AI Agent 接入更靠近用户入口的场景。腾讯近期在 AI Agent 上推进多个项目,手机厂商方案包括华为、小米、OPPO、vivo 等。另有消息称,腾讯已接近启动微信 AI 助手的开发测试。

京东侧的基础能力来自商品供应链、全域零售数字化和电商履约体系。报道称,京东 AI Agent 已与华为、OPPO、荣耀等主流终端厂商对接;通过 A2A 合作,用户可在终端原生智能体内提出购物需求、获取商品信息,再由京东履约与服务体系承接。

全球首个预制算力中心底座在青岛投用

据央视新闻报道,全球首个预制算力中心底座 6 月 6 日在山东青岛正式启用。这类底座相当于算力中心的能源枢纽,负责为数据中心提供持续稳定的电力;央视称,相比传统算力中心底座,该方案可节约近 70% 施工周期。

这套设备外形接近集装箱,长约 53 米、宽约 41 米,占地约 2200 平方米,减少超 30%,整体成本下降 20%,最快 5 个月完成施工,土建成本节约近 80%;通过绿电直连和储能调控,可实现 100% 绿电消纳,并让 Token 用电成本降低约 30%。

本源量子完成近 30 亿元 Pre-IPO 轮融资

据上证报消息,本源量子近日完成近 30 亿元 Pre-IPO 轮融资,投前估值达到 210 亿元。报道将其称为国内估值最高的量子计算公司。

本轮融资历时 30 天完成,由中国兵器集团领投,增资 5 亿元;中科育成投资作为老股东跟投,再次增资 3 亿多元,累计持股超过 5%,位列公司实控人之后,为第六大股东;华民投新增为股东单位,出资 2 亿元。

参与方还包括山东省、江西省、河南省等省级政府投资平台,青岛市级政府投资平台,以及上市公司等多元机构 LP。

💡 心理学家:把认知工作外包给 AI,会「失去对大脑的控制」

据 MIT Technology Review 报道,加州大学欧文分校心理学家 Gloria Mark 在 SXSW London 接受采访时讨论了数字技术和 AI 对注意力的影响。她指出,人们已经在很大程度上「失去对注意力的控制」。

Mark 的长期实验显示,2003 年用户在切换到其他任务前平均能专注约 2 分半钟;2012 年降至约 75 秒;2014 年至 2020 年的研究中进一步降到平均 47 秒。她还在实验中看到,注意力快速切换与压力上升存在直接相关。

她对 AI 聊天机器人更担心的部分,是「深度处理」被外包。Mark 表示,当人主动评估、总结和理解信息时,会更可能学习、理解和记住它;

如果把写作、总结、评价交给 ChatGPT、Claude 或 Gemini,人就把认知工作交给了 AI。她还把问题延伸到合成陪伴产品,认为顺从型机器人关系会削弱人维持真实关系所需的情绪能力。

她建议人们重新思考与 AI 技术的关系:读完整本书而非只看摘要;能当面见朋友时尽量当面;在熟悉环境里减少对 GPS 的依赖。她认为,努力本身会带来更深层的满足感,这些例子也是对注意力、记忆和情绪能力的重新训练。

新产品

小米 17T 系列今天发布

小米 17T 系列国行版将于今日发布,包含小米 17T 和小米 17T Pro 两款机型,官方定位为「全能影像旗舰」。博主「体验 more」昨日曝光了两款手机的主要规格。

  • 小米 17T:天玑 8500-Ultra 处理器,LPDDR5X + UFS 4.1,6.59 英寸 2756 x 1268 分辨率 120Hz 屏幕,7000mAh 电池,67W 有线快充;后置影像为光影猎人 800 主摄、1200 万像素超广角和 5000 万像素 5X 潜望长焦。
  • 小米 17T Pro:天玑 9500 处理器,6.83 英寸 2772 x 1280 分辨率 144Hz 屏幕,7000mAh 电池,100W 有线快充和 50W 无线充;后置主摄升级为光影猎人 950,并继续搭配 1200 万像素超广角和 5000 万像素 5X 潜望长焦。

2350 元,加南 Kannan K2 智能眼镜发布

加南科技发布 Kannan K2 智能眼镜,售价 2350 元。这款产品重 25.8 克,采用欧洲进口超轻尼龙材料,官方称镜框面向亚洲脸型设计,耳挂最薄 5.5 毫米。

配置上,Kannan K2 搭载 3200 万像素摄像头,光圈 f/2.4,支持 4K 30FPS 视频拍摄。

东风发布无人物流车品牌 OpenVAN

东风汽车周六正式发布无人物流车品牌「东风 OpenVAN」,同时亮相四款全场景无人物流车产品。

据悉,东风 OpenVAN 使用东风与九识智能自研的大模型智驾方案「九识智驾 Zelos Inside」,官方称已有 1.3 亿公里真实路况验证。车辆的刹车、转向和供电均配备双套系统,并通过 5G 低时延技术支持线上看管多台车辆、自动测算路线和全天候运维。

四款车型覆盖不同载重和场景:

  • DF-2:容量 2 方,载重 1 吨,续航 120 公里,面向末端配送、道路巡检和小型环卫。
  • DF-8:容量 8 方,载重 2.8 吨,续航 150 至 195 公里,适用于商超和冷链。
  • DF-25:容量 25 方,载重 4 吨,续航 300 公里,面向园区运输。
  • DF-60:容量 60 方,载重 13.6 吨,续航 200 公里,适配大件运输。

曝本田 HRC 正开发更硬核的思域 Type R

据 Motor1 报道,本田赛车公司 HRC 总裁渡边康治透露,本田正计划把思域 Type R HRC Concept 概念车推向量产。他在 5 月的 Type R 车主活动上表示,新车距离推出已进入「100 天级别」倒计时,目前仍在开发阶段。

报道称,本田正在铃鹿赛道测试,岩佐步梦、佐藤琢磨和大津弘树等本田车手已经参与开发。测试车前脸伪装较多,报道称保险杠、翼子板、前唇、侧裙和尾翼都会变化,前翼子板采用类似 Super GT 的宽体方形轮拱。

底盘和悬架方面,佐藤琢磨提到测试车的车身刚性和悬架硬度,加宽前翼子板可能对应前后不同规格轮胎,以增强前轮抓地力。渡边康治还表示,概念车上的部分零件会在美国以官方后市场配件形式销售。

OpenCV 5 发布,原生支持 Transformer 与视觉语言模型

OpenCV 团队本周正式发布 OpenCV 5。这一版本对这个已有二十多年历史的计算机视觉库做了架构现代化,重点更新 DNN 引擎、ONNX 支持、硬件加速层、Python 集成和 3D 视觉能力。OpenCV 5 的主要变化包括:

  • 下一代 DNN 引擎采用基于图的架构,支持算子融合、广泛 ONNX 支持,并加入对 Transformer、视觉语言模型和大型语言模型的支持。
  • ONNX 算子覆盖率从 4.x 时代不到 23% 提升到超过 80%。
  • 核心库弃用传统 C API,构建方式更精简,并加入 0D/1D 张量、FP16/BF16 和日志机制。
  • 硬件加速层更清晰,方便硬件厂商直接插入优化内核;3D 视觉部分新增 ChArUco 标定板、多相机标定和可视化能力。
新消费

瑞幸回应拿铁去冰不满杯,点单页增加提示

第一财经报道,上海消费者反映瑞幸「超大杯拿铁去冰后仅半杯」后,瑞幸咖啡点单页面已增加「去冰可能不满杯」的小字提示。

报道提到,涉事消费者在门店询问后得到的答复是「公司标准配方」:去冰后不会额外多加牛奶或咖啡。

第一财经随后以消费者身份咨询北京西城区多家瑞幸门店,有门店店员表示,拿铁类去冰会补牛奶,出品标准是距离杯口 1cm,不应出现半杯有余的情况;如果遇到明显不满杯,可凭订单退款。

精品咖啡品牌 Seesaw 被申请破产清算,全国门店仅剩 34 家

据蓝鲸新闻报道,精品咖啡品牌 Seesaw 的运营主体上海西舍咖啡有限公司新增多例破产审查案件,申请人分别为上海琉璃工房玻璃艺术品有限公司与上海玛露实业有限公司。

两名申请人均以该公司不能清偿到期债务且明显缺乏清偿能力为由,向法院申请对上海西舍咖啡有限公司进行破产清算。

门店端也在收缩。窄门餐眼数据显示,截至 5 月 13 日,Seesaw 全国在营门店为 34 家,其中浙江 7 家、上海 6 家、江苏 4 家;这一数字较 2023 年 3 月高峰期的 135 家少了超过 100 家。

好看的

《玩具总动员 5》Taylor Swift 歌曲打破多平台首日纪录

据 Deadline 报道,Taylor Swift 为《玩具总动员 5》创作的歌曲《I Knew It, I Knew You》已经成为 Spotify 历史上女性艺人单日播放量最高的乡村歌曲。

这首歌还成为 Apple Music 2026 年播放量最高的乡村单曲,并打破 Apple Music 基于首日播放量统计的原声带单曲历史纪录。Deadline 提到,音乐视频只在 Spotify、Apple Music 等流媒体平台独家上线,推动粉丝集中前往这些服务观看以 Jessie 为主题的影片片段。

Amazon Music 方面,这首歌也创下 2026 年全球歌曲首个 24 小时最高播放首秀纪录。电影插曲已经先于影片本身形成独立宣发事件。

AI 起源纪录片《大概没什么可担心》将在 Tribeca 展映

据 Variety 报道,导演 Nick Holt 的纪录片《大概没什么可担心》(AI: Probably Nothing to Worry About)将在 Tribeca 亮相。Holt 表示,影片讨论的范围超出单个产品,指向「一种物种的创造」。

这部纪录片把 AI 的早期发展、研究者、公司和社会想象放在一起,试图解释今天的 AI 系统为何会被描述成新型智能体。标题里的「大概没什么可担心」带有反讽意味,也对应公众对 AI 的兴奋和焦虑。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/Wfp39UA
via IFTTT