2026年5月27日星期三

小米:请叫我 Token 价格屠夫

押注 2026 年 Token 大涨价的人,短短一周迎来两次打脸。

5 月 22 日,DeepSeek 宣布 DeepSeek V4 Pro 永久降价;今天凌晨,小米 MiMo-V2.5 系列跟进降价,最高降幅达到 99%。

与此同时,小米 Token Plan 计费体系同步优化,定价不变,可用量提升至原来的 5 至 8 倍。

没有出乎太多意料,海外 Reddit、X 平台以及各大开发者论坛上关于小米 MiMo 模型降价的讨论热度也是迅速飙升。

只是,在全行业都在高喊 Token 成本吃不消的当下,小米为何敢于逆流降价?更重要的是,这波降价操作又会把 AI 行业推向何方

Token 价格打骨折,AI 行业迎来最严厉的父亲

小米此次公告显示,旗下 AI 大模型 MiMo-V2.5 系列 API 将进行永久降价,最高降幅达 99%,且不再区分输入长度。新价格已于北京时间 5 月 27 日 0 点全球同步生效。

不过,99% 的降幅并不意味着每一次调用都会按最低价计费,关键变量在于输入缓存是否命中。

以 MiMo-V2.5-Pro 为例,一旦命中缓存,输入价格被击穿至约 0.025 元每百万 Tokens。而如果输入缓存未命中,价格依然维持在 3 元每百万 Tokens,输出价格则为 6 元每百万 Tokens。

也就是说,这个极低价格成立的先决条件,是请求必须大量命中缓存。

对于高重复上下文、高频 Agent、多轮代码任务以及批量推理任务来说,这个价格拥有极强的吸引力,但如果你的应用场景缓存命中率堪忧,真实成本显然不会触及最低点。

Token Plan 的玩法也有着相似的逻辑。

小米强调定价不变,Credits 大幅提升:Lite、Standard、Pro、Max 四档月费仍是 39 元、99 元、329 元和 659 元, Credits 的额度,也从 0.6 亿、2 亿、7 亿、16 亿提升到对应的 41 亿、110 亿、380 亿、820 亿。

且按照新的换算关系,MiMo-V2.5-Pro 命中缓存只需 2.5 Credits / token,未命中缓存则要 300 Credits / token,输出为 600 Credits / token。

这与 DeepSeek 的打法如出一辙。

简单回顾一下时间线:4 月 24 日 DeepSeek V4 预览版发布;次日 V4-Pro 开启 2.5 折优惠;4 月 26 日,缓存命中价格暴降至首发价的十分之一;到 5 月 22 日,临时折扣干脆变成了永久降价,V4-Pro 永久降至原价的四分之一。

一番调整过后,DeepSeek-V4-Pro 的输入缓存命中价格从 0.1 元直接降到了 0.025 元。随着小米 MiMo-V2.5-Pro 的火速跟进,国产模型的缓存命中输入价已经被彻底焊死在了这一基准线上。

DeepSeek 和小米都把最有冲击力的价格放在缓存命中和场景,原因并不复杂。大模型正在从聊天走向干活,而 Agent 才是 token 消耗真正放大的地方。

在聊天场景里,用户问一句,模型答一句,成本相对容易估算。

但在 Agent 场景里,一个任务可能包含长上下文、多轮推理、代码生成、工具调用、网页读取、文件分析和结果校验。用户看到的只是最后一次输出,后台却可能已经发生了多次请求和大量上下文读取。

这就是缓存命中重要的地方。

Agent、代码助手和长上下文应用有一个共同特点:很多内容会反复出现。比如系统提示词、项目代码、API 文档、工具说明、历史对话、依赖文件等。这些内容如果每次都重新计算,成本会很高;但如果能被缓存,下次再用时只按缓存命中价格计费,推理成本就会明显下降。

也就是说,缓存命中价格越低,越适合高频、多轮、长上下文的真实工作场景。DeepSeek 和小米低价背后,其实也是为了先把开发者和高频应用吸引进来,让更多 Agent、代码助手和办公自动化应用愿意跑在自己的模型上。

小米此前通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人体验 MiMo,并解决真实问题。这个百万亿 Token 激励计划自 4 月 28 日上线,到 5 月 26 日 16:08,100T Tokens 已全部提前发放完毕。

从平台视角看,低价 token 和免费额度换来的是海量真实调用。真实调用会带来复杂任务、失败样本、用户反馈、Agent 工作流、代码场景和长上下文数据,这些都会反过来帮助模型和推理系统迭代。

社区里的「养虾党」现象,也可以放在这个逻辑里理解。用户在最大化消耗额度的同时,也在帮助平台制造压力、暴露问题、积累调用数据。

所以这笔账不能只看单次推理毛利。短期收入被压低,换来的是开发者迁移、调用规模和真实反馈。对想争夺 Agent 生态位置的模型厂商来说,这是一种非常划算的平台投入。

罗福莉的真香定律,背后是工程暴力

不过,光有意愿还不够,关键是降得起。小米这次降价的特殊之处,正在于它和 MiMo 大模型负责人罗福莉此前的公开表态形成了反差。

一个月前,罗福莉曾公开反对 token 价格战。她当时的判断是,低价 token 加开放第三方 Agent 框架,容易让平台陷入成本失控。

她提到,第三方 Agent 框架往往上下文管理粗放。单次用户查询可能触发多轮低价值工具调用,每次请求又携带超过 10 万 token 的超长上下文。如果平台无法约束这类浪费,真实 API 成本可能是订阅价格的数十倍。

她还认为,全球算力供给已经跟不上 Agent 带来的 token 需求增长。大模型公司在没有厘清编程和 Agent 场景成本结构之前,盲目价格战会导致限流、降配、稳定性下降,最终损害用户体验。

但小米这次降价没有推翻此前判断,而是改变了价格战成立的前提。罗福莉此前反对的是没有成本结构支撑的低价。小米现在展示的,是一套自认为能够支撑低价的推理工程方案。

按照小米公告,其技术团队基于 SGLang HiCache 完整支持 SWA,也就是 Sliding Window Attention,将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近七分之一,并将可缓存 token 数量提升至优化前的近五倍。

与此同时,小米还优化了专家并行方案和输入长度分桶策略,以提升集群输入吞吐能力。没有这层工程能力,低价很容易就会变成不可持续的补贴。有了足够强的 Infra系统,低价才可能转化为长期优势。

价格战考验工程能力,也考验后方厚度。

不同于纯 AI 模型公司,小米的手机、汽车、IoT 和消费电子业务,给它提供了更长的投入周期和更大的战略耐心。它可以把大模型服务看作 AI 生态入口,避免陷入只按短期 API 收入斤斤计较的困局。

这对中小模型公司并不友好。没有主业输血,没有过硬的 Infra 实力,也没有足够调用规模摊薄成本的玩家,注定无法长期跟进这种价格。

DeepSeek 的低价已经直接威胁到不少国产模型的市场定位。而随着小米 MiMo 的跟进,更多仍有体量的厂商会被迫调整价格或将重新定义产品价值。更小的模型服务商,则可能被推向更窄的垂直场景。

这轮降价某种程度上也是效率派模型厂商对市场的一次筛选。有工程能力、算力调度能力和生态入口的公司,可以承受更低价格带来的压力。只有模型能力、但推理成本压不下来的公司,会越来越被动。

并且伴随继续下探的空间逐渐变窄,价格越接近物理成本,单纯降价的价值越有限。下一阶段,模型质量、Agent 适配、开发者工具、生态绑定、服务稳定性和企业交付能力,也都将迎来新一轮内卷。

模型能力决定了 AI 发展的上限,而推理成本决定了 AI 普及的规模。等到真正便宜的 Token 涌入应用层时,我们才会真正看清,属于 AI 的下一个爆发时代会是什么模样。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/tERdufw
via IFTTT

再访 XREAL 徐驰:做眼镜是场万米长跑,靠运气也靠打怪升级

XREAL 把今年的第一场发布会,留给了一个之前没听说过的新牌子:xbx。

内部的全称是 x, by XREAL。

考虑 1699 的定价,xbx 的第一款产品 a01 的性价比相当不错:50° 视场角,tandem OLED 显示模组的亮度高达 1600 尼特,等效 4 米左右 147 英寸大屏,支持 HDR10 和在至高 120Hz 帧率下的空间防抖。

但参数远没有颜值和戴起来轻松更重要。62g,半透明未来感机身,可替换的多种个性化镜框。CEO 徐驰说,「颜值就是正义,只管玩就好。」

这是成立十年来一直在拼了命地往「上」冲的 XREAL,第一次「向下」。

过去这些年,徐驰和他创立的 XREAL 从来没有走过容易的道路。尽管中国的消费电子供应链资源足够好,以至于整合能力成为了成功的硬件创业者必备的素质——XREAL 却是不搞纯粹的「供应链整合」的。

正相反,XREAL 一直都在往上走,做最贵、最难、最「极客」的产品。为此,XREAL 不惜做极高比例,同时也是同行中最高比例的自研,甚至不惜因为过去两三年里的国际半导体波动,而损失相当一部分利润率。

这才是为什么去年 XREAL 能和硅谷巨头 Google 联合推出 Project Aura,一台令行业人士刮目相看,也让消费者打破对现有「智能眼镜」刻板印象的原型机(今年将正式面市)。徐驰毫不收敛地将 Project Aura 称为他所在的行业体验的「天花板」。

能做出这样的产品,断不可能靠整合供应链。为什么只有 XREAL 能做到,为什么谷歌选择了,LG、ROG 等也都选择了 XREAL?

徐驰说,答案是 XREAL 的 A 面:内敛、冷峻、长期主义、押注绝对的技术创新。

那么,XREAL 的 B 面又是什么?

在徐驰带领着公司一往无前地朝着头戴式显示技术的性能优化与极致轻量化冲刺的同时,他的背后险象环生:

在通过 Apple Vision Pro 试水也试错了之后,苹果立项了更多轻量级 AI/AR 眼镜产品,如无意外将于 26H2-27 全年逐步问世;小米、阿里千问、Rokid、VITURE 等纷纷杀入市场。

它们当中,有的用 AR 显示眼镜围攻 XREAL 占据已久的光明顶,更多的则是用 AI 眼镜(屏显/无屏)来提前抢占行业领头者尚未明确布局的新空间——无论何种产品定义,价格都被压得越来越低。

对此徐驰并不紧张。在和他深聊过后,爱范儿得出这样的感觉:XREAL 的 A 面朝前太久了,以至于同行们似乎误认为它没有或者不屑于展现另一面。

「怎么说呢,A 面没立住的时候,就没有 B 面。我们现在来了,虽迟但到。」

XREAL 主品牌的势能已经积攒到位,徐驰和他的产品团队终于腾得出手去做另一种风格的产品——一个更年轻、外放、价格也更亲民的牌子 xbx。

这就是 XREAL 的 B 面,与那个永远创新不止的 A 面,互为映照。

他说,自从创业以来,见到了 VR/AR 的泡沫,破了;然后元宇宙来了,也破了。一路走来,这次创业越来越像一场万米长跑——这也是从一开始他就坚信的赛制。「抢跑一点都不重要,跑对方向才重要。」

所以,徐驰看起来并不担心这些新来的竞争者。问他怕不怕大厂和其它创业公司一拥而上,他答:「我们最怕的,是这个行业只有自己。如果没有别人,没准说明我们走错了方向。所以热闹一点挺好的。」

2016 年,徐驰离开混合现实先驱企业 Magic Leap,回国草创,做一副在当时没人看好的眼镜。

快十年过去了,他庆幸 XREAL 能活到今天,运气占了相当大的因素。

「感谢这个赛道前十年的起起伏伏,让我有机会不断打怪升级……等到真的要跟大厂掰手腕的时候,不至于一上来就是总决赛。」

爱范儿等与徐驰、XREAL 产品负责人刘宗楷进行了一次专访,从全新的子品牌 xbx 和第一副价格打到 1699 元的 AR 眼镜产品 a01 聊起,一路聊到他怎么看待竞争,如何比较自己与同行之间的资本效率、AI 眼镜会不会最终取代手机,以及一个第一次创业的人,凭什么活到今天。

「年轻人最好的,就是不迷信传统」

爱范儿:XREAL 这些年的特质就是高端化,为什么要在这个时间点推出 xbx 这个品牌?

徐驰:我们一直说,今天的智能眼镜行业很像 05、06 年的手机行业,很碎片化,系统、应用生态、交互范式都不统一。在这个相对早期的阶段,没有哪个品牌能够覆盖所有的价位段。所以我们就想,有没有可能做两种风格不一样的产品,像 A 面与 B 面一样。

这个行业充满波折,是出了名的难做。很长一段时间里,大家都在摸索,我们自己也(一段时期内)没有一个特别清楚的定位。但是「XREAL 」在我心里就是那个极致创新的品牌,更冷酷、更经典。但是,一个品牌尚未立住的时候,我没办法再去做一个更大众、更宏观的东西。

慢慢地,XREAL 成为了我想要的那种更内敛的品牌,这时候,就可以有一个更绽放的品牌跟它相互映照了。这就是我说的 A 面与 B 面。A 面没立住的时候,就没有 B 面。

这件事虽迟但到。从今往后,我们不只是一家叫 XREAL 的公司,还是一家 x by XREAL 的公司。

爱范儿:年轻人想要什么样的 AR 眼镜?难道年轻人就不想要极致的产品?

刘宗楷:对年轻人来说,个性与自我表达是每个人心里的渴望。市面上不管是 AR 眼镜、AI 眼镜、还是 XR 头盔,很多人下意识觉得这东西就该不好看、不轻便。但我们偏要反着来,为什么不先做出一副好看、够轻、年轻人愿意戴在头上的眼镜?一副愿意戴出门的眼镜,是所有事情的第一步。

徐驰:年轻人最好的,就是不迷信那些传统的大道理。颜值就是正义,好看就好,好用就好。我们希望用 a01 这副眼镜让大家明白,一千多块的价格也可以做到两千多块的体验。我们会把它长期做下去。

爱范儿:必须戴到外面,才能影响更多潜在受众。

徐驰:没错就是这样。我们希望这个产品可以在地铁上,在咖啡馆里,在飞机上,在各个地方,更多的年轻人把它戴到外面,而且是不尴尬的。所以我们做了极致的轻量化和个性化设计。

爱范儿:轻量化肯定有取舍。一个产品想做更高的分辨率、帧率、视场角,模组就会变大;模组大了,重量就会大、配重也会失衡。

刘宗楷:做轻的同时还要保证体验,真的非常难。镜片和外壳的厚度能不能再降一点,但强度还能保住。每一个器件既要轻还要保住性能,我们抠了很多细节。

这条路没有尽头,就是一个个夜晚,一次次较劲和争吵。当然,我们觉得还可以做得更好。

爱范儿:AR 眼镜能做到的 FoV(视场角)物理极限是多少?以及不考虑极限,只说在不同场景下人类佩戴的人体工学舒适度,最优解是多少?

徐驰:我给你个最直接的答案,最好的视场角应该是在 85° 左右,但这是在不计成本堆料、不考虑重量的前提下。

在 Project Aura 上,我们做到了 70°,在这个产品形态下已经是非常不错了,但是仍然有差距。什么时候我们能做到 85°,并且仍然是轻量化的,那么我们会觉得至少在显示端做到极致了。

刘宗楷:根据场景来看,比如你戴上 VR 头显去火星,画面主体是一艘宇宙飞船,背景则是宇宙星空——你需要同时看到主体和背景才能获得最大的沉浸感。但是对于 AR 眼镜,最好的背景其实是真实世界。如果是打游戏或者看球赛可能就不需要很大的角度;但如果是看电影,或者附着在真实环境里的 AR 显示,那么宽视角的沉浸感就更重要。所以最终还是取决于内容是否沉浸。

至于人眼的注意力聚焦视角,从眼科学上来说的确有极限,一般就是水平方向的 50° 左右,垂直的 30-40°这个区域内。

视场角并不是唯一的关键因素,还有电致变色、性能续航等等。在我们定义不同产品的时候,会有无数个取舍的拨杆,往不同的方向去拨。

「我们最怕的,是这个行业只有自己」

爱范儿:苹果也入场了,国内大厂的竞品也已经上市,价格越压越低。你怎么看?

徐驰:大家进来,我认为是好事。我们最怕的是什么?是这个行业只有我们自己——那说明这个赛道没人关注,没人看好。

我们始终认为,眼镜是最有机会替代手机的下一代计算终端。虽然已经创业十年了,我们也才刚刚开始,我们的渗透率可能还不到 1%,后面还有百倍甚至更大的成长空间,所以大家一起来把蛋糕做大是件好事。

我们这个行业是有泡沫的,但泡沫不一定是坏事,说明大家对行业的期待值很高。过去在每个阶段,都有过想挣快钱的人,发现不好赚就走了。泡沫褪去,受害的其实是消费者。而真正推动行业往前走的,是那些把「用户期待」和「产品体验」之间的差距一点点缩小的人。

打个比方,今天的 AI 眼镜就像五岁小孩,而我们定义的全天候佩戴的 AI 眼镜就像贾维斯。这中间的差距得靠底层创新去一点点推动。这些创新不会无缘无故发生,背后一定有人负重前行。

问:你们跟 Meta 的距离还有多少?

徐驰:举个不那么恰当的对比:2025 年 Meta 的 Reality Labs 业务营收是 22 亿美元,亏损接近 200 亿美元。我们今年做到了 2 亿美元营收,差不多是它的十分之一,但我们的亏损不到 2000 万美元。

十分之一的营收,千分之一的亏损,我觉得我们的资本利用效率还可以,这也是我们的优势。

爱范儿:你们有自己的全栈自研芯片、光学,但 Project Aura 的部分算力还是用的骁龙,两者这两者是什么关系?将来 XREAL 会否提高核心算力的自主性?

徐驰:X1S 是一颗完整的 SoC。在 Aura 上,所有对延迟和带宽敏感的计算,放在我们的 X1S 芯片上,其它的给骁龙。

我们的芯片就是纯端侧计算,骁龙芯片放在 puck(外挂的计算单元) 上。这两者不是处理器和协处理器的关系,而更像是「端侧」和「云」之间的关系。有些计算需要发生在离你更近的地方,更加及时。

我们一直说眼镜会取代手机。在可预见的将来,puck 会消失,直接换成你的手机就行了;更长远来看,如果眼镜真的取代手机,它需要自己能够处理所有的计算。这才是我们为什么押注自主芯片的意义所在。

前段时间美国出台禁令,先进制程的晶圆不能直接运进中国大陆。这件事挺流氓的,我们的芯片在这个范畴内,本来要在大陆做封装,结果必须在台湾封装完才能运回大陆。当时国内一大批芯片厂商都在争抢台湾的封装资源,造成了一次性的短缺,跟今天的内存短缺很像。为此,我们的业绩也少了蛮大一块,否则去年 Q3、Q4 的增长会很明显。

但从长远看,这反而驱动我们继续往前走。还好我们今天销量不是很大,总比卖了几百万台突然被卡脖子要好(笑)。我们希望中国有越来越多的先进制程握在自己手里,谁也卡不住。

爱范儿:Project Aura 在国内能上吗?你们会选择哪些国内模型厂商一起探索?

徐驰:因为 Android XR 和 Gemini 强绑定,而 Gemini 在国内用不了。所以很遗憾,要不你海淘吧(笑)。

我们不会放弃国内市场,如果 Android XR 能够和 Gemini 解耦,连上国内 AI,就是 Project Aura 进入国内市场的时候,但不是今天。就像当年 iPhone 也不是刚问世就进入中国。我觉得这个结果我们可以接受。It’s okay.

对我们来说,阿里是我们的股东,我们也一直跟字节跳动保持交流。在模型方面,我们不会排斥任何一家。我们的终极理想,是 AI 能像搜索引擎一样换着用。未来的大模型会变成基建,谁家的 token 效果好就用谁,可以无缝切换。

「眼镜凭什么取代手机?」

爱范儿:你自己也说,AR 眼镜这个品类存在很多年了,但渗透率仍然很低。让更多人接纳它的「入门毒药」会是一个怎样定义的产品?

徐驰:大概率还是主流两大类:更加全天候的 AI 眼镜、带显示但不够全天候的 AR 眼镜。

这个「全天候」(always-on) 有两层意思:一是全天候佩戴,二是全天候使用。今天的问题是,AI 眼镜的主要场景不是 AI,而是听歌拍照;你打开相机拍个 30 分钟,产品就没电了。如果说眼镜是你的个人助理,但它每天只能睁眼 30 分钟……那就不是一个全天候的助理。

在将来的某个时间点,会有一款 35g 以下、全天候续航的产品,作为 AI 交互的载体。这样的产品,我认为是能做到的。如果做到了,它绝对会是人手一个的设备。

另一条路就是 AR 眼镜,追求更高清、更多内容。这个路线今天还是分体机形态,能做到 60g,但终极形态可能会是一体机。

这两种产品,一个像 iPhone,人手一台,整个品类可能是每年十多亿台的出货量;另一个像我们现在的设备,做到终极形态可能是平板和笔记本电脑加起来的体量,一年 1.5 到 2.5 亿台,也很不错;以及传统头显,可能体量会像台式机——这三者会长期共存。

至于那个彻底引爆品类,将眼镜真正推上「取代手机」道路的产品是什么,我认为到 2027、28 年,我们会看到更清晰的答案。

爱范儿:即便做到了极致的轻量化,你怎么说服那些仍然嫌重的客群?

徐驰:我认为今天大家太容易先行代入刻板印象,比如「没有 35g 绝对不戴」。今天的行业里,抛开补贴的产品,还没有不吃国补、销量过百万的产品。如果真能达到 35g,早就是 15 亿台的水平了。

我们得一步步来:先把一个单品做到百万,再做到千万,再做到一个亿、15 亿。中间有好多级台阶。我相信在今天,一副体验足够好的眼镜,50g 也不妨碍它卖一个亿。影响接受度、卡住销量的只是体验还没有打磨足够好。

爱范儿:手机厂商觉得未来 5-10 年里手机仍是主角。但与此同时手机厂商也在做眼镜。你看到的未来竞争格局是怎样的?

徐驰:的确,今天存在的东西,很长时间内仍然会存在。但核心是谁能站在价值链的最高点。就好比曾几何时我们觉得互联网大厂的超级 app 太牛了,但今天它们的风头一定没有 AI 公司更盛。手机也是一样。随着科技发展,总有一些新的领域、企业,会站到价值链更高的位置。

我们相信未来两年内会形成共识:眼镜是离 AI 最好的原生终端,它可能是离多模态 AI 最近的东西。这也是为什么我们跟谷歌一起去畅想未来的全新交互范式,以及新范式下的终端长什么样。

这件事令我非常兴奋,一是因为它难,二是如果做对了,会非常 rewarding。

爱范儿:其它形态的 AI 硬件,比如 pin、带摄像头的耳机,不如眼镜吗?

徐驰:不光我这么想,Demis Hassabis 也说眼镜绝对是所有 AI 里最中心的设备。因为只有眼镜能够拿到人的关注点这一关键上下文信息。

你戴了一个 pin,它能看到你面前有一堆人,但眼镜在未来会有眼动追踪,它能知道我当下到底在看什么,周围的信息可能没那么重要。只有眼镜能带来端到端闭环的数据链路,其它终端都不具备这个能力。当然别的形态可以辅助,但眼镜一定是最关键的入口。

「靠运气,也要打怪升级」

爱范儿:创业者、企业家会有不同恐惧来源,可能是内部的组织效率跟不上时代,可能来自同业的竞争,可能来自异业的颠覆。足以让你从睡梦中惊醒的恐惧是什么?

徐驰:做企业和做人一样,做人也会迷茫,有人给你指点,让你找到对标。但我觉得说到底,烦恼都是自己给的。

我相信伟大的企业全是价值观驱动的。最核心的就是找到一个组织舒服的状态,让全公司都认可你的这套价值观——无论离开还是留下,都会继续在这套价值观的规范下做事。只要这件事做到了,竞争也好,别的也好,其实都还好。

我个人睡眠还挺好的,我觉得这是创业者得有的一个特质(笑)。

要说真有什么让我担忧,那就是我所崇尚的价值观,是否真的能够百分百贯彻执行?我怕的是 XREAL 变大了,文化会被稀释掉。我需要大家打心底里相信一件事:我们要当创新者、引领者。这不容易,在中国尤其不容易。在中国大家的习惯是服从等级制度,「老板说的都对」,可我还是希望,大家既能自下而上,又能自上而下,形成一个扁平高效的机制。

爱范儿:就像你说的,几轮泡沫起起伏伏,XREAL 还是活到今天了。

徐驰:2016 年我从 Magic Leap 回国,到今天整整十年了。那时候真是草根创业,我就是想做一副眼镜。能活到今天,回头看真是运气挺好。这是我的第一次创业,也感谢这一路的投资人(以及其他同行者),让我在这个过程里慢慢理解了怎么去运作一家企业,一个组织,一门生意。

说实话,如果这个行业发展再快一点,起势再猛一点,没机会把自己磨练好,去应对巨头杀进赛道时那种强烈的竞争,可能我们就没了。

每个创业公司大概都得经历这么一段:你得先打怪升级才能站上更大的舞台。如果一上来就是总 boss,来一帮阿里字节那样的对手就没得打了。所以我其实挺感谢这个赛道前十年的起起伏伏,才有一天让我能跟大厂掰一掰手腕。

AR 行业是出了名的难做,我又干得有点久了,所以对这些事现在看淡了。只要大家都还在牌桌上,这就是一件长期主义的事情。

我认为 AR 是一场万米长跑,跑对方向比抢跑更重要。如果行业还在早期但所有人都往一个地方冲,那个所谓的共识可能就是泡沫。反而是早期非共识的东西,最后被时间验证是对的。历史无数次这样告诉我们。

文|杜晨

采访|杜晨

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/dCzZ01k
via IFTTT

2026年5月26日星期二

早报|小米卢伟冰:大型新车今年下半年上市/支付宝推出全球首个Token Pay服务/滴滴崩了,官方致歉

cover

🤖

小米 MiMo-V2.5 系列 API 永久降价,最高降幅 99%

📱

QuestMobile:AI 原生 App 月活达到 4.61 亿

💰

小米一季度营收 991 亿元,卢伟冰:今年下半年有全新平台的新车

⚠

滴滴全国多地出现系统故障

🧠

Google CEO 解释 AI 编程落后原因:缺少 Cursor 这样的用户入口

📱

小红书上线音频播客业务

🚗

特斯拉高管:正研究三电机版 Model 3 的可行性

🚙

启境汽车宣布全国首批 300 家相关门店陆续开业,覆盖 70 城

🚗

东风牵头起草乘用车底盘强制国标过审

💡

黄仁勋:AI 时代学什么不重要,讲故事、创造力才重要

🎧

vivo 首款无线头戴降噪耳机定档 5 月 29 日

🛍

1699 元起,XREAL 推出年轻副线品牌 xbx,首款 AR 眼镜 a01 亮相

🚙

小米汽车发布世界模型框架,重建与生成一体化

🤖

阿里 Qwen3.7-Max 登顶国产第一,仅次于 Claude Opus 4.7 thinking

🧠

昆仑万维发布百万上下文 Agent 模型 SkyClaw-v1.0

🦿

擎朗智能发布小尺寸人形机器人 XMAN-L1,接入豆包、腾讯等大模型

💻

面壁智能发布 MiniCPM5-1B,主打 2B 以下端侧文本模型

📱

支付宝 AI 支付笔数达到 3 亿

📋

上海上线网络餐饮电子证照核验应用

⚠

抖音公布 AI 谣言处置成果:相关内容平均浏览量下降 62%

🎬

周杰伦《太阳之子》登陆 Apple Music 国区

🎥

《爱是愤怒》发布「温暖的家」预告,定档 6 月 19 日

重磅

小米 MiMo-V2.5 系列 API 永久降价,最高降幅 99%

今天凌晨,小米技术宣布,对旗下 MiMo-V2.5 系列 API 进行永久降价,相比原始定价最高降幅可达 99%,且不再区分上下文窗口长度。

MiMo-V2.5-Pro 输入缓存命中价格从此前 ≤256k 窗口下的 ¥2.80 / 百万 tokens 降至 ¥0.025,降幅约 99%;输入未命中缓存价格从 ¥7.00 降至 ¥3.00,降幅约 57%;输出价格从 ¥21.00 降至 ¥6.00,降幅约 71%。

与此同时,Token Plan 计费体系同步优化,定价不变,可用量提升至原来的 5 至 8 倍。MiMo-V2.5 标准版(¥99)套餐可用 Token 数量从原来的 200M 升级至 1300M,Pro 套餐(¥329)从 700M 升至 4700M。

在降价之外,小米还宣布「百万亿 Token 创造者激励计划」提前收官。该计划自 4 月 28 日上线,截至今日北京时间 5 月 26 日 16:08,100 万亿 Tokens 已全部发放完毕。

大公司

QuestMobile:AI 原生 App 月活达到 4.61 亿

调研机构 QuestMobile 昨日发布 AI 平台采信逻辑与信源偏好研究报告。报告显示,截至 2026 年 4 月,AI 原生 App 月活用户规模达到 4.61 亿,月人均使用次数和时长分别为 91 次、180 分钟。

报告还提到,豆包、DeepSeek 月人均使用时长分别为 144.6 分钟和 109.5 分钟,同比增长 80.6% 和 106.9%。

🔗 相关阅读:别再无脑装豆包了!实测五款国产 AI App,最强的竟是…

小米一季度营收 991 亿元,经调整净利润 60.72 亿元

小米集团昨日发布 2026 财年第一财季财报,季度营业总收入 991 亿元,同比下降 10.9%;归母净利润 47.23 亿元,同比下降 56.76%;经调整净利润 60.72 亿元,同比下降 43.1%。分部来看:

  • 手机 × AIoT 分部收入 793 亿元,同比下降 14.5%,分部毛利率 22.5%;
  • 智能电动汽车及 AI 等创新业务收入 199 亿元,同比增长 6.9%,分部毛利率 20.1%,经营亏损 31 亿元;
  • 一季度整体毛利率为 22.0%,同比下降 0.8 个百分点,环比提升 1.2 个百分点;
  • Xiaomi MiMo-V2.5-Pro 跻身 Artificial Analysis 榜单综合智能指数、Agent 指数全球开源模型并列第一,未来三年在 AI 领域投入 600 亿元。

在晚间的财报会上,小米集团总裁卢伟冰在会上正式预告,一款基于全新平台打造的大型新车将于今年下半年上市,并规划有多款车型,称其「非常有创新」「非常有竞争力」。

卢伟冰在会上解释了 YU7 销量回落的原因:一方面,较长交付周期导致部分用户转向竞品;另一方面,初期产品线规划存在缺失,入门标准版缺席,导致对中心城市通勤用户吸引力不足。

为此,小米推出了 YU7 标准版与高性能版 YU7 GT,以「一低一高」策略补齐产品矩阵。他表示,目前门店试驾及锁单反馈良好,对实现全年 55 万辆交付目标仍有信心。

在出海规划方面,卢伟冰透露,小米汽车计划于明年三、四季度启动出海,首战欧洲,采取先发达国家后发展中国家、先高端后中端、先右舵后左舵的分阶段策略。目前相关准备工作正在推进中。

滴滴全国多地出现系统故障

据鞭牛士报道,昨日 17:40 左右,多名用户在社交平台反馈滴滴出行系统故障,问题包括无法开启行程、App 闪屏卡顿、定位异常、无法显示司机位置,以及司机端无法定位乘客。

网传截图显示,部分用户在打车后遇到「抱歉,网络出了点问题,请稍后重试」「订单太多小滴扛不住了,请稍候再试」等提示。报道提到,广东、江苏、北京、江西、新疆等地均有用户反馈异常,企业滴滴服务也受到影响。

当晚,滴滴官方发文致歉:

非常抱歉,因云厂商网络专线故障,造成今天 17 点左右滴滴 App 部分服务出现短暂故障,目前服务已全部恢复。故障期间产生的费用异常等问题我们正在紧急处理,将尽快妥善解决。

Google CEO 解释 AI 编程落后原因:缺少 Cursor 这样的用户入口

日前,Google CEO 桑达尔·皮查伊(Sundar Pichai)在《纽约时报》旗下播客节目《Hard Fork》接受专访时,首次公开承认 Google 在 AI 辅助编程领域目前落后于行业前沿。

他将原因归结为缺少像 Cursor 或 Claude Code 这样能直接嵌入开发者日常工作流的编辑器入口——这一缺失导致 Google 流失了最关键的动态工作流数据,进而拖慢了模型在智能体编程场景下的迭代速度。

皮查伊在专访中侧重展示了 Google 内部 AI 编程工具 Antigravity 的闭环测试数据,包括内部 Token 消耗量每周翻倍,以及在极端性能测试中用 12 小时从零构建出操作系统。

他表示,Google 底层技术底座依然完备,当前在公开市场的被动,主要源于应用场景与用户反馈闭环的广度限制,而非底层能力的根本性缺失。

小红书上线音频播客业务

昨天,小红书在新生代创作盛典上宣布上线音频播客业务,开放 PC 端和移动端音频直接上传,并支持 PC 端通过 RSS 同步导入播客内容。

新功能会把播客展示在创作者首页。小红书还计划在发现栏目上线播客独立频道,并支持小窗播放、断点续播、熄屏播放、定时关闭和 15 秒快进快退等音频收听功能。

特斯拉高管:正研究三电机版 Model 3 的可行性

近日,特斯拉工程副总裁拉尔斯·莫拉维在《Ride the Lightning》播客特别节目中透露,他正在研究为 Model 3 搭载三电机系统的可行性。

莫拉维在节目中被主持人瑞安·麦卡弗里直接追问 Model 3 是否会配备三电机时,并未否认这一方向,表示「一直在认真思考这件事」。

他特别提到希望将碳纤维套筒电机引入 Model 3 平台——这一技术正是 Model S Plaid 得以实现持续强劲加速能力的核心硬件。

目前,Model 3 Performance 采用前后双电机布局。若要在后副车架内加装第三台电机,工程空间将极为有限。莫拉维坦承,这是一项「高投入、需权衡回报」的规划,在现阶段与特斯拉整体发展目标并不契合。

他进一步解释,公司当前全部高性能研发资源已集中投入新一代 Roadster。这款旗舰跑车将搭载特斯拉最新一代电机技术,是目前工程团队的优先级所在。莫拉维表示,一旦 Roadster 正式投产,相关高性能电机技术未来有望向其他车型延伸。

启境汽车宣布全国首批 300 家相关门店陆续开业,覆盖 70 城

启境汽车昨日宣布,全国首批 300 家相关门店正陆续上线开业,覆盖北京、上海、广州、深圳、杭州、武汉、郑州等一二线城市,合计 70 城。此次开业门店分为两种形态。

  • 「用户中心」,由启境直营或授权经销商运营,主要承载销售咨询、到店看车、试驾预约、车辆交付及售后等全流程服务;
  • 「体验中心」,由引望联合启境及授权经销商共同打造,定位沉浸式体验空间,以华为乾崑智驾技术及其搭载车型的展示体验为核心,选址城市核心商圈。

东风牵头起草乘用车底盘强制国标过审

东风汽车近日披露,其在乘用车底盘领域牵头起草的首个国家强制标准已全票通过审查。该标准聚焦制动辅助系统,预研至今历时三年多。

制动辅助系统会在驾驶者紧急制动但踩踏力不足时识别驾驶意图,并瞬间把制动力提升至最大,以缩短制动距离。

东风称,我国新上市 M1 和 N1 类车型中,BAS 装备率逐年上升,乘用车新车中已有 90% 以上车型标配 BAS;出口车型按联合国法规 UN R139 已 100% 强制装备 BAS。

💡 黄仁勋:AI 时代学什么不重要,讲故事、创造力才重要

据《商业内幕》报道,英伟达 CEO 黄仁勋近日在英国 Channel 4 播出的访谈中谈到 AI 时代的教育选择。他认为,今天最值得培养的是讲故事、创造力和判断力,而不是提前押注某一个具体学科。

无论你选择什么作为自己的热情所在,你唯一需要做的,就是问自己:人工智能如何能够提升我的学习、我的技艺、我的使命?

黄仁勋表示,过去人们很容易建议孩子学习物理、工程或计算机科学;但在 AI 可快速补足工具能力后,单一专业选择不再是唯一答案。

他的核心判断是,讲故事、创造力和判断力会继续保有价值。AI 可以像导师和教练一样帮助学生进入不同领域,学习者仍要提出好问题、组织信息、评估结果,并把复杂内容讲清楚。

黄仁勋把 AI 工具视为扩大教育反馈的方式:学生无论学习艺术、科学还是工程,都可以借助 AI 获得更快练习和解释。他没有替学生指定专业,而是把「如何用 AI 放大自己的判断」作为新的学习框架。

新产品

vivo 首款无线头戴降噪耳机定档 5 月 29 日

vivo 昨日官宣首款无线头戴降噪耳机,将于 5 月 29 日 19:30 发布。预热海报显示,这款耳机提供云雾白、微风紫两种配色,重量约 238g。

功能上,该耳机支持高沉浸主动降噪、跨生态无缝三连接和多设备切换。

1699 元起,XREAL 推出年轻副线品牌 xbx,首款 AR 眼镜 a01 亮相

XREAL 昨日宣布推出年轻副线品牌 xbx(X by XREAL),首款产品为 xbx a01 系列 AR 眼镜。新品主打随身大屏、游戏和通勤娱乐场景,品牌口号是「只管玩就好」。

xbx a01 系列采用半透明镜身和可更换「百变前框」设计,用户可以替换前框,也可以 3D 打印自定义配件。整机重量控制在 62g,配备三种尺寸鼻托、三档可调柔性镜腿和自适应弹性铰链。

显示部分,xbx a01 支持 1600nits 感知亮度、14 档亮度调节、HDR10、10.7 亿色、AI SDR 转 HDR,以及 50° 视场角,对应 4 米外约 147 英寸显示效果。

新品还搭载超清空间防抖,通过 AI 姿态预测、动作捕捉和画面预渲染,在地铁、高铁、飞机等移动场景中降低画面晃动。

价格方面,xbx a01 售价 1699 元,xbx a01+(增加遮光罩和环绕模式)售价 1799 元。

小米汽车发布世界模型框架,重建与生成一体化

小米技术昨日发布 Xiaomi Auto World Model 全新框架,面向辅助驾驶世界模型,把重建模块 WorldRec 与生成模块 WorldGen 合并进同一套系统。据介绍,该方案避免先重建场景再简单喂给生成模型的串联路径,改为让两侧互相约束:

WorldRec 维护随观测扩展的 4D Gaussian 全局表示,为生成模型提供 3D 几何先验;WorldGen 则补全未来帧、未观测视角和遮挡区域,让模型能够生成低频但高风险的长尾驾驶场景。

小米称,这套框架在稳定性、一致性和真实性上形成互补。生成侧还采用两阶段训练:先用全双向时序注意力预训练,再进入因果微调,并通过 ODE 蒸馏把去噪步数从 50 步压到 4 步、提速 12 倍。

阿里 Qwen3.7-Max 登顶国产第一,仅次于 Claude Opus 4.7 thinking

昨日,阿里云面向海外市场发布全新 AI 产品官网 Qwen Cloud、Agent 产品 MuleRun,并更新智能体编程平台 Qoder 与通用桌面智能体 QoderWork。

Qwen Cloud 定位为面向海外开发者的 AI 产品入口,提供网站、Skills 和 CLI 三类入口:网站用于浏览、试用、比较模型并接入 OpenAI 兼容 API;Skills 将平台能力封装为 Agent 可读的标准化指令;CLI 面向开发者和智能体提供可重复调用的命令行操作层。

阿里云还披露,Qwen3.7-Max 在 LMArena Code Arena WebDev 榜单中得分 1541,排名第二,仅次于 Claude Opus 4.7 thinking,超越 Claude Opus 4.6,位列国产第一。

该模型面向 Agent 场景,可与 Claude Code、OpenClaw、Hermes Agent 等框架协同,完成长程工具调用任务。

阿里云还把 60 多款云产品进行 Skill 化、MCP 化和 CLI 化改造,使云产品以标准能力模块供 Agent 调用。此外,Qwen3.7-Max 在百炼平台默认开启自动隐式缓存,可在部分场景降低输入成本。

昆仑万维发布百万上下文 Agent 模型 SkyClaw-v1.0

昆仑万维天工 AI 昨日发布 SkyClaw-v1.0,定位为面向真实工作流的百万上下文 Agent 模型。官方称,该模型支持百万 token 上下文,重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。

SkyClaw-v1.0 经过大规模 mid-train、高质量合成任务 SFT 与端到端强化学习优化,可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境运行,同时适配 Claude Code、Codex 等代码 Agent 框架。

官方还称,该模型在主流 Agent benchmark 与 Skywork 内部 Claw 任务中展现稳定的多步执行能力,表现超过 Minimax 2.7、DeepSeek V4 Flash、Qwen 3.6 35B A3B 和 27B 模型,定价低于 Minimax 2.7 与 Qwen 3.6 系列模型的一半。

擎朗智能发布小尺寸人形机器人 XMAN-L1,接入豆包、腾讯等大模型

据界面新闻报道,擎朗智能昨日宣布推出新型小尺寸人形机器人 XMAN-L1,定位面向轻量级互动岗位场景。

XMAN-L1 身高 136cm,拥有 42 个仿生自由度,膝关节峰值扭矩可达 132 牛·米,单腿功率超过 2000W。机器人端侧算力为 100TOPS,支持接入豆包、腾讯等大模型,可实现自然语言对话功能。

官方表示,该机器人发布后可立即投入使用,适用场景包括互动、客流引导与轻量表演。

面壁智能发布 MiniCPM5-1B,主打 2B 以下端侧文本模型

面壁智能与 OpenBMB 昨日正式发布并开源 MiniCPM5-1B。官方称,这款 1B 参数端侧文本基座模型在 Artificial Analysis Intelligence Index 的小尺寸模型榜单中获得 17.9 分,超过 Qwen3.5-2B 的 16.3 分。

MiniCPM5-1B 的重点是把文本模型能力压到更低部署门槛。官方材料提到,INT4 量化后模型权重约 0.5GB,可在手机、浏览器和低资源终端上运行;能力覆盖知识、数学推理、代码推理和工具调用等维度。

面壁还披露,MiniCPM5-1B 的 Base Model 版本由 ForgeTrain 预训练完成。官方称 ForgeTrain 是由 AI 编写的生产级大模型预训练框架,训练速度比英伟达 Megatron 快 10%。

新消费

支付宝 AI 支付笔数达到 3 亿

支付宝昨日官宣,其服务智能体支付的笔数已达到 3 亿,并发布 AI 钱包、Token Pay 和 ACT 协议 2.0。官方表示,这套能力已覆盖头部开发平台、OpenClaw 类 Agent、智能眼镜、智能耳机、智能座舱以及部分 AI 工具平台。

支付宝 AI 钱包面向个人用户,核心是管理智能体授权与支付任务。用户可在支付前和支付中查看智能体任务,支付后查询账单;Token Pay 则面向按 Token 计费的 AI 服务。

支付宝还称,自研「AI 付智能安全系统」已通过中国信通院泰尔实验室两项安全认证,并向 AI 开发者推出 Token 补贴、个人开发者 0 支付费率和企业费率折扣。

上海上线网络餐饮电子证照核验应用

上海市市场监管局昨日推出全国首个网络餐饮电子证照核验应用,目标是整治「幽灵外卖」。该应用依托电子营业执照系统,打通监管部门、平台与商户的数据链路,形成从商户申请、证照比对、本人授权到平台亮证的闭环。

流程上,商户入驻平台时,提交信息会与官方数据库实时比对;核验通过后,商户法定代表人需通过「电子营业执照」小程序完成实名认证和精准授权;平台随后可调取加注平台名称和时间的官方电子证照,并在店铺首页公示。

监管部门称,这套机制把平台从人工比对和事后处置转向前置核验,并能追溯平台获得商户授权调取证照的记录。

抖音公布 AI 谣言处置成果:相关内容平均浏览量下降 62%

抖音昨日披露,过去一年平台在谣言治理中引入大模型技术,被处置谣言的平均浏览量下降 62%。平台还盘点了过去一年「十大辟谣案例」,称这些谣言均经由 AI 求真大模型识别或处置,并通过「求真卡」汇总权威信源信息、生成辟谣内容。

抖音此前已上线「AI 抖音求真」功能,用户可通过大模型辅助辨别谣言、查看事件真实信息。平台在这次披露中把 AI 求真定位为谣言治理工具的一部分,用于降低谣言扩散前的浏览量。

好看的

周杰伦《太阳之子》登陆 Apple Music 国区

周杰伦新专辑《太阳之子》昨日结束约两个月付费独占,登陆苹果 Apple Music 国区。

该专辑今年 3 月 25 日已在全球数字平台上线,此前在 QQ 音乐等平台需要单独付费购买,单张专辑约 40 元;现在,Apple Music 国区用户可通过订阅直接收听。

杰威尔音乐官方微博此前已陆续发布《太阳之子》推出以来的 7 支 MV。

《爱是愤怒》发布「温暖的家」预告,定档 6 月 19 日

据微博电影报道,影片《爱是愤怒》昨天发布「温暖的家」预告。影片由朴松日执导、里则林编剧,王安宇饰演刘浩,王玉雯饰演陈菜菜。

预告围绕刘浩与陈菜菜的相遇、相爱和组建家庭展开。两人原本期待打造一个温馨小家,安稳生活随后被意外打破。电影已定档 6 月 19 日端午假期。

长征题材电影《四渡》定档 6 月 26 日

重大革命历史题材电影《四渡》官宣定档今年 6 月 26 日全国公映,献礼红军长征胜利 90 周年。

影片由刘伟强监制,刘毅编剧,刘烨、王雷、王志飞、于适、王耀庆等主演,导演为徐展雄。电影聚焦遵义会议后,3 万红军在毛泽东同志领导下,于 40 万敌军围堵中四渡赤水、以少胜多的历史事件。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/EjhVWvR
via IFTTT