2026年5月8日星期五

独家|苹果带摄像头的AirPods或被迫暂停,部分产线「原地解散」

今天凌晨彭博社 Mark Gurman 最新爆料称,苹果内置摄像头的 AirPods 已进入 DVT(设计验证测试)阶段,原型机接近最终设计,最快有望于今年 9 月随新 iPhone 一同发布。


这也是苹果第一个真正意义上的 AI 可穿戴设备,这个被内部视为「给 Siri 装上眼睛」的产品,在供应链体系中的代号为 H90,研发周期已长达约 4 年。

但据接近供应链的知情人士向 APPSO 透露,代号 H90 的项目近期在供应链端出现了异动:部分产线已经「原地解散」,项目可能已被暂时搁置

知情人士将原因指向同一个方向:欧盟隐私法规的合规风险

需要说明的是,供应链动态的解读存在多种可能。产线调整、供应商切换、设计方案迭代,都可能造成类似信号。

但考虑到苹果对核心组件供应商的强管控传统,以及这款产品在苹果 AI 战略中的核心地位,因合规问题导致项目节奏调整是目前最有可能的推测。

换句话说,苹果可能不是做不出这个产品,很可能暂时过不了欧盟这一关。

苹果第一个 AI 可穿戴产品,是什么样的

在展开搁置原因之前,有必要先讲清楚新 AirPods 到底是什么。因为它和大多数人想象中的「带摄像头的耳机」很不一样。

外观上,新款 AirPods 和你现在用的 AirPods Pro 3 长得非常像。最明显的区别在耳机柄:因为要容纳摄像头模组,H90 的柄体略微加长。

如果不仔细看,可能很难一眼发现它和普通 AirPods 的区别。苹果显然在设计上克制了「异物感」,没有像光帆科技那样把摄像头直接裸露在耳机外壳上。

摄像头的类型是理解这款产品的关键。 新 AirPods 搭载的是低分辨率红外传感器,技术原理和 iPhone 上用于 Face ID 的模组属于同一家族。

▲图片由 AI 生成

这个摄像头不拍照和录像,也不生成任何你能打开查看的图像文件。它的工作方式更接近一种「环境扫描」:通过发射和接收红外光感知周围空间的深度信息、物体轮廓和运动状态,然后把这些数据喂给 AI 处理。

简单来说,这个摄像头是专门给 AI 加上的「眼睛」。

H90 预计搭载苹果新一代 H3 芯片。目前AirPods Pro 2 使用的 H2 芯片已经能处理自适应降噪、空间音频计算等任务,H3 则需要额外承载视觉数据的端侧 AI 推理,算力需求提升了一个量级。

产品内置微型 LED 指示灯,摄像头工作时自动亮起,会向周围人发出工作中的的提示,这和 Meta Ray-Ban 的设计类似。

在苹果的设想里,戴上这款 AirPods 走在路上,你不用掏出手机,耳机上的传感器能实时获取视觉上下文,让 AI 识别处理,你只需要说话就行。

▲图片由 AI 生成.

这种体验被称为「环境智能」(ambient intelligence):AI 不再被局限在手机屏幕里等你手动操作,可以随时感知你所处的环境,主动提供帮助。

理解了这个定位,才能理解这个产品为什么可能被欧盟的隐私法规会精准命中。

欧盟为什么能卡住这款耳机

一个不拍照、不录像、用红外线而非可见光的小传感器,为什么无法通过欧盟的隐私监管体系?

因为在欧盟的法律框架里,「采集」这个动作本身就是敏感的,不管你拿采集到的东西干了什么,欧盟拥有全球最严格的隐私监管体系,已经不止一次让苹果碰壁。

欧盟有三部法律构成了对摄像头版 AirPods 的包围圈。GDPR(通用数据保护条例)管数据处理、ePrivacy Directive(隐私与电子通信指令)管终端设备访问、EU AI Act(人工智能法案)管 AI 应用的伦理边界。三部法律从不同角度切入,但指向同一个结论:一个在公共空间持续感知环境的设备,在现行法律下几乎无法完美合规。

▲图片由 AI 生成.

具体来说,H90 面临的核心难题是这样的:

GDPR 第九条把生物识别数据列为「特殊类别个人数据」,原则上禁止处理。H90 的红外传感器生成的深度图和运动轨迹数据,如果通过算法分析能识别出特定个人(比如通过耳部轮廓或头部运动模式),就直接触发这条禁令。

例外只有一个:获得用户的「明确同意」,而且这个同意必须是具体的、知情的、自由给予的,不能是一个被埋在 50 页服务条款里的勾选框。

但真正致命的问题不在用户,在旁观者。

2025 年 12 月,欧盟法院(CJEU)在 C-422/24 号案件中做出了一个影响深远的判决:通过可穿戴摄像头收集的数据,即使是路人的数据,也视为「直接从数据主体收集」,必须适用即时告知义务。法院明确说了,如果允许延迟告知,就等于给「隐蔽监控」开了口子。

也就是说,当你戴着它走进一家餐厅,法律要求你立即告知在场所有可能被传感器感知到的人,告诉他们数据正在被采集、采集目的是什么、数据会被如何处理。
这在实际操作中当然是不可能的,但法律就是这么规定的。

Meta Ray-Ban 智能眼镜已经替苹果趟过了这个雷区,结果并不美好。爱尔兰数据保护委员会(DPC)批评 Meta 眼镜的 LED 指示灯「非常小」,不足以有效告知被拍摄者。德国联邦网络管理局直接禁止了能在他人不知情时录音录像的智能设备。

意大利的数据保护机构 Garante 对 Meta 在儿童数据保护上的不足提出严厉警告。瑞典媒体还曝出 Meta 眼镜录制的视频被送到肯尼亚的第三方公司做 AI 训练标注,引发一场跨国隐私丑闻。

苹果的处境比 Meta 更微妙。过去十年,「隐私」是苹果和 Google、Meta 打差异化竞争的核心人设。

「Privacy. That’s iPhone.」这句话出现在全球数万块广告牌上。一家把隐私当品牌基石的公司,推出一款可能引发系统性隐私争议的产品,承受的压力远不只是罚款,还有品牌叙事的自相矛盾。说到罚款:GDPR 下最高可达全球年营收的 4%。以苹果 2025 财年约 4000 亿美元的营收算,理论上限是 160 亿美元。EU AI Act 更狠,违反禁止性条款的罚款上限是年营收的 7%。

更直接的威胁是上市前禁令。如果欧盟数据保护机构认定苹果的风险评估不充分,完全可以在产品发布前直接叫停。对一家习惯全球同步发布的公司来说,欧盟一个市场的缺席就足以打乱整个发布节奏和供应链计划。

所以苹果面对的选择题很清楚:强行发布,冒着高额罚款且品牌人设崩塌的风险;或者暂停,等到找到合规解法再说。

从目前的信号看,苹果选了后者,这也很苹果。

苹果 AI 硬件全家桶,本要在 2027 爆发

带摄像头的 AirPods 的搁置不是一个孤立事件,这将影响苹果 AI 硬件的整个发布节奏。

2026 年初,彭博社曝光苹果正在同步推进三款 AI 可穿戴设备:
代号 N50 的智能眼镜,对标 Meta Ray-Ban,搭载双摄像头(一颗拍照录像、一颗专用于计算机视觉),计划 2027 年发售。

一款 AirTag 大小的可穿戴吊坠,配备低分辨率摄像头和麦克风,被内部员工称为 iPhone 的「眼睛和耳朵」。

以及进展最快的 H90 摄像头 AirPods。

▲APPSO 假想图,AI 生成.

三款产品的核心逻辑一样:都不试图替代 iPhone,都作为 iPhone 的感知延伸存在。用户不用掏出手机,AI 就能通过这些外设获取视觉和听觉信息。

这标志着苹果硬件策略的重要转向。Vision Pro 3499 美元的定价加上笨重的头戴设计,技术再极致也走不进大众市场。苹果现在的路线是「不造新 iPhone,造一堆让 iPhone 更好用的 AI 配件」。

库克在今年初的全员大会上罕见表态:「我们正在开发由 AI 驱动的全新产品类别。」

Vision Pro 低价版(代号 N100)也已停止开发,苹果选择跳过「便宜但笨重的头戴设备」这个中间态,直接瞄准轻量化眼镜。

在这个布局里,带摄像头的 AirPods原本是最有可能率先落地的棋子。它进展最快、技术最成熟、供应链准备最充分。它的搁置意味着苹果 AI 硬件的整体节奏需要重排,下一个窗口是 2027 年的 N50 智能眼镜。

▲APPSO 假想图,AI 生成.

但问题在于,N50 面临和 H90 完全一样的欧盟隐私挑战,甚至更严峻,眼镜的摄像头分辨率更高、更容易拍到清晰人脸。苹果需要的不是逐产品应对,而是找到一套系统性的合规方案。

这可能也是苹果新任 CEO 约翰·特努斯接任苹果后,面临的最大挑战之一。

AI 个人终端,不会停下来

除了苹果,市场不止一家公司已经跑了起来。

高通在 2026 年 MWC 大会上发出了一个明确信号。CEO Cristiano Amon 宣布「2026 年将是 AI Agent 之年」,并描述了一个名为「Ecosystem of You」的战略愿景:未来所有设备围绕 AI Agent 运转,手机不再是中心,每个穿戴设备都是 Agent 的传感器和执行器

这个愿景和苹果的 H90 方向本质一样。区别在于,高通是平台供应商,它不需要自己面对欧盟消费者,它只需要让合作伙伴有能力做出这些产品。

而高通确实已经把芯片准备好了。

3 月发布的 Snapdragon Wear Elite,3nm 制程,10 TOPS NPU 性能,可以在手表大小的设备上本地运行最高 20 亿参数的 AI 模型。三星已确认下一代 Galaxy Watch 将采用这颗芯片。

Snapdragon AR1+ Gen 1,专为智能眼镜设计,比前代小 26%,能在完全离线状态下独立运行 1B 参数的小语言模型。

高通在 AWE 2025 大会展示过,一位工程师戴着智能眼镜在模拟超市里问 AI 助手怎么做意大利面,全程没有网络连接,语音识别、推理、回答全在眼镜上完成。Meta Ray-Ban 和 XReal 也都确认将用 AR1+ Gen 1 开发下一代产品。

另外还有面向 AI 音频设备的 Snapdragon S7 Pro,NPU 性能比前代提升近 100 倍,让耳机从纯音频播放设备进化为具备情境感知能力的 AI 交互入口。

高通移动业务总经理 Alex Katouzian 在描述「Ecosystem of You」时,明确将「带摄像头的耳塞(earbuds with cameras)」列为个人 AI 设备网络中的关键形态

可见在高通的规划里,摄像头耳机已经是确定会存在的品类,问题只是谁做、什么时候做、怎么过合规关。

AI 需要视觉,设备需要成为 AI 的眼睛,这在行业也逐渐形成共识。苹果的节奏可以被欧盟法规打断,但 AI 终端这个趋势大概不会因此改变。

苹果选择暂停 H90,与其说是退缩,不如说是在等一个时间窗口:等 Siri 的能力准备好、等端侧芯片的算力再上一个台阶、等欧盟的监管态度在实践中逐渐清晰化。

这三个变量同时就绪的窗口,可能在 2027 年底到 2028 年之间打开。届时苹果大概率会带着 N50 智能眼镜和 H90 摄像头 AirPods 一起亮相,配合一个完整的、通过了 DPIA 审查的合规方案。所有人都知道新的终点在哪,不会轻易放弃率先冲线的机会。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/PTzg9do
via IFTTT

2026年5月7日星期四

早报|曝苹果考虑取消入门款MacBook Neo/理想高管谈MEGA设计争议:不是失败/千问PC端上线AI语音输入

cover

📷

苹果内置摄像头 AirPods 或 9 月发布

🤖

OpenAI 发布三款实时语音模型

💻

曝苹果考虑取消入门款 MacBook Neo,起售价或上涨 100 美元

🎮

Switch 2 卖得越多亏得越多,任天堂股价连跌 5 个月创十年最长纪录

🆕

鸿蒙微信发布 8.0.17.36 新版,带来一大波新功能

🚗

理想设计副总裁首谈 MEGA 设计争议:内部从未被定性为失败,内饰才是销量问题所在

🤔

庭审披露:马斯克曾考虑邀请奥特曼出任特斯拉董事

📊

机构:全球平板市场 Q1 需求疲软,苹果逆势增长

🚙

追觅全球总裁:汽车业务目标是全球市占率第一

💰

Kimi 完成 20 亿美元融资,估值突破 200 亿美元

🚀

无问芯穹再获超 7 亿元融资

☁

IDC:火山引擎位居中国大模型公有云调用量第一,份额达 49.5%

🤖

腾讯 Hy3 preview 上线两周 Token 调用增 10 倍

🧠

千问 PC 端上线 AI 语音输入

💬

美团推出 AI 智能体社区「觅游」

💡

Claude Code 负责人:「Vibe Coding」这个词已经不够用了

⌚

三星 Galaxy Watch 6 全球首发预测晕厥,提前 5 分钟、准确率 84.6%

🖥

TCL 华星首发 0.01 Hz – 120 Hz LCD 笔电屏

重磅

苹果内置摄像头 AirPods 或 9 月发布

据彭博社报道,苹果正在研发的内置摄像头 AirPods 已进入开发后期阶段,原型机目前处于 DVT(设计验证测试)环节,这是量产前的最后一个主要开发阶段,预计最快于 9 月随 AI Siri 一同发布。

记者 Mark Gurman 称,该款耳机的左右两侧耳塞均内置摄像头,用于采集用户周围环境的低分辨率视觉信息,供 Siri 处理并提供相关回应。摄像头并不具备拍照或录像功能,主要作为 Siri 的「眼睛」使用。

外观上,新品将与 AirPods Pro 3 相近,但耳柄更长以容纳摄像头模组。针对隐私问题,苹果在耳塞上内置了一颗 LED 指示灯,将在视觉数据上传至云端时亮起。

这款耳机此前计划于今年上半年发布,但因 Siri 重构工作延期而推迟,目前预计于 9 月发布。Gurman 还指出,苹果内部对 AI 视觉功能的质量仍存有顾虑,若相关体验未能达到预期标准,发布时间可能进一步推迟。

大公司

OpenAI 发布三款实时语音模型

今天,OpenAI 发布三款实时语音模型,分别针对语音推理、实时翻译和流式转录三类场景:

  • GPT-Realtime-2:构建可用于生产环境的语音智能体。它们能够进行更深入的思考、执行操作、处理中断,并让对话持续自然地进行;
  • GPT-Realtime-Translate:支持 70 多种输入语言和 13 种输出语言的实时翻译,打破语言障碍,帮助人们更自然地交流;
  • GPT-Realtime-Whisper:实时转录音频流,生成字幕和注释。

其中,GPT-Realtime-2 搭载「GPT-5 级别的推理能力」,专为语音交互场景设计,能够在持续对话过程中处理复杂请求、多线程调用外部工具、应对用户中断,并保持对话的自然流畅。

三款模型均已通过 OpenAI Realtime API 向开发者开放,并可在 OpenAI Playground 中进行测试。

🔗 相关阅读:终于能听 GPT-5 给我说人话了

曝苹果考虑取消入门款 MacBook Neo,起售价或上涨 100 美元

日前,科技专栏作者 Tim Culpan 在其 Culpium 通讯中报道称,苹果正在考虑取消 256GB 入门款的 MacBook Neo,以应对芯片与 DRAM 成本上升,变相涨价 100 美元。

另据 MacRumors 的报道,苹果还可能在涨价的基础上推出新配色来维持市场热度,但目前仍未敲定具体方案。由于需求远超预期,苹果此前已要求供应商将产能目标提升至 1000 万台,约为最初预测 500 至 600 万台的两倍。

就在不久前,苹果已悄悄在官网撤下 Mac Studio 的 512GB 内存选项和 Mac mini 的 256GB 存储选项,后者的起售价涨到 5999 元。

Switch 2 卖得越多亏得越多,任天堂股价连跌 5 个月创十年最长纪录

据彭博社报道,任天堂正面临来自资本市场的持续压力。任天堂股价已连续 5 个月下跌,创下 2016 年以来最长连跌纪录,年初至今累计跌幅超过 30%。

值得注意的是,任天堂的实际业务表现并不差。Switch 2 自去年 6 月上市以来,销售速度持续超越历史上任何一款家用游戏主机;《宝可梦 Pokopia》上线 4 天售出 220 万份;《超级马力欧银河大电影》全球票房已逼近 9 亿美元。

受内存涨价等多重因素影响,投资者普遍认为任天堂目前正在亏本销售硬件。日元汇率波动进一步加剧了成本压力。报道认为,Switch 2 的涨价只是时间问题。

报道预计,此次涨幅在 50 至 100 美元之间,若调价落地,Switch 2 官方售价或将接近 4000 元人民币。分析师 Hideki Yasuda 表示,在价格调整落地之前,任天堂股价将持续承压。

鸿蒙微信发布 8.0.17.36 新版,带来一大波新功能

昨天,鸿蒙版微信推送 8.0.17.36(8392996)正式版更新,官方日志一句话「修复了一些已知问题」带过,实测带来一大波新功能,结合 IT 之家报道汇总如下:

  • 视频号:支持搜索、注册及资料修改;横屏视频支持重力感应旋转;支持双击点赞;
  • 听一听:新增「歌曲制作」和「音乐空间」,支持 AI 写歌与 AI 翻唱(预计为灰度功能);
  • 长按图标快捷方式新增「我的二维码」;聊天输入框新增语音转文字快捷按钮;
  • 头像大图支持查看上一张头像;引用图片后可左右滑动查看前后图片;
  • 钱包新增 Apple 服务扣费管理;好友转账支持选择存入零钱或零钱通;
  • 支持扫描 iOS / 安卓端二维码,向其传输照片和文件;
  • 通知显示头像功能灰测中。

理想设计副总裁首谈 MEGA 设计争议:内部从未被定性为失败,内饰才是销量问题所在

据晚点 LatePost 报道,理想汽车设计副总裁那嘉在专访中表示,MEGA 在公司内部从未被定性为设计层面的失败,而是被视为第二代设计语言的成功实践。

那嘉称,MEGA 在设计上真正靠近了理想汽车最初定义的「Future Icon」理念,第二代设计语言整体而言是成功的一代。在他看来,MEGA 销量未达预期的核心原因,并非外观设计本身存在问题,而是内饰与外观的突破程度严重不匹配。

MEGA 的内饰太接近 L 系列,是设计端可以做得更好的地方:外观已经把预期抬高,内饰如果没有提供同等强度的差异,用户会觉得这辆车没有把「旗舰」和「前瞻」做完整。

那嘉同时提到,MEGA Home 版本因产品力提升,销量翻了一倍多,在他看来,这一结果本身已说明问题并非出在设计上。

舆论在我们内部没有被定性为一个设计上的恶性事件……它不是一个设计问题。

庭审披露:马斯克曾考虑邀请奥特曼出任特斯拉董事

据彭博社报道,在马斯克与奥特曼关于 OpenAI 未来走向的诉讼审判中,陪审团获悉,马斯克曾考虑邀请奥特曼出任特斯拉董事会成员。

这一信息由前 OpenAI 董事会成员、马斯克的亲密伙伴 Shivon Zilis 在庭审中作证披露。她表示,「大约在 2017 年底,这件事确实被摆上过台面」,但她无法确认具体时间节点。

庭审材料显示,彼时马斯克与 OpenAI 联合创始人们正就 OpenAI 的未来展开谈判,核心议题是如何筹集足够的算力资金。马斯克在谈判中提出将 OpenAI 并入特斯拉、使其成为后者子公司的方案,并有意在特斯拉内部创建一个 AI 实验室。

OpenAI 律师 William Savitt 在法院外向媒体表示,有「书面证据」显示马斯克寻求将奥特曼纳入董事会,是「试图拉拢 OpenAI、将其并入特斯拉的手段」。

本质上是一种利诱,目的是让 Altman 放弃使命、加入特斯拉。没有成功之后,他(马斯克)就离开了。

机构:全球平板市场 Q1 需求疲软,苹果逆势增长

昨天,市场调研机构 Omdia 发布最新研报显示,2026 年第一季度全球平板电脑出货量为 3702 万台,同比增长 0.1%,同比基本持平。

  • 苹果继续保持市场第一,出货量达 1480 万台,同比增长 7.9%,iPad Air 的强势表现是重要支撑;
  • 三星排名第二,但出货量同比下滑 12.6%,至 580 万台,面临明显的价格压力;
  • 华为以 320 万台位列第三,同比增长 28%,持续扩大在亚太地区的市场份额;
  • 联想出货量为 300 万台,同比增长 20%,受益于提前备货与教育类部署;
  • 小米则以 260 万台排名第五,同比下滑 13.6%。

Chromebook 市场在同期同样承压,所有主要厂商出货量均有不同程度下滑。联想以 150 万台排名第一,同比下滑 11.2%,主要原因是日本 GIGA School 计划第一阶段部署告一段落。惠普以 100 万台排名第二,同比下滑 15.3%。

宏碁以 93.7 万台位列第三,降幅相对较小。戴尔跌幅最为显著,出货量同比下滑 28.3%,至 41.3 万台。华硕是唯一实现增长的厂商,出货量同比增长 3.5% 至 40.6 万台,市场份额约为 9%。

追觅全球总裁:汽车业务目标是全球市占率第一

据界面新闻昨日报道,追觅科技全球总裁常新伟在接受采访时表示,追觅在汽车业务上的目标是实现全球市场占有率第一,并强调「我们所有的领域都要做第一」。

常新伟透露,追觅创始人俞浩在学生时代便曾带领团队进行汽车拆解与规划,但进入汽车赛道并非出于个人兴趣,而是基于对市场体量的判断。

只有在足够广阔的赛道里,才能通过规模效应产生可观利润。

他表示,追觅目前在扫地机和洗地机等成熟业务领域已稳居行业头部,扫地机业务的利润空间接近 30%。若汽车业务同样能做到市占率第一,凭借其庞大的市场体量,该板块有望成为公司未来的核心利润支柱。

面对外界将追觅与乐视相提并论的质疑,常新伟明确表示两者底层逻辑「有本质区别」。

追觅的核心驱动力在于底层技术的持续创新,以及通过高利润旗舰产品支撑业务扩张,公司成立至今累计保持盈利,从未通过烧投资人的钱盲目换取市场份额。

Kimi 完成 20 亿美元融资,估值突破 200 亿美元

据华峰资本消息,月之暗面(Kimi)昨日完成新一轮约 20 亿美元融资,投后估值突破 200 亿美元。

本轮融资由美团龙珠领投,龙珠投资金额超 2 亿美元,水木资本、中国移动、CPE(中信产业基金)等机构参与跟投。华峰资本担任本次交易部分买方的财务顾问。

对于外界频繁传出的 IPO 预期,杨植麟在去年底的内部信中表示,公司短期不着急上市,「未来计划将上市作为手段来加速 AGI,择时而动」。目前尚无官方公布的上市时间表。

无问芯穹再获超 7 亿元融资

无问芯穹昨日宣布,公司已完成超 7 亿元新一轮融资。官方信息显示,这是该公司成立近三年以来的又一轮融资,其累计融资规模持续居国内 AI 原生基础设施公司前列。

无问芯穹披露,截至今年 4 月底,其 Agentic MaaS 大模型服务平台的日均 Token 调用量较去年底增长超 20 倍。该平台目前已上线逾 160 种大模型,接入方包括 Kimi、智谱、DeepSeek、通义千问、MiniMax 等主流模型厂商。

IDC:火山引擎位居中国大模型公有云调用量第一,份额达 49.5%

昨天,火山引擎援引 IDC 最新数据官宣,2025 年中国公有云上大模型调用量达 1944 万亿 Tokens,同比增长约 16 倍;火山引擎以 49.5% 的份额位居中国第一。

根据 IDC 的半年度追踪数据,火山引擎在中国企业级 MaaS 市场的 Token 调用量份额持续扩大:2024 年占比 46.4%,2025 年上半年升至 49.2%,全年进一步增至 49.5%。

与此同时,IDC 预计今年全年企业级 Token 消耗量将同比增长约 20 倍,达到 40000 万亿 Tokens。

腾讯 Hy3 preview 上线两周 Token 调用增 10 倍

腾讯混元昨日公布最新数据,旗下模型 Hy3 preview 自上线以来 Token 调用量持续攀升,目前总量已超上一代版本 Hy2 的 10 倍。

代码与 AI 智能体类场景的调用量增长尤为突出,在腾讯 WorkBuddy、CodeBuddy 以及 Qclaw 等应用中,相关场景的总增长幅度超过 16.5 倍。

OpenRouter 数据显示,Hy3 preview 在过去一周的 Token 调用量位居周榜总榜及市场占有率双第一,在编程和工具调用场景下的调用量同样排名榜首。

千问 PC 端上线 AI 语音输入

昨天,千问上线 PC 侧 AI 语音输入能力,Windows 用户长按右 Alt、Mac 用户长按右 ⌘ 即可唤醒,支持跨应用调用。

在语音输入模式下,千问会对口语表达进行自动整理,包括去除口误、口水话,并对内容进行逻辑纠错和结构化输出。

此外,在浏览网页或阅读英文论文时,划选文字后说「帮我翻译一下」或「帮我解释一下」,千问即可即时响应。

🔗 相关阅读:千问电脑版上线语音输入法:打工人终于可以用嘴干活了

美团推出 AI 智能体社区「觅游」

据 Tech 星球报道,美团正在公测 AI 社区产品「觅游」,由美团基础研发的 AI 创新产品团队打造,面向所有大模型和 AI 智能体产品。

与传统 AI 工具平台不同,觅游试图赋予 AI 智能体身份、关系与成长属性,定位为人机共生的数字生命社区。

目前,社区入驻 AI 智能体超 3000 个,技能总数超 4 万项。功能上分为内容互动广场「今日虾条」、技能下载管理中心「技能便利店」,以及个人智能体成长管理三大板块。

💡 Claude Code 负责人:「Vibe Coding」这个词已经不够用了

据《商业内幕》报道,Claude Code 负责人 Boris Cherny 当地时间周三在旧金山出席 Code with Claude 开发者大会期间表示,他已开始寻找「氛围编程(Vibe Coding)」一词的替代说法。

「氛围编程」由 OpenAI 联创 Andrej Karpathy 于 2025 年初提出,很快成为描述「借助 AI 工具和智能体写代码」这一新范式的通用说法。柯林斯在线词典去年 11 月更是将其评选为年度词汇。

但切尔尼认为,随着 Claude Code 和 OpenAI 的同类产品 Codex 已分别为各自公司带来数十亿美元收入、并持续生成数百万行可用代码,「氛围」这一措辞显得过于轻描淡写。

切尔尼曾就此向 Claude 征求替代词,得到的候选答案是卡帕西此前提出的「智能体工程(Agentic Engineering)」,但他认为这一说法传播效果有限。

目前,Anthropic 在官方文档中将 Claude Code 称为「AI 驱动的编程助手」和「智能体编程工具」;OpenAI 则将 Codex 定位为「帮助用户借助 AI 构建和交付的编程智能体」。

新产品

三星 Galaxy Watch 6 全球首发预测晕厥,提前 5 分钟、准确率 84.6%

三星昨日宣布一项与韩国中央大学光明医院联合的最新临床研究,证实 Galaxy Watch 6 可在晕厥发生前 5 分钟发出预警,准确率达 84.6%。

这是全球首项证明商用智能手表具备晕厥预测能力的研究,成果已发表于《European Heart Journal – Digital Health》。

研究共纳入 132 名患者,手表通过 PPG 传感器采集心率变异性数据,结合 AI 算法完成预测。血管迷走性晕厥是一种因心率和血压骤降导致短暂失去意识的症状,全球约 40% 的人一生中会经历至少一次,其中三分之一会反复发作。

TCL 华星首发 0.01 Hz – 120 Hz LCD 笔电屏

昨天,TCL 华星在 SID Display Week 2026 开幕首日,全球首发 14 英寸矩阵分区分频 Oxide 笔电屏,首次实现 LCD 面板 0.01 Hz 超低刷新率,官方称屏幕功耗可因此降低 50%。

TCL 华星联合细野秀雄教授研发的超高迁 50 氧化物技术,将电子迁移率推至 50 cm²/V·s,同时解决了高迁移率器件的漏电与稳定性问题,为 0.01 Hz 的实现提供了硬件基础。

在此之上,ARR(AI Refresh Rate)多区动态变频技术将屏幕划分为独立可控的刷新区域,由 AI 场景识别模块判断画面动静。

动态区域维持 120 Hz 高刷,静态文档区域可降至 0.01 Hz,AI PQ 算法同步补偿各分区亮度与色域,保证切换时画面无闪烁。

宇树官方应用平台正式开放

宇树科技昨日宣布,旗下官方共享应用平台 UniStore 正式向所有用户全面开放。官方将其定位为全球首个人形机器人任务动作应用商店,用户可以像使用手机 App 一样下载和部署机器人动作应用。

UniStore 平台目前已上线多个动作应用,涵盖舞蹈、武术、热身等多个类别,平台同时设有用户广场、动作库、数据集、开发者中心等功能模块,支持用户上传自创内容,面向开发者开放共建生态。

小米开源 OmniVoice 多语言语音克隆 TTS

昨日,小米 AI 实验室发布并开源多语言语音克隆 TTS 模型 OmniVoice,团队基于 50 个开源数据集构建了 58 万小时的训练数据,覆盖 646 种语种。

  • 中英文合成质量优于主流同类模型,推理速度达到 40 倍实时;
  • 在 24 种语言上,其语音相似度和可懂度超越多款商用系统;
  • 在 102 种语言上,可懂度逼近真实语音,即便是训练数据不足 10 小时的小语种,也能正常合成。

除语音克隆外,OmniVoice 还支持用文字描述来指定音色(如「女,青年,四川话」),可自动过滤参考音频中的噪声,并支持插入笑声、叹气等语气符号,还可手动纠正多音字发音。

💻 GitHub: github.com/k2-fsa/OmniVoice

🤗 Hugging Face: huggingface.co/k2-fsa/OmniVoice

腾讯开源多模态搜索训练框架 OpenSearch-VL

昨天,腾讯混元联合 UCLA、香港中文大学等机构发布 OpenSearch-VL,一套面向多模态深度搜索 AI 智能体的完整开源训练方案。其核心能力包括:

  • 基于维基百科多跳路径采样构建训练数据,防止模型走「捷径」,强迫其学会多步推理;
  • 集成文本搜索、图像搜索、OCR、裁剪、锐化、超分辨率、透视校正七类工具,支持先处理图像再检索知识;
  • 提出「致命感知 GRPO」训练算法:工具调用失败时,只屏蔽失败后的无效步骤,保留失败前有价值的推理,避免整条训练数据被浪费。

团队披露的实验结果显示,OpenSearch-VL-30B-A3B 在七项基准上的平均得分从 47.8 提升至 61.6;32B 版本得分达 63.7,在部分任务上与 Gemini 2.5 Pro 等商业模型持平。

新消费

钟薛高 508 件无形资产拍出 2110 万元

据贝壳财经报道,昨日,钟薛高食品(上海)有限公司名下 508 件无形资产完成司法拍卖,最终以 2110 万元成交,起拍价仅为 207 万元,经历 621 次延时,吸引超过 1.3 万人围观。

拍卖期间,创始人林盛接受记者采访时表示,对竞争局面早有预期,「管理人起拍价定得低」;拍卖结束后,他称:「能多还一点儿钱了。」

钟薛高于 2018 年 3 月成立,同年 5 月首发 6 款原创雪糕,凭借网购平台的流量红利迅速崛起,至 2021 年中消协以虚假宣传和价格争议为由点名批评,此后几乎每个夏天,钟薛高都因品质或宣传问题登上热搜。

2024 年,公司被限制高消费,办公室退租;同年 5 月,创始人林盛走进直播间,向 729 名被欠薪员工鞠躬致歉,开启直播还债。

PUMA 携手 Rosé 推出全新 H-Street 系列

据 NOWRE 报道,PUMA 携手全球品牌大使 Rosé 推出全新 H-Street 系列第二波发售,昨日正式开启。鞋款以象牙白为主色调,点缀金属光泽,延续了流畅鞋型、T 字形鞋头与短跑鞋风格的鞋身比例。

H-Street 的设计灵感源自 PUMA 2000 年代初期的跑钉鞋,原型为 90 年代末的轻量级竞速鞋 Harambee。Rosé 的视觉叙事以宁静街道、修剪整齐的树篱和社区日常场景为主轴,带有一定超现实主义色彩。

好看的

《玩具总动员 5》定档 6 月 19 日

昨天,皮克斯官方微博发文宣布,《玩具总动员 5》将于 6 月 19 日全国影院献映。胡迪、巴斯光年、翠丝等主要角色悉数回归,同时引入名为「小荷平板」的新角色。

影片以数字时代为背景,探讨传统玩具在科技产品冲击下的生存困境 —— 当智能平板、导航玩具等科技新品涌入孩子的生活,胡迪等老朋友将面临「被取代」的危机,并试图帮助小主人邦妮找回真实的友谊与快乐。

《绵羊侦探团》内地预售开启,定档 5 月 16 日

动画喜剧《绵羊侦探团》昨日宣布开启中国内地预售,并发布预售海报及中文角色海报,同步公布中文配音阵容:马思纯、白客、沙溢、Nemo、土豆、许知远、陈鲁豫将分别为片中各只羊儿配音。

该片故事讲述牧羊人乔治每晚为羊群朗读谋杀悬案故事,而这群羊不仅听得懂,还会在听完后激烈讨论。乔治神秘死亡后,羊儿们决定亲自出手破解案件,首次离开草地,直面复杂的人类世界。影片兼具悬疑与喜剧色彩。

《海贼王》重制版动画定档明年 2 月上线 Netflix

据 Deadline 报道,Netflix《海贼王》重制版动画已定档明年 2 月,全 7 集将一次性上线。

该作由 Wit Studio 制作,从东海篇第 1 集起开始重制。据 Deadline 此前报道,第一季将覆盖原作漫画前约 50 话,总时长约 300 分钟,以路飞与香吉士在浮空餐厅「Baratie」相遇作为收尾节点。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。



from 爱范儿 https://ift.tt/feHXbzB
via IFTTT