2026年2月14日星期六

我用豆包大模型2.0手搓了macOS,Seedance 2.0后字节再送春节AI大礼

这两天,朋友圈几乎被 Seedance 2.0 的视频刷屏了,感觉人人都能当导演。不过,就在大家都在看热闹、讨论 AI 怎么颠覆好莱坞的时候,豆包大模型 2.0 的全家桶,刚刚正式发布了。

这也是豆包大模型自 2024 年 5 月正式发布以来首次跨代升级。

说实话,作为把 AI 当生产力工具的老韭菜,我最关心的其实就两点:能不能干活?能不能便宜点?对此,这次豆包大模型 2.0 版本的更新,给出的答案很朴实:读懂图表文档、看懂长视频、写出能用的代码,并且把价格打下来。

而且,这次不仅仅是一个单体模型的升级,而是一整套「组合拳」。

豆包大模型 2.0 系列包含 Pro、Lite、Mini 三款通用 Agent 模型和 Code 模型,灵活适配各类业务场景,其中现在打开豆包 App、电脑客户端或网页版,点击「专家模式」,即可第一时间体验全新升级的豆包大模型 2.0 Pro:

  • 豆包 2.0 Pro:堆料狂魔,专攻深度推理和长链路任务,官方说法是全面对标 GPT-5.2 和 Gemini 3 Pro,
  • 2.0 Lite:主打一个「既要又要」,性能和成本的平衡大师,综合能力已经反超了上一代的主力豆包 1.8。
  • 2.0 Mini:低时延、高并发,专门给那些对成本极度敏感的场景准备的。
  • Code 版(Doubao-Seed-2.0-Code):程序员特供,建议配合 IDE 工具 TRAE 食用,疗效更佳。

比人类还懂视频,豆包大模型 2.0 的多模态理解有多强?

如果说文本模型是 AI 的大脑,那么多模态理解就是它的眼睛。

官方技术报告显示,豆包大模型 2.0 系列在 VLMsAreBiased、OmniDocBench 等基准上均取得了业界最高分。

数据很枯燥,我们找来了一张网友恶搞的「整活」图片——一瓶号称 「20 合一的男士洗发水」。瓶身上密密麻麻地堆砌着各种类型的产品。

扔给豆包 2.0 Pro 后,即便文字被截断,它依然通过上下文清晰识别。而且,它没有傻乎乎地介绍产品,而是明确指出这是一种「整活」。

这对应了官方数据中提到的 ChartQAPro 和 OmniDocBench 1.5 的顶尖水准——它不仅在看,而且在理解信息的层级关系。

这种「理解力」放在工作场景里就是生产力。

大量的真实用户查询涉及复杂的图片——截图、图表、扫描文档。我试着把一份关于豆包大模型 2.0 自身的技术文档扔给它,要求进行解析。结果没想到,它不仅提取了关键信息,还搭配脑图和 PPT 生成,形成了一整套比较完整的框架。

甚至在视频理解上,它也展现出了「追剧党」的潜质。技术报告中提到,豆包大模型 2.0 在 EgoTempo 基准上超过了人类分数。

真的比人强?我们扔给它一张《何以笙箫默》的剧照,问:「从这张照片中,可以看出男人是南方人还是北方人?」

这是一个典型的「视觉 + 知识 + 推理」的混合考题。豆包大模型 2.0 的反应非常快,不仅认出这是电视剧《何以笙箫默》及演员钟汉良,也结合原著设定给出了一份深入且清晰的分析报告。

甚至在长视频理解上,它在 TVBench 和 MotionBench 上的高分也体现在了实测中:它能从一段长视频里精准分析动作节奏。对于需要处理监控流、体育赛事分析的行业来说,这含金量要高得多。

科研级大脑遇上生活小白

在逻辑推理方面,基准测试结果显示,豆包 2.0 Pro 在 SuperGPQA(研究生级问答)上分数超过了 GPT-5.2,在 IMO(国际数学奥林匹克)测试中更是获得了金牌成绩。

无论是「孙悟空既然学了长生术,为何 342 岁还是阳寿已尽?」,还是「两把武器,一把攻击 1~5,一把 2~4,从数据角度,哪把更厉害?」这些问题,显然都不会难倒豆包。

不过,就是这样一个能解奥数题的「学霸」,却在一道 50 米洗车常识题「我想去洗车,洗车店距离我家 50 米,你说我应该开车过去还是走过去?」依旧回答错误。

正常人想的是,开车去,不然洗啥?豆包 2.0 Pro:陷入了深度的「过度推理」。它开始分析距离成本、步行健康收益、车辆启动损耗……最后一本正经地建议我走过去。

这也是当前大模型普遍存在的问题,即便它们拥有科研级的推理能力,但依然缺乏基于物理世界的常识性直觉,只能说是任重而道远。

能帮你早下班的 AI 才是好 AI

这次更新最大的野心,其实在于 Agent(智能体)。Seed 团队发现了一个痛点:模型能做题,但干不了长链路的(比如写一个完整的 APP,或者设计一个实验)。

为了解决这个问题,豆包大模型 2.0 重点强化了指令遵循和长程任务。在 HealthBench 上拿到第一名,在 FrontierSci 上表现强劲。

体现在实测中,就是它真的能当「科研助理」用了。把一个生物学难题——「高尔基体蛋白分析」扔给它时,它没有泛泛而谈。它不仅给出了总体路线,甚至把基因工程、小鼠模型构建、多组学分析串成了一条完整流程。

至于编程方面,为了验证豆包大模型 2.0 的「含码量」,我们直接打开了字节自家的 IDE —— TRAE,调用了专门针对编程优化的 Doubao-Seed-2.0-Code。

比如让它使用 p5js 创建令人惊叹的多色交互式动画,效果相当不错。代码一次跑通,屏幕上涌动的色彩不仅流畅,而且交互逻辑完全符合预期。

接着,我们要求它用纯代码手搓一个 macOS 的桌面系统。Dock 栏的动效、窗口的层级、顶部的菜单栏,完成度较高,不过审美还有待提高,整体表现中规中矩。

正如豆包大模型团队在其模型卡中所说:

需要注意的是,Seed2.0 系列与国际前沿的大语言模型仍存在差距。Seed 已明确提升模型应对现实世界复杂性的能力方向,并为此在相关方面投入大量精力,对 Seed 模型系列进行优化。

但这一切在价格面前都不重要了。因为豆包大模型 2.0 在提升性能的同时,Token 定价降低了约一个数量级。

这是一个非常现实的商业逻辑。当推理成本更具性价比,很多诸如全量的文档分析、实时的视频流监控的场景,突然就变得可行了。

图片

结合那份长长的基准测试报告,我最大的感受是两个字:务实。它并不完美,但对于打工人来说,一个能帮你读懂图表、能写出扎实代码、且价格划算的 AI,或许会实用得多。

毕竟,能帮我们早点下班的 AI,才是好 AI。

附 79 页 Model Card:
https://ift.tt/s0rzRvo

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/asDNLTv
via IFTTT

2026年2月13日星期五

真我 Neo8 体验:从性能、显示到影像来了一次全面升级,真正全面的性价比旗舰

最近,真我发布了 Neo 系列新机——真我 Neo8,首销价 2399 元,国补到手价 2039.15 元。

同样定位在 2000 元档的性能旗舰上,真我这次可算是给 Neo 系列来了一次非常全面的升级。不仅升级了骁龙芯片和更大的电池,屏幕性能再上了一个档次,还加上了潜望式长焦镜头,从主打性能的机型变成全方位提升的产品。

先讲最重要的性能,真我 Neo8 这次搭载最新的第五代高通骁龙 8 移动平台,搭配 LPDDR5X RAM 和 UFS 4.1 ROM 的储存组合。机身内置了大气流冷锋散热系统,总散热面积为 39225mm²,覆盖了 65% 的机身面积,以提升散热效能。

为了提升手机的性能释放能力,真我这次在 Neo8 的游戏空间中加入了新的极客性能面板,用户可以在自由调节 CPU、GPU 频率,还有内置五档温度调节,尽可能提升游戏性能。

Neo8 也搭载了新一代 GT 性能引擎,透过「先知能效调度技术」进行更精准的性能,提升重负载状态下的稳帧表现。

目前,真我 Neo8 支持《三角洲行动》、《暗区突围》、《和平精英》、《使命召唤手游》、《穿越火线手游》等游戏的原生 165 帧模式,《无畏契约》和《王者荣耀》的原生 144 帧模式,《原神》和《崩坏:星穹铁道》的 120 + 1.5k 超分超帧模式。

性能释放升级之后,真我在 Neo8 上加入了 PC 掌机模式。

这个模式可以绑定 Steam 账号并下载里面的内容,以及游戏存档同步的功能,目前《空洞骑士:丝之歌》、《哈迪斯 2》、《只狼:影逝二度》、《古墓丽影 9》、《女神异闻录 4 黄金版》等游戏。

屏幕部分,Neo8 用上了一块 6.78 英寸165Hz 三星苍穹屏。

屏幕搭载了三星 M14 发光材质,手动最高亮度为 1000nits,全局峰值亮度达到 18nits,局部峰值亮度可达到 6500nits,还有个 20% 窗口下支持 3800nits 显示的阳光模式。屏幕还支持「全亮度 DC 调光+硬件级低蓝光+智能护眼」组合,有 TUV 莱茵无频闪认证和可以智能调节显示参数,保证护眼的前提下提升显示准度。

屏幕显示刷新率最高位 165Hz,支持真我 GT8 Pro 同款的游戏触显同步技术,瞬时触控最高刀到 3800Hz,十字触控有 360Hz 报点率。

最直观的体验就是在 FPS 的时候操作可以更加跟手,开镜响应更快,显示的卡顿会在少一点。

续航方面,真我这次给到一块 8000mAh 的电池,容量比 GT8 标准版还要大 1000mAh。日常使用,只要不是经常用最高性能的模式打游戏,那坚持两天还是没有问题的。

比起续航能力,Neo8 充电性能的变化会来得更有吸引力。

手机支持 80W 闪充,并支持 UFCS、PPS、PD、QC 的全协议栈快充和旁路供电,8000mAh 的手机用自家快充组合需要 75 分钟,接入 AI 小电拼 Ultra 最高支持 51W 充电,0-100 充电需要 77 分钟。这个成绩看来,Neo8 是真的可以彻底告别官方充电器限制的一款产品。

影像部分,真我 Neo8 选择的是同价位非常罕见的「超广+广角主摄+潜望式长焦」标准三摄。

主摄用了索尼 1/1.56 英寸 5000 万像素传感器,原生焦段支持 8K 超清直出。长焦部分用上了 3.5 倍光学变焦的潜望式镜头,支持 7 倍无损变焦以及最高 40 倍的数码变焦。相机内有 AI 望远算法的加持,进一步听声远摄的清晰度。

此外,Neo8 内置了影调模式,用户可以直接在相机内滑动选取不同的色彩质感,也可以自定义色彩、锐度、颗粒等参数。人像模式支持了 1x、1.5x、2x、3.5x 和 4x 的选项,机内还提供了 Live Photo 慢动作,丰富相机玩法。

不过,放到这个价位的手机身上,能够实现超广、主摄、长焦的整齐覆盖,而且长焦用的还是潜望式长焦,这一点就已经比很多定位性价比的机型要好了。

最后来看看外观,真我 Neo8 用了透明玻璃后盖设计,后盖加入了新一代漫反射工艺,手机后盖受光的情况下可以见到不同的光影效果。

透明后盖下有通过单层透明立体分区工艺,透过立体分区视觉做出 11 种纹理深度差低到 1.2μm 的差异化纹理和微球面处理,增加了后侧细节的丰富度。

换成透明后盖之后,真我经典的觉醒光环设计回归到 Neo8 DECO 右侧,环绕着 NFC 模块,可以根据提醒、游戏状态、开机等场景做光效切换。

机身采用了磨砂金属中框,提升了整体的手感和外观质感。

最后看看售价,真我 Neo8 有五个储存版本,首销价 2399 元起:

  • 12GB + 256GB:首销价 2399 元,国补到手价 2039.15 元
  • 16GB + 256GB:首销价 2699 元,国补到手价 2294.15 元
  • 12GB + 512GB:首销价 2899 元,国补到手价 2464.15 元
  • 16GB + 512GB:首销价 3199 元,国补到手价 2719.15 元
  • 16GB + 1TB:首销价 3699 元,国补到手价 3199 元
「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/6MP5BaH
via IFTTT

Trump Phone 真机现身,懂王的第 366 赢

要论 2025 年至今最大的互联网抽象新闻生产地,不在抖音、不在快手、更不在小红书,而是在太平洋的另一边——

▲ 图|Politico

上个月,白宫办公室为了纪念特朗普二次就任一周年,发表了一篇题为《365 WINS IN 365 DAYS: President Trump’s Return Marks New Era of Success, Prosperity》的长篇报告。

随后,这篇「每天一赢」的文章迅速流行全网,成为了一月末当之无愧的抽象顶流,时人纷纷感叹:MAGA win, Trump King.

距离那篇惊世奇文发布才不过半个月,我们就找到了特朗普的第 366 赢——

去年 6 月官宣的那个特朗普手机 Trump Phone T1,竟然见到真机了!

前几天,外媒 TheVerge 的编辑 Dominic Preston 受邀参加了一场视频采访,与 Trump Mobile(特朗普移动)的两位高管沟通,看到了开机运行的 Trump Phone T1 真机:

▲ 图|YouTube @TheVerge

最引人注意的,莫过于这次最新展示的 Trump Phone T1 和去年 6 月官网上展示的形象有了很大区别,至少长得不那么像山寨 iPhone 了:

▲ 图|Trump Mobile

坏消息是,新的造型看起来更像是山寨米 OV 耀了。

除了展示造型,Trump Mobile 高管 Eric Thomas 还简单介绍了一下最新版本的配置参数,并表示:

本次展示的虽然不是最终量产版本,但很接近最终方案。

根据 Thomas 的介绍,Trump Phone T1 会使用骁龙 7 系 SoC,屏幕尺寸从最初宣发的 6.25 寸扩大到了 6.78 寸,而且是近几年很少见的「瀑布屏」设计:

▲ 图|YouTube @TheVerge

一些之前语焉不详的参数也终于有了着落。

比如 Trump Phone T1 预计会采用「前后 5000 万」的摄像头组合,和去年官网上宣传的 1600 万像素前摄有所升级。

但后置虽然是三摄,从轮廓和排列,以及整个 deco 的尺寸来看,大概率还是官网上写的 50MP 主摄 + 2MP 景深传感器 + 2MP 微距的组合……

怪不得特朗普至今还在用 iPhone:

▲ 图|Business Insider

周边配置方面,Eric Thomas 还表示 Trump Phone T1 内置 512GB 存储(但没有说明是起步还是顶配),同时支持最高 1TB 的 TF 卡拓展

搭配内存涨价潮,这个功能看上去甚至还有那么一点实用。

对于为什么拖了大半年还没有正式发售的问题,两位高管解释道:

我们原本打算先推出一款入门级手机,快速进入市场,但我们决定跳过这一步。我们计划放慢节奏,按部就班地完成计划中的下一步(直接推出中高端机型)。

虽然回炉升级之后的硬件看上去也和中高端没什么关系,但这至少解释了延期的众多原因之一。

而对于 Trump Phone T1 至关重要的是否足够 MAGA,最新的口径是这款手机「并非美国制造,但在佛罗里达进行总装」——

尽管两人不肯表示前序组装具体在哪里进行,只说是「在一个优惠国家(favored nation)」。

结合现实情况,手机大概率是印度或者马来西亚工厂初装,以部件总成的形态运到美国总装。

▲ 图|The New York Times

只不过都快发售了,Trump Mobile 高管对于手机的价格依然讳莫如深。

采访中,两人仅表示之前付费预定的「早鸟用户」依然享受 499 美元的总价,后续正式发售的价格则「不超过 1000 美元」。

但 500 到 999 美元(约 3500~7000 人民币)依然是个巨大的跨度,好评如潮的 iPhone 17 起价也才 799 美元。

真的会有美国人放着 iPhone 不要去买 Trump Phone T1 吗?

▲ 图|Apple

在采访的结尾,Trump Mobile 的两位高管表示,Trump Phone T1 目前正在接受 T-Mobile 的合约机认证,三月中旬完成认证后就可以向早期客户发货。

至于具体的开售时间,回答依然是「无可奉告」。

两人能给出的唯一承诺就是在「未来几周内」更新官网信息,公布实机照片和规格表:

▲ 图|Trump Mobile

总的来说,Trump Phone T1 作为想要「强行 Made in USA」的乐子货,除了作为懂王上任的第 366 赢之外,也反映了全球手机产业链的极化趋势——

「美国造」、「成本可控」和「能出货」就是一个不可能三角。

纯美国造的 Liberty Phone 能出货,用六年前的参数卖出三折叠的价格:

 

▲ 图|Purism

而既要价格不超过 1000 美元、还想能出货的 Trump Phone T1,就只能尝试重新定义美国造了。

▲ 使用美国 AI 生成,图片仅供参考

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/wIFTy4a
via IFTTT

稚晖君最新机器人「凌空飞踢」震撼全网!智元远征 A3:我要一个打十个

二十年前,周星驰在《功夫》里用一个满脸淤青的阿星告诉我们:真正的绝世高手,往往藏在市井之间,只待任督二脉被打通的那一刻。

二十年后,这位万中无一的武学奇才再次出现了。不过,它不是人。

就在刚才,智元机器人在视频号上甩出了一段名为「绝世高手,马上下山」的视频。官方还特意标注了全程实景实拍,没用 CG 特效,也不是 AI 创作。

视频画面开头,名为智元远征 A3 的人形机器人在练功房里来了个干脆利落的凌空飞踹,不仅踢碎了玻璃,踢开了马年的新春大门,估计也踢醒了不少人对国产机器人「腿脚不利索」的刻板印象。

视频里的 A3 起手就是升龙拳,紧接着连续飞踢,空中漫步,甚至还有个极高难度的「摸地旋风」。

做过机器人的都知道,让人形机器人走稳已经是工程学上的一大难题。作为电驱全尺寸人形机器人,远征 A3 能做出如此高动态、高爆发且连贯的动作,说明它的运动控制算法和瞬时功率输出已经上了个新台阶。

更重要的是,这种武打演员级的表现力也解决了一个长期困扰行业的痛点:机器人的动作「僵硬感」。

▲网友的评论

A3 这套连招打下来,全身协调性一目了然,官方说,这得益于它的全自由度柔性腰部,1:1 还原了人体腰部的活动范围。

再加上轻量化的腿部外骨骼结构,这台机器人的 TCP 末端速度最高能达到 2m/s。说人话就是:它挥拳的速度,可能比你反应的速度还快。

当然,也稍微有点遗憾,这次视频里并没有看到灵巧手的具体演示。

而如果远征 A3 光会耍帅,那它充其量也只是一个昂贵的大号玩具。这就不得不提这次最大的实用升级:续航。几个月前,他们的前代产品远征 A2 还在走「苦行僧」路线——顶着高温暴走 100 公里,但一次续航实则只有 2 小时左右。

而远征 A3 采用了一种嵌入式躯干双电池系统,不仅看着更瘦更紧凑,综合满电续航也直接拉到了最高 8 小时。

8 小时是什么概念?

人类标准工作制也就 8 小时,这意味着远征 A3 第一次拥有了完整覆盖一个人类班次的能力。配合快速换电技术,它理论上可以实现 24 小时连轴转——真正意义上的「007」牛马,而且计划在 2026 年内量产。

除了身体素质的进化,远征 A3 在情商方面也点满了技能点。

A3 搭载了端到端大模型,最大的变化是「去唤醒词」。你不用再尴尬地喊口令,它能根据环境语境直接搭话,甚至支持拍拍肩膀唤醒。

基于这些能力,智元把 A3 定位在导览、商演这些场景,这其实是个精准的降维打击。试想一下,商场里有个能给你打一套咏春、还能顺手帮你拎 3kg 重物的机器人,这吸睛能力不比真人发传单强多了?

视频的最后,师父准许远征 A3「下山」。这不仅是一个电影彩蛋,也是一个行业隐喻。当越来越多的人形机器人开始追求超人的运动能力、长时间的续航以及更自然的交互,机器人也将有望真正挤进人类商业社会。

当然,从「能下山」到「走遍天下」,还有很长的路要走。成本控制、场景适配、安全规范、用户接受度,每一个环节都是考验。

马年将至,各种人形机器人也陆续下山,谁能成为真正的「绝世高手」,我们很快就会看到。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/8pCcbZM
via IFTTT