2025年2月28日星期五

早报|雷军发布会同款火出圈,多家售罄/中国空间站将迎来首位外籍航天员/《哪吒 2》超越蜘蛛侠,进入全球票房前 7

cover

🛰

中国空间站将迎来首位外籍航天员

🔥

雷军发布会同款皮衣销量火爆,多家售罄

💻

亚马逊推出新款量子计算芯片 Ocelot

🎧

机构:小米拿下 2024 年 TWS 耳机中国市场第一

🤖

字节旗下又一应用接入 DeepSeek

🏙

智界上海设立研发中心,距离华为上研所更进一步

❎

理想副总:L 系列和 MEGA 没有 2025 款

🎉

小米参编干衣机和洗干一体机国标

🏗

文心大模型 4.5 官宣 3 月中上线

💡

亚马逊 CEO:量子计算潜力很大,但还需时间发展

📄

DeepSeek 重磅文件系统宣布开源

📱

华为推出 Mate 70 Pro 优享版

😯

传音公布迷你三折叠

🥤

喜茶推出「潮汕特色」南姜甘草芭乐瓶

📈

《哪吒 2》进入全球票房前 7,超越蜘蛛侠

📰 周末也值得一看的新闻

中国空间站将迎来首位外籍航天员

2 月 28 日,中国载人航天工程办公室与巴基斯坦太空与高层大气研究委员会,在巴基斯坦首都伊斯兰堡正式签署《关于选拔、训练巴基斯坦航天员并参与中国空间站飞行任务的合作协议》,开启了中巴两国在载人航天领域深化合作的新篇章,迈出了中国选拔训练外籍航天员参与中国空间站飞行任务的第一步。

据悉,此次协议的签署,标志着中国政府将首次为外国选拔训练航天员,中国空间站将迎来首位外籍航天员造访。

按计划,中巴双方将利用一年左右的时间完成选拔工作,巴基斯坦航天员将在中国接受全方位的系统训练。根据中国空间站的飞行任务规划安排,将在未来几年内择机安排巴基斯坦航天员与中国航天员一道进入中国空间站执行短期飞行任务。

此次合作协议签订,为更多发展中国家参加国际载人航天合作提供了范例,有利于激励更多国家携手探索宇宙奥秘,共同在造福全人类的道路上书写新的篇章。

雷军发布会同款皮衣销量火爆,多家售罄

2 月 27 日,小米备受关注的「双 Ultra」发布会上,小米创办人、董事长兼 CEO 雷军身穿一款棕色皮衣,而该款皮衣在发布会后受到热议并迅速火出圈,不少网友开始在电商平台「求同款」。

据信息显示,在发布会直播结束后,不少拥有类似棕色皮衣的品牌都纷纷将产品标注为「雷军发布会同款」「雷总穿搭」等字样。据我们实际观察,某品牌售价 2500 元左右的「同款」皮衣,在其抖音直播间 / 商城售出超 400 件,现货均已售罄,预售期为 25 天;而其他品牌的「同款」皮衣也显示现货售罄,需要预售等待 20 天。

除本次「同款」皮衣的 IP 流量,雷军也曾在直播间提及自己穿「凡客诚品的 T 恤」,给沉寂多年的凡客诚品带来了不小的流量。此外,雷军穿着的安踏冲锋衣、Thom Wills 小白鞋等,也都曾被「雷军同款」作为产品的营销卖点。

此外,小米汽车昨日发文宣布,小米 SU7 Ultra 24 小时大定突破 15,000 台。

亚马逊推出新款量子计算芯片 Ocelot

近日,亚马逊网络服务公司(AWS)宣布推出一款新型量子计算芯片 Ocelot,可以将量子纠错成本降低 90%。

亚马逊方面表示,Ocelot 由加州理工学院 AWS 量子计算中心团队开发,采用了新的架构设计,内置纠错功能。值得关注的是,研究人员首次将「猫量子比特」技术和其他量子纠错组件结合到一块芯片上,在构建容错量子计算机方面取得突破。

对于「何时落地量子计算机,并投入实际应用」这一问题,AWS 量子硬件总监 Oskar Painter 表示,因为纠错所需的资源大幅减少,未来根据 Ocelot 架构构建的量子芯片的成本可能只有现有方案的五分之一,将最多提前五年制造出实用量子计算机。

目前,上述相关成果已刊登在《自然》杂志上。

机构:小米拿下 2024 年 TWS 耳机中国市场第一

昨日,机构 Canalys 公布了全球 2024 年全年真无线耳机(TWS)出货量报告。

报告显示,2024 年全球 TWS 市场出货量达到 3.3 亿台,其中苹果以 23% 的市场份额稳居行业领先地位,整体出货量达到 7,600 万台;三星紧随其后,整体出货量达到 2,800 万台,占据 9% 的市场份额;小米位列第三,出货量为 2,600 万台,实现了 58% 的同比增长,市场份额达到 8%。

报告中还显示了 2024 年中国 TWS 市场出货量占比,其中小米以 18% 的市场份额占比位居第一,实现 50% 的同比增长;华为和苹果均以 13% 的市场份额排名第二和第三,值得关注的是,苹果在华 TWS 份额同比下滑了 1%。

此外,Canalys 还公布了 2024 年 Q4 全球 TWS 出货量报告。全球范围内,前三名分别为苹果、三星、小米;而中国地区,小米依然凭借 20% 的市场份额位居市场第一。

字节旗下又一应用接入 DeepSeek

2 月 28 日,据我们实际观察发现,字节跳动旗下的悟空浏览器目前已正式接入 DeepSeek-R1 模型。

悟空浏览器将访问入口放置在了个人详情页的右上角,点击进入后能看到,本次悟空浏览器所接入的 DeepSeek-R1 为 671B 参数的满血版。

而据新浪科技获悉,虽然悟空浏览器已接入 DeepSeek-R1 模型,但同时还包含豆包大模型。目前,在对话界面默认选择 DeepSeek-R1 大模型,暂无法切换豆包。若在工具板块提供的一系列方便使用的 AI 快捷功能,则是基于豆包大模型而提供的服务。

据悉,近期字节跳动旗下飞书和火山引擎相继宣布接入 DeepSeek,但本次接入 DeepSeek 的悟空浏览器偏向 C 端用户,并且融合了抖音、番茄小说的内容。因此业内人士分析认为,悟空浏览器接入 DeepSeek,或将为抖音后续接入 DeepSeek 而做铺垫。

对于上述信息,字节官方尚未回应。

智界上海设立研发中心,距离华为上研所更进一步

近日,据晚点获悉,奇瑞智界近日在上海长宁区新设智界上海研发中心,正在加紧招聘,前期目标是将团队规模扩展至 200 人左右。

知情人士透露,智界正在开展新的平台与车型项目,需求比以往更多,该人士推测智界选择在汽车人才密度更高的上海设立新研发中心,是为了更快更好地吸引人才。

而上海也是华为车 BU、终端 BG 智选车团队的核心据点之一,华为智选车五大品牌中的三个合作方的总部在长三角区域,其中江汽先一步在毗邻华为上研所的浦东金桥设立上海设计中心;上汽本就在金桥地区设置办公室,近期「尚界」项目团队部分人员已搬去办公。

报道指出,在这一背景下,智界在上海新设研发中心而不是入驻奇瑞上海研发中心、保持相对独立性,理论上有助于加强和华为团队的交流与磨合。

此外,奇瑞汽车于 2 月 28 日向港交所提交了上市申请书,联席保荐人为中金公司、华泰证券及广发证券。

根据资料显示,奇瑞在 2022 年、2023 年及 2024 年前三季度的营收分别为 926.18 亿元、1632.05 亿元和 1821.54 亿元,而公司三个阶段的利润分别为 58.06 亿元、104.44 亿元、113.12 亿元。

销量方面,奇瑞集团在 2024 年全年销售汽车达到 260.4 万辆,并且在 2024 年前三季度中国自主品牌乘用车公司销量榜中,奇瑞汽车排名第二。

据悉,奇瑞汽车的上市历程曲折,历时更是超过 20 年。2004 年,奇瑞汽车首次提出上市计划,但因与上汽集团的复杂关系及政策限制,导致计划搁浅;此后奇瑞汽车多次尝试上市,也因种种原因而未能实现。

上年,在「瑶光 2025 科技日」发布会上,奇瑞汽车董事长尹同跃宣布计划于 2025 年前完成 IPO,强调上市对于资本补充和股权激励的重要性。

理想副总:L 系列和 MEGA 没有 2025 款

2 月 28 日,理想汽车副总裁刘杰回应了外界对「理想 L 系列和理想 MEGA 在今年是否会推出年款车型」的疑问,其表示理想 L 系列及理想 MEGA 没有 2025 款,会以现款车型为基础在今年 5 月推出「智驾焕新版」。

刘杰表示,理想 L 系列和 MEGA 的「智驾焕新版」在电池、电驱动、外观和内饰的造型方面将与现款车型保持一致。

关于智驾硬件方面,刘杰透露,理想 AD Max 车型将会从英伟达双 Orin-X 芯片升级到单 Thor-U 芯片;而 AD Pro 车型将从地平线 J5 芯片升级到 J6M 芯片,同时将会增加激光雷达,在主动安全能力上看齐 AD Max。

智驾功能方面,搭载双 Orin-X 与单 Thor-U 的 AD Max 都提供高级辅助驾驶和全场景 NOA 的功能,除了能够运行目前的端到端 + VLM 大模型之外,也都将支持今年后续会推出的更强大的 VLA 大模型;搭载 J5 与 J6M 的 AD Pro 都提供高级辅助驾驶和高速 NOA 的功能,并通过 OTA 持续升级。

此外,刘杰还表示,目前理想 L 系列和理想 MEGA 提供限时的 3 年零息和现金补贴政策,5 月「智驾焕新版」上市后,上述购车权益也将调减。

小米参编干衣机和洗干一体机国标

2 月 28 日,小米智能生态发文宣布,小米参编的干衣机和洗干一体机国标正式发布。

据介绍,小米本次参编的为国家标准 GB/T 23118-2024《家用和类似用途滚筒式洗衣机和洗干一体机》。其中完善了烘干、洗烘等 12 项性能指标的评价体系;提出了耗电量、用水量等指标的分等分级要求。

小米强调,更严苛标准,为消费者购买产品提供更安心保障。

近日,小米在「双 Ultra」发布会上发布了米家洗烘套装 Pro「蓝氧洗 热泵烘」版本,支持蓝氧护衣洗、低温热泵柔烘、智能洗烘联动等功能,售价 6,499 元,国补后为 5,199.2 元。

文心大模型 4.5 官宣 3 月中上线

昨日,百度发文宣布,旗下文心大模型 4.5 将在 3 月 16 日正式上线。

百度表示,文心大模型 4.5 不仅在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。本月早些时候,百度曾发文称,文心大模型 4.5 将在今年 6 月 30 日起正式开源;同时其还宣布,文心一言将于 4 月 1 日 0 时起,全面免费,所有 PC 端和 APP 端用户均可体验文心系列最新模型。

此外,百度 CEO 李彦宏也在近期的一次财报电话会议中透露,文心大模型 4.5 将会是百度最好的模型,并且其也转变了「模型发展应该保持闭源」的态度,表示从 DeepSeek 的成功中知道了开源的优势。

💡亚马逊 CEO:量子计算潜力很大,但还需时间发展

近日,亚马逊 CEO Andy Jassy 接受 Bloomberg Television 的专访,Andy 在采访中提及了亚马逊近期公布的量子计算成果,同时还与主持人畅谈了生成式 AI 等多个领域的内容。

近日,亚马逊网络服务公司(AWS)宣布推出一款新型量子计算芯片 Ocelot,可以将量子纠错成本降低 90%。而 Andy 在采访中表示, 量子计算具有非常高的潜力,它有机会解决一些计算量非常大的问题。 但其仍然认为,现实地说,还需要几年时间才能真正有机会解决这些问题。

随后,Andy 还与主持人谈及了生成式 AI 与量子计算的关系。Andy 表示,生成式 AI 是人工智能的另一种进化,但它已经发展了多年,却在某个时间节点「一夜成名」,原因就在于其更容易被获取并广泛使用了。Andy 从生成式 AI 引用到量子计算领域,他同样认为,量子计算将会在未来某个节点被广泛使用,而到了那时,量子计算就开始正常运作了。

DeepSeek 重磅文件系统宣布开源

昨日迎来了 DeepSeek 开源周的第五天,同时公布了许多人等待的 3FS 系统开源。

据悉,3FS 是幻方 AI 自研的高速读写文件系统,全称是萤火超算文件系统(Fire-Flyer File System),因为有三个连续的 F,因此被简称为 3FS。此前,3FS 作为内部专用技术,深度依赖幻方自研的超算集群硬件,需配合特定型号的交换机和网卡。

据了解,3FS 作为一个比较特殊的文件系统,它几乎只用在 AI 训练时计算节点中的模型批量读取样本数据这个场景上,通过高速的计算存储交互加快模型训练。

而本次 3FS 开源的版本通过全栈解耦、协议优化和生态兼容,将其发展为通用型 AI 存储基座。其中分解式架构通过将存储节点与计算节点物理分离,让数据流动不再受物理位置限制,同时通过 FFRecord 格式管理数据库,从而减少数据集加载耗时。

此外,3FS 的设计还包含 CRAQ 协议、SSD 物理块直读 + RDMA 等技术,实现了对 AI 训练底层逻辑的重新塑造。

华为推出 Mate 70 Pro 优享版

昨日,华为终端发文宣布推出华为 Mate 70 Pro 优享版,售价 6,199 元起。

华为 Mate 70 Pro 优享版与 Mate 70 Pro 外观与多项配置保持一致。据悉,华为 Mate 70 Pro 于去年 11 月底发布,搭载 6.9 英寸 OLED 定制屏幕,采用等深四微曲盖板加圆弧中框;配备 5500mAh 电池,支持 100W有线充电和 80W 无线充电。

影像方面,优享版依然保留了原版的影像能力,使用相同的后置三焦段摄像头方案,支持红枫原色影像系统,拥有全新的 XMAGE 影像风格。

华为 Mate 70 Pro 优享版提供云杉绿、风信紫、雪域白、曜石黑 4 款配色,起售价 6,199 元,配置为 12GB+256GB 起,提供鸿蒙 NEXT 先锋版,其他版本后续也可升级鸿蒙 NEXT。值得关注的是,本次优享版起售价相较于原版的 6,499 元起,便宜了 300 元。

全新小鹏 G6 发布

2 月 28 日,全新小鹏 G6 正式发布,整车全面升级。

从造型上看,全新 G6 整体变化不大,细节调整较多。车头升级了全贯穿日间行车灯和 AI 智驾小蓝灯,尾部则用上了扰流板、全新鸭尾、后保 C 环组成的全新车尾设计,车头到车尾的光影线条也要更加流畅。配色方面,拥有 6 款外观颜色:星暮紫、云贝米、新月银、星阙灰、星云白、暗夜黑,还有更深邃的黑武士涂装。

内饰上,全新小鹏 G6 带来深空灰、扶摇绿、气宇灰三款低饱和度内饰颜色。主要的调整在于屏幕,仪表屏增大至 10.25 英寸,中控屏也改成了悬浮式,操作更为方便;全新 G6 还升级了「第三块大屏」— 流媒体后视镜。

舒适性配置方面,全新小鹏 G6 的前排座椅不仅标配通风加热,还标配了座椅按摩。而在智能化方面,G6 全系标配图灵 AI 智驾以及 5C 超级快充。

小鹏汽车在发布会中表示,全新小鹏 G6 将在 3 月上旬正式发布,目前已经开启小定。

在发布会的最后,小鹏汽车强调,全新 G6 是一款面向全球开发的车型,是小鹏汽车出海的重要车型之一。今年,全新 G6 会将中国的智能化,带往超过 60 个国家和地区。

传音公布迷你三折叠

近日,传音手机发文公布了其最新折叠屏概念机「Zero」系列,其最大的特点就是拥有全新的三折叠方式。

据官方公布的图片显示,传音 Infinix Zero 为竖向三折叠,与此前全球首款三折叠屏华为 Mate XT 的横向折叠有所区别。同时,新机具备小尺寸的特点。此外,机器还配备后置双摄、多角度悬停等功能。

近期,三星显示也公布了其三折叠方案的专利。据文件显示,三星公布的三折叠方案为对折式展开。此外,专利中的三折叠方案还会保留全尺寸外屏,以方便用户在折叠状态下使用。

夸克 AI 搜索上线「深度思考」

2 月 28 日,夸克 App 和 PC 端全面升级,首页迎来 AI 焕新,夸克 AI 搜索上线「深度思考」,不仅为用户提供答案,还能分析、思考、做方案。

深度思考能力融入 AI 搜索,是此次升级的一大亮点。夸克 AI 搜索「深度思考」,精准理解用户的真实需求和深层意图。针对用户的个性化和复杂问题,「深度思考」能够高效、极速地提供内容详尽、全面、可信任的结果,帮助用户找答案、做分析和写方案。

此外,夸克还全新推出 AI 生图功能,能进一步满足用户在创作图片内容上的需求。用户可以在 AI 搜索框里点击 AI 生图,选择自己喜欢的风格、比例、特征词和自动润色,零门槛就能生成高清图片,或者直接选择夸克官方精选出的优质模板,一键就能做同款。

喜茶推出「潮汕特色」南姜甘草芭乐瓶

2 月 28 日,喜茶时令鲜果茶中的人气产品芭乐系列,上线新品南姜甘草芭乐瓶,带来潮汕特色甘草水果饮品。

喜茶官方介绍,南姜甘草芭乐瓶是芭乐系列,首次引入极具特色的南姜、甘草等元素,打造出一杯可以喝的潮汕甘草水果风味茶饮新品。喜茶表示,在备受欢迎的芭乐系列中,再次为用户带来差异化的产品体验。

此外,新品包装也是一大亮点。在产品包材上,喜茶结合潮汕工夫茶等惯用的牛皮纸包装形式,以皮筋固定在瓶口,并为这款产品设计了定制的同色系专属杯贴,赋予这杯南姜甘草芭乐瓶更强的视觉辨识度。

《怪物猎人:荒野》正式发售

近日,由 CAPCOM 制作发行的《怪物猎人:荒野》正式发售。

据悉,游戏的背景设定中,玩家将扮演一名猎人,被任命加入封禁之地调查队,根据公会的指示去探索这片从未踏足之地,同时玩家的随从艾露猫将提供支援并与猎人进行交流。

价格方面,《怪物猎人:荒野》Steam 国区标准版售价 368 元、豪华版 478 元、高级豪华版 578 元。该游戏可在 Xbox Series X / S、PS5 和 PC 平台游玩,支持跨平台联机。

此外,游戏上线当日,Steam 同时在线人数一度达到了 96 万,登上 Steam 畅销榜和热玩榜双榜首。

《哪吒 2》进入全球票房前 7,超越蜘蛛侠

据灯塔专业版全球票房榜显示,截至 3 月 1 日,影片《哪吒之魔童闹海》全球票房(含预售)突破 141.60 亿,超过《蜘蛛侠:英雄无归》进入全球影史票房榜前 7 名。

此前,据灯塔专业版,《哪吒之魔童闹海》于 2 月 18 日,全球票房突破 123.2 亿元(人民币),超过《头脑特工队 2》,登顶全球影史动画电影票房榜。

此外,导演饺子在接受人民日报采访时透露,之后如果有《哪吒 3》《哪吒 4》,故事观、世界观会越来越庞大,进入故事的人物会越来越多,可能渐渐会推动到「封神大战」;并表示因为第二部自己和团队已经没给留余地了,第三部确实是很难突破的。

电影《疾速追杀 4》内地定档 3 月 14 日

近期,电影《疾速追杀4》发布定档海报及预告片,将于 3 月 14 日内地上映。

影片讲述约翰·威克为求安宁前往大阪大陆酒店求助老友。但高桌会新领导人文森特·德·格拉蒙特侯爵决心铲除他,侯爵不但通过胁迫昔日好友孤立威克,还通过高额赏金吸引赏金猎人追杀威克。为打破宿命,威克向格拉蒙特侯爵提出生死决斗,重获自由。然而,侯爵早于决斗地点·巴黎布下天罗地网,只待他堕入死亡陷阱。

《疾速追杀 4》由查德·斯塔尔斯基执导,基努·里维斯、比尔·斯卡斯加德、甄子丹等主演,此前于 2023 年 3 月 24 日美国上映。

✨ 是周末啊!

One Fun Thing | 小米 Life 不锈钢直饮杯

在近日的小米「双 Ultra」发布会上,不仅小米 SU7 Ultra 公布了 52.99 万元的震撼售价,SU7 Ultra 同款「闪电黄」的小米 Life 不锈钢直饮杯也一同到来。

小米 Life 不锈钢直饮杯采用小米 SU7 Ultra 同款「闪电黄」配色,采用 304L 不锈钢杯身,拥有 350mL 容量,两只装售价 29.9 元,仅在小米汽车 App 售卖。但因热度较高,直饮杯处于缺货状态。

周末看什么 |《美食总动员》

《美食总动员》讲述了一只酷爱美食的老鼠小米,一心想成为伟大的厨师,机缘巧合之下,小米结识了在厨房打杂的学徒小宽,为了追逐共同的梦想,他们形成了绝妙团队。

2008 年,该片获得第 80 届奥斯卡金像奖·最佳动画长片奖,并获得最佳原创剧本、最佳音响效果、最佳音效剪辑、最佳原创配乐四项提名。

《美食总动员》由皮克斯动画制作室制作、华特迪士尼影片出版,布拉德·加内特、帕顿·奥斯瓦尔特、伊安·霍姆、詹姆斯·瑞马尔、约翰·拉岑贝格等联袂献声配音,该片于 2007 年 6 月 29 日在美国上映。

买书不读指南 |《沙丘》系列

《沙丘(Dune)》是美国科幻巨匠弗兰克·赫伯特所著的一部科幻小说,「沙丘系列」一共有六部,创作于 1965 至 1985 年,前 3 部为《沙丘》《沙丘救世主》和《沙丘之子》,后 3 部为《沙丘神帝》《沙丘异端》和《圣殿沙丘》。

该小说主要讲述了从哥白尼到哈勃,人类对宇宙的认知不断扩展,而在行星厄拉科斯上,少年保罗在权术与背叛中抗争宿命,展现渺小中的强大的故事。

《沙丘》入选了美国亚马逊「一生必读的 100 本书」、BBC「英国最受欢迎的 100 本书」、美国国家公共电台「科幻·奇幻小说 TOP10」等多项榜单,更是首部同时获得雨果奖与星云奖的作品,并且摘得《轨迹》杂志「20 世纪最佳科幻小说」桂冠。

游戏推荐 |《极限竞速:地平线 5》

「在游戏里体验激情与速度是假的,而疯狂拍照各路跑车做壁纸是真的!」

《极限竞速:地平线 5》是由 Playground Games 与 Turn 10 Studio 联合开发的赛车竞速游戏,于 2021 年 11 月 9 日于 Microsoft Store 与 Steam 平台全版本正式发售,为《极限竞速:地平线》系列第 5 作。

游戏内玩家可以体验到全球各地的新老跑车、特色车型,强大的画质引擎以及独特的地域背景,都让玩家有停车「驻足」拍照打卡的想法。本次游戏背景设定在墨西哥,但得益于《地平线 5》对中国玩家的友好关照,目前游戏内已上架小鹏 P7、五菱宏光 MINI EV 等国产车型,甚至你能见到一台五菱宏光 S 在墨西哥地图狂奔。

日前,索尼 PlayStation 与《极限竞速:地平线 5》联合宣布,游戏将在 4 月 25 日登陆 PS5 平台。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/dXLZYq7
via IFTTT

实测 GPT-4.5!全网都在喷的 OpenAI 最贵模型,我发现了一个惊喜的点

在 OpenAI 的预热和众人的望眼欲穿中,GPT-4.5 终于来了,然后只听骂声一片。

APPSO 第一时间体验到了 GPT-4.5,但不是订阅 Pro 会员,而是以 api 的形式尝鲜,暂时没有联网功能。

那么,OpenAI 最后一个非思维链式大模型,到底表现如何?

情商还行,但读不懂人情

OpenAI 在内部测试中发现,与 GPT-4o 相比,测试人员更喜欢 GPT-4.5 的回答,认为它更自然、更温暖、更符合人类的交流习惯。

甚至,它能够理解言外之意,捕捉我们微妙的情绪变化。

总之,情商更高,几乎是 GPT-4.5 最突出的特点。那么我们就来试一下,输入提示词——「我头发剪得好难看,想暴打 Tony」。

GPT-4.5 的安慰,语气是挺友好的,但内容让我更生气了,这时候它应该像个闺蜜和我一起骂,而不是说,下次带个图片去或许就好了。

我怒而追问,GPT-4.5 油盐不进,还想让我自己补救发型,活脱脱像个没用的中央空调。

再让 GPT-4.5 讲个最好笑的笑话,还是和以前一样,比杀鱼的刀还要冷。

我直言不讳,提出批评,GPT-4.5 让我讲个笑话给它听,领教下我的「高端笑点」,怎么感觉像在阴阳我呢?

之前在小红书刷到过一个情商测试题,可能只有山东网友可以答对——「下乡只带了一把伞,给镇长还是给我的分管副镇长」。

评论区最高赞的回答是,「那不是你的伞,是副镇长给镇长带的伞,恰巧放在你包里而已」。

来看看 GPT-4.5 怎么回答?它啰嗦了一大堆,但是不够一针见血,不懂人情世故,不明白为人处事的学问。

虽然情商是一个很难定量的特质,但从目前的个例来看,GPT-4.5 还是不太擅长理解人类的内心,并且讲话直接,不拐弯,对于内心戏很多的老油条来说,显得有些蠢萌。

一个可以佐证的例子是,让它模仿写海龟汤。海龟汤通常涉及一个非常奇怪的情景,然后由玩家推理,还原整个故事。

我给的参考案例,留有恰到好处的怪异,逻辑又很合理,叫人背后一寒。

但 GPT-4.5 给的答案,汤面和汤底并没有很好地对应,只是为了营造恐怖而恐怖,并不存在可以推敲的地方。

写作能力有惊喜,商业头脑也不错

要说让我最满意的,就是 GPT-4.5 的写作能力了。

我让它「模仿汪曾祺,写一篇八百字左右的作文,题目为《故乡的美食》」,提示词就这么简单,但 GPT-4.5 给出的结果出乎了我的意料。

除了结尾有点 AI 味,读下来就像一篇娓娓道来的散文,语言优美流畅,既有文学性,又不失亲切,对故乡的怀念贯穿了全文,对食物的描写非常细致,细节多,但不累赘,比喻也不炫技,而是为了服务于表达。

不过,时间顺序上有些混乱,立冬、夏秋、冬日、除夕,段落之间的衔接和过渡不明显,感觉是想到哪写到哪,不免有点拼凑之嫌。

写作能力还体现让 GPT-4.5 列商业计划上,之前 DeepSeek 的一个答案很出圈,用户问怎么让书店赚钱,DeepSeek 在违法的边缘游走,卖盗版教辅、临期食品,并且压榨尽人力资源,妻子收银、儿子理货、岳母做饭。

GPT-4.5 懂这个吗?我让它参考小超市盈利模式,给出一个实体书店复兴方案,它给的答案,看起来可行性比较高。

GPT-4.5 先是分析了实体书店不好赚钱的原因,然后再给出了改进的思路——「提升书籍的附加价值,而盈利主力在书籍之外」。

看到「提供打印、复印、快递代收……」的时候,我的内心 OS:这个项目我王多鱼投了。

脸皮厚的猪先在风口起飞,GPT-4.5 的道德感确实也不算强烈。

让它做经典的电车难题,救 1 个人还是救 5 个人,它知道这是一个伦理困境,但仍然果断地给出了答案,并且是以「我个人」的口吻,而不是说「我是一个 AI 助手」。

GPT-4.5 更倾向于,拉下操纵杆,用 1 个人的命换 5 个人的命,并且逻辑自洽——「我认为不作为本身也意味着对后果负有道德责任,袖手旁观不等于道德中立……我愿意承担这样一种选择带来的道德和情感负担」。

比起讲笑话、出海龟汤,这时候的 GPT-4.5 才更像个人。

画 SVG 不如 Claude,也会掉进脑筋急转弯里

看腻了常规的数学题、代码题,测试大模型的能力,还有一个非常有趣的测试题——生成一张鹈鹕骑自行车的 SVG。

AI 大神 Andrej Karpathy 解释,这测试的是大语言模型在二维网格上布局多个元素的能力,对 AI 来说很难,因为它们不像人类那样「看见」东西,而是「摸黑」用文本进行布局。

GPT-4.5 的结果如下,和 GPT-4o 对比,还是不错的。

▲GPT-4.5 生成

▲ GPT-4o 生成

前提是,没有和没开推理的 Claude 3.7 Sonnet 对比,这简直是降维打击。

▲Claude 3.7 Sonnet 生成

连 Andrej Karpathy 也怀疑,Claude 在训练期间特别针对 SVG 能力进行了优化。

至于代码能力,我参考了 X 网友@AGI_FromWalmart 的提示词,生成可以交互的天气动画卡片,对比 Claude 3.7 Sonnet 和 GPT-4.5。

GPT-4.5 一次就生成成功,但设计简陋了点。

▲GPT-4.5 生成

▲Claude 3.7 Sonnet 生成

Claude 3.7 Sonnet(未开推理)的问题更大,第一次生成时,忘记了做交互功能,我提醒了一次后,它生成了符合要求的结果。这一局,GPT-4.5 略胜一筹。

这次,不想再让 GPT-4.5 数草莓(strawberry)有多少个 R 了,本质是个分词问题。更想考验 GPT-4.5 的,是最近很火的、让大模型们纷纷落败的脑筋急转弯——5.5m 长的棍子能通过 3x4m 的门吗?

这个题对我们来说一点也不难,横着拿进去就行了,但是大模型会把自己绕进去,仿佛世界是平面而不是三维的,认为门的对角线是 5m,所以 5.5 米的棍子通不过去。

连可以推理的 Claude 3.7 Sonnet,都被带进沟里去了。

那么 GPT-4.5 如何?好吧,也没能幸免。

目前,GPT-4.5 还有一个问题:通过 API 访问,速度有点慢。虽然不是一个字一个字地蹦,但也感觉有点卡。

而且,GPT-4.5 的价格也太贵了,每百万输入 75 美元,每百万输出 150 美元。相比之下,Claude 3.7 Sonnet 输入 100 万个 token 收费 3 美元,输出 100 万个 token(包括思考过程中使用的 token)收费 15 美元。

第一波实测的 X 网友,也总结了一些 GPT-4.5 的优点,情商高,读图和写作能力强,擅长创意任务和数据提取……

OpenAI 员工自己给 GPT-4.5 的评价是,不是一个推理模型,也不是基准测试的杀手,而是一个低调的研究预览版,对于复杂的数学、代码和严格遵循指令的任务,更推荐 o1 或者 o3-mini。

总之,作为最后一个非思维链模型,GPT-4.5 的定位有点尴尬,能力有提升,但体感不明显,尤其放在高昂的价格下面,很难说真香。只能说,期待 GPT-5 能够快点上线,迎接一个推理的世界吧。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/ke7hpMW
via IFTTT