2024年12月30日星期一

AI爆火两年,技术飞快跑,大模型突破商业化困局了吗?

自从 ChatGPT 横空出世,AI 的热潮已经席卷了两年。这两年,普通人对大语言模型的能力兴奋,随便一条指令就能生成流畅自然的文本,科幻电影里的场景,如今早已经成为现实。 

大模型这个赛道也开始进入到一个十字路口,新技术如何转化为新产品,满足真需求,发展成新的商业生态。

如同移动支付、智能手机、 LTE 共同点燃了移动互联网时代的繁盛,AI 行业这一年也在寻找这样的 PMF(Product Market Fit)而焦虑。

新技术的大航海时代已经开启,到底能不能发现新大陆,这将决定大模型是不是又一个烧钱的资本游戏,是 .com 泡沫的加速重演,还是如黄仁勋所言的新工业革命开端,这个答案会比 AGI 更快让我们看到 。 

大模型的大问题

今天,基座模型的竞争基本已经形成稳定的格局。由 OpenAI 领衔,旗下的 ChatGPT 也是稳居市场龙头。Anthropic,DeepMind,Llama,Grok,也各有各的长处。

于是,今年最热闹的,不是谁又多扩充了多少参数、响应速度提高了多少秒,而是大模型技术怎么化身为一个能用的产品。 

大语言模型的技术怎么落地,从一开始就是个抓肝挠心的问题。哈佛商业评论曾经做过一个调查,发现生成式 AI 的应用——种类之繁杂,多达 100 类。

不过,在大类上就是五种:技术问题解决、内容生产及编辑、客户支持、学习和教育、艺术创作和调查研究。 

知名的投资公司 a16z,给出了他们团队心中优秀的生成式 AI 产品,其中有不少眼熟的,比如通用类的 Perplexity,Claude,ChatGPT。也有更为垂直的,比如笔记类产品 Granola, Wispr Flow,Every Inc.,Cubby 等。还有教育赛道今年最大赢家 NotebookLM,或者是聊天机器人 Character.ai,Replika 等。  

繁花锦绣是对于普通用户来说的:上面这些产品,绝大多数只是免费就足够用了,订阅版或 pro 版的费用,不是必须花的钱。强如ChatGPT,今年的订阅收入大概在每月 2.83 亿美元,与去年相比增长了两倍。但在巨大的成本面前,这点收入显得杯水车薪。

享受科技发展属于普通用户的开心事,烈火烹油是留给从业者的:再怎么激动人心的技术进化,也不能停留在实验室里,而是要进入商业社会接受检验。订阅模式没有被广泛接受,植入广告的时机还没有到来。留给大模型空烧钱的时间,已经很少了。

相比之下,toB 业务的走势让人有信心的多。

自 2018 年以来,财富 500 强财报电话会议中提及 AI 的次数几乎翻了一番。在所有财报电话会议中,19.7% 的记录提到最多的主题,就是生成式人工智能。

这也是整个行业的共识。根据中国信通院发布的《人工智能发展报告(2024 年)》蓝皮书,2026 年,超过 80%的企业将使用生成式人工智能 API,或者部署生成式的应用。

面向企业侧和消费侧的应用展现出不同的发展态势:面向消费侧,大模型应用讲究低门槛、创意性。而面向企业侧,大模型应用更注重专业定制和效益反馈。

换句话说,提升效益当然是每个企业都在追求、都想实现的,但只有这四个字太模糊了。大模型需要证明自己能实实在在地解决使用场景中的问题,真真切切地提升效益。 

精准找到切角,让技术降落 

无论是资源的投入,还是对开拓市场的力度,国内的大模型竞争,在整个 2024 年称得上激烈。

根据工信部数据,2023 年中国大语言模型市场规模增长率突破 100%,市场规模达到 147 亿元。各家厂商在商业化进程上积极尝试,首先打响的是价格战:以 tokens 计费、API 调用等方式的成本,正在被不断拉低。许多主流热门通用类大模型的价格,离白用已经没多远。

把价格打下、降低成本是更好实现的。而理解业务、分析切入场景,是一条更崎岖的路线。

不过,也不是每一家都在参与价格战,靠低价硬卷。

「在这种情况下,更重要的是找到我们的特点,发挥我们的优势。腾讯内部本身有很多场景,这些场景给了我们更多洞察,也进一步打磨了我们的能力」腾讯云智能 AI 产品专家、腾讯混元 ToB 产品负责人赵新宇这样认为,「往外看,聚焦一个行业,聚焦在这个行业内一些特定的场景,再慢慢拓展出去。」

在众多基座模型中,混元可能不是热度最高的一个,可在技术实力上却不容忽视。

九月时,混元发布的通用文生文模型混元 Turbo,采用全新的混合专家模型(MoE)结构。从语言理解和生成、逻辑推理、意图识别,到编码、长上下文和聚合任务中,都有相当强大的表现。在 11 月的动态更新版本中,已经升级为全系列效果最好的模型。目前,腾讯混元的能力正在通过腾讯云全面输出,通过提供多尺寸、多类型的模型,结合腾讯云智能其他的AI产品和能力,帮助模型应用落地到场景中。

纵观目前模型应用落地形态,大致分为两种:严肃场景和娱乐场景。后者类似于聊天机器人、陪伴类应用等等。

而「严肃场景」,则指向企业核心业务运营中,对准确性和可靠性要求较高的应用场景。在这些场景中,大模型要承担结构化的信息处理,往往需要遵循预设的业务流程和质量标准,其应用效果,会直接关系到企业的运营效率和业务成果。

腾讯云曾经帮助一家外呼服务商构建客服体系,这是一个典型的严肃类场景。同时,外呼涉及到自然语言对话能力、内容理解和分析能力,看上去天然和大语言模型有极高的适配。

实际上,挑战都在细节之处。当时团队面临核心挑战有两个。一是性能问题,由于模型参数量巨大,达到 70B 或 300B 规模,如何在500毫秒内完成响应,并传递给下游 TTS 系统成为一个重要的技术难题。

二则是对话逻辑的准确程度。模型会在在一些对话中出现不合逻辑的回复,影响整体对话效果。为了克服这些挑战,项目团队采取了密集迭代的策略,在 1-2 个月的开发周期内,保持每周一个版本的快速迭代节奏。

企业客户对大语言模型技术展现出兴趣,并愿意进行创新尝试,但在技术与业务的深度融合方面,始终存在认知鸿沟。这并非源于企业对自身业务理解的不足,而是需要一个专业的技术团队,通过深入理解行业痛点和业务场景,找到最恰切的场景,为企业量身打造 AI 落地的方案,实现技术与业务的最优契合。

「传统的做法可能需要运营人员一个场景一个场景地搭建(语料库),」新宇介绍到,「而大模型,你只需要给一个 prompt,就可以实现需求了。」在摸清楚需求后,混元的团队几乎每周一个版本更新,「卷」起了迭代速度,一两个月下来,准确度已经达到了 95%。

对于这家外呼服务商,生成式技术完全是新鲜事物。而混元直接让他们看到了大模型所带来的效益,在人力方面的开支减少了四分之三。

「最好的做法就是把效果拿出来,」新宇说,当客户对生成式技术的了解有一点,但不多的时候,把效果摆出来是最有效的。通过客户的业务经历,找到可以切入的场景,直接去做测试验证,展示出可以提升的效果。

类似的经历,在体现和小米的合作中,这是一次被称为「双向奔赴」的合作。

对方希望在问答互动中引入大模型,把AI搜索的能力应用到端侧。这踩中了混元的两个长处:一是由腾讯丰富的内容生态所提供的支持;二是混元在 AI 搜索方面的能力。对于问答来说,准确率非常关键。

「一开始还是有很多困难的,」新宇回顾道,「从他们的角度来看,业务形态涵盖了多个场景,包括闲聊、知识问答等不同类型,其中知识问答场景,对准确率有比较高要求。」

通过前期的测试,混元团队明确了自己在搜索场景中的优势,双方一起将广泛意义上的问答互动,按照不同的话题层级逐步细化。这样的细分,能够让模型更清晰地了解各个场景的具体需求和效果要求,从而进行更有针对性的优化。 

知识问答场景,成了那个降落点。在后续的实现上,混元需要攻克的挑战仍不少:时延问题不必多说,响应时间一定要快;其次是对搜索内容的整合。 

「在整个链路当中,我们做了自建搜索引擎,还有一个意图分类模型,来判断是不是一个高时效性的提问。比如是不是跟新闻、时事相关的话题,然后再判断是该给到主模型还是 AI 搜索。」

只调用最需要的部分,这样一来响应速度能够大大提升。而一个重要的发现是, 70% 的问询都会引到 AI 搜索上,这意味着必须要有足够丰富的内容,作为最基础的调用支撑。

而混元背后,站着的是整个腾讯的内容生态。从新闻、音乐、金融,甚至医疗等更具体的领域,都能在腾讯的生态里找到海量的优质内容。这些都是混元模型在搜索时,可以触达和引用的数据,也是独一无二的壁垒。 

经过历时两个多月的高强度迭代,最终无论是回答的质量、响应和性能等方面,都完全实现了需求,上线到了小米的实际业务中。

toB 业务的要义便在于此,能够实现营收、能够赢得信任,需要实实在在给客户的业务带来价值。

「卷」泛化,才能走向更多场景 

大模型在不同行业和产品的落地中,实际上也在促进技术自身的成长。 

对于一部分大模型产品而言,选择 toC 的路径有一个核心考量:用 C 端的反馈来优化模型。大模型对调优的需求没有尽头,而 C 端消费群的数量和活跃度,为模型的迭代提供了养料。这样一来,迭代的飞轮就能跑起来。

实际上,这在 toB 业务中也会实现,甚至要求更高。

「少年得到」的 K12 语文作文批改功能,应用了混元的多模态能力。结合腾讯云智能的 OCR 技术,识别学生的作文内容,并根据设置好的评分标准,由大模型为作文打分。

通常,大模型和真人教师判分,差值在五分内就很好了——可这并不容易实现。一开始混元的评分和真人教师的评分,差值小于五分的情况,只有 80%。

「模型有一定方法和能力,能够解决一些场景里的问题。但是聚焦到一个具体客户的业务上,对这个效果有更高的要求。」新宇说,「可能 90%的准确度可以达成业务目标,但只有 70% 和 80% 的时候,就有一定距离。」 

这意味着还要继续「卷」下去。随着服务企业客户群体的不断扩大,对技术本身也提出了新要求:首先是迭代速度的大幅提升——面向 C 端用户时,迭代可能需要一到两个月。而现在,每周都能出现一个版本,这种高频迭代节奏极大促进了模型的成长和进步。

其次,通过持续服务不同企业场景,也显著增强了模型的泛化能力。这表明,深入服务多元化的企业需求不仅加快了模型开发迭代的节奏,也提高了模型的实用性和适应性,可以从严肃场景,拓展到偏娱乐向的场景中。 

刚刚获得千万级 A 轮融资的角色扮演内容平台「造梦次元」,应用到了混元大模型的角色扮演专属模型Hunyuan-role,定位于服务年轻用户,结合生成式 AI 技术,提供交互式、剧情化的虚拟角色互动体验。

Hunyuan-role 开创了一种全新的人机交互方式。通过塑造丰富多样的虚拟角色形象,并基于预设的剧情背景和人物设定,与用户展开自然流畅的互动对话。

在技术层面,这样的场景应用到了 Hunyuan-role 在长短文本对话处理、意图识别和响应等方面都展现出领先优势,能够胜任多样化的应用场景,并且展现出了出色的内容拟人化能力——不仅能够进行有温度的对话互动,还可以推进故事情节发展,营造沉浸式的用户体验。

这些特性使得 Hunyuan-role 成为产品获客和用户运营的有力工具,在提升用户留存率和使用粘性方面发挥着重要作用。同样也反映出,在严肃场景得到锻炼和提升的混元,从而形成的泛化能力,可以覆盖到更广阔的场景,乃至在端侧的应用。

从严肃场景,逐步扩展到娱乐、创意,乃至更多的场景,是大模型应用必须走上的征程。

随着技术的成熟和成本的降低,大模型势必要向更广泛的应用场景扩展。原先聚焦于严肃的商业场景,如企业办公、数据分析、科研等行业,因为这些场景具有明确的需求和较高的支付意愿。

进一步拓展到娱乐、创意、内容生产等行当中,需要在思路上有一个锚点:始终以解决具体场景中的需求点为核心目标,锚定融合大模型能力的切入点。

除了与应用软件的合作,也需要有和硬件厂商的合作,让模型在最靠近消费者的端侧有所施展与发挥,提供更贴近用户的日常生活,提供更便捷、即时的服务体验。

这个过程中,市场对生成式 AI 技术的认知和接受度在不断提高,用户基数也在持续扩大。面对这种快速变化的市场环境,模型的迭代能力变得尤为重要。这不仅体现在技术性能上,还包括对用户需求的理解、对不同场景的适应性等多个维度。只有那些能够快速学习、持续优化、不断适应新需求的模型和团队,才能在竞争中保持优势。 

在不断覆盖更多场景的时候,也是在走向更多的终端消费者。随着市场整体对生成式技术的接受,潜在用户量会持续增加,一个能够快速迭代和自我提升的模型,才可以敏锐地适应变化,走得更稳、更远。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/gSc1h2R
via IFTTT

有了这个国产版 o1 模型,我想能在《鱿鱼游戏》里活到最后

像人类一样思考的 AI 离我们还有多远?

在道格拉斯·亚当斯的科幻小说《银河系漫游指南》中,一个高纬度种族为了找到生命、宇宙以及任何事情的终极答案,设计一台超级电脑「Deep Thought」来计算。

「Deep Thought」经过 750 万年的运算,得出了「42」这个答案。

而最科幻的往往是现实,即便是回答极其复杂的问题,AI 推理和思考可能只需要不到 1 分钟。

OpenAI 今年 9 月发布推理模型 o1 后,人们开始意识到,在追求「更大」之后,AI 开始追求「更像」,推理能力成为 AI 进化的下一个重要拐点。

今天,我们发现号称「中国版 OpenAI」的智谱也同样上线了一款类 o1 的推理模型 GLM-Zero-Preview(GLM-Zero 的初代版本 )。

虽然这几个月已经有多家公司纷纷上线推理模型,但在体验完 GLM-Zero-Preview 后,我发现它还是有些新东西。

想要体验 GLM-Zero-Preview,方法很简单。

GLM-Zero-Preview 发布即上线,支持智谱清言用户免费使用,以及智谱开放平台 API 调用。现在,登陆「智谱清言」网页和 APP,进入「Zero 推理模型」智能体,上传文字或图片即可免费体验。

此外,GLM-Zero-Preview 的 API 也已同步上线智谱开放平台 bigmodel.cn。

附上体验地址:
智谱清言
https://ift.tt/EBxles2
智谱开放平台
https://ift.tt/zlgRE46

从「鱿鱼游戏」到量子力学,这个国产版 o1 轻松拿捏

最近,在热播韩剧《鱿鱼游戏2》中,一道双手石头剪刀布的游戏简单又刺激,这个游戏增加策略推理和心理层面的博弈,在以生死为赌注的压力下,难度还会增加。

但如果我带着 GLM-Zero-Preview 去玩这个游戏,活下来的概率就会大大增加。

「双手石头剪刀布是一个更为复杂的石头剪刀布游戏版本。玩家开始时使用双手来表示石头、剪刀或布的任意组合。在看到对手的选择后,玩家必须同时举起一只手,留下最终的选择。」

怎么玩这个获胜概率更大?GLM-Zero-Preview 的回答详尽且实用,罗列出各种提高获胜效率的最优解。

科学和玄学有时也只有一线之差。今年不少寺庙被挤爆,在上班和上进之间选择上香的芸芸众生,求签不难,但解签却要排上长队,不想等怎么办?

那你可以试试求助 GLM-Zero-Preview。不仅免费效率高,而且解读还非常有考究,AI 多少还是有点玄学在的。

「第七十七签 吕后害韩信 中平 木有根来水有源,君当自此究其源 莫随道路人闲话,讼则终凶是至言」

谈完玄学,谈哲学。

前些年,有一道辩论题风靡一时,「美术馆着火了,一幅名画和一只猫,只能救一个你选谁?」在综合考虑生命价值、道德原则及情感因素后,GLM-Zero-Preview 优先选择救猫。

反复输入相同问题,GLM-Zero-Preview 的答案始终如一,结果坚定且逻辑自洽。

遇事不决,还有量子力学。那在经典薛定谔猫实验中,猫究竟是死是活?

先观察 GLM-Zero-Preview 的思考逻辑,再看它给出的答案「在经典薛定谔猫实验中,猫在盒子被打开之前处于既死又活的叠加态,直到观测时才确定其生死状态。」

细心留意,你还可以对得出的结果进行进一步的引用和追问。

在中文世界广泛流传的「爱因斯坦的谜题」同样也可以作为考究 GLM-Zero-Preview 的逻辑推理能力。

有五个不同颜色的房子,每个房子里住着一个不同国籍的人。每个居民喜欢不同的饮料,抽不同的香烟,并养着不同种类的宠物。已知:
1. 英国人住红色房子里。
2. 瑞典人养狗。
3. 丹麦人喝茶。
4. 绿色房子坐落在白色房子的左面。
5. 绿色房子的主人喝咖啡。
6. 抽 Pall Mall 香烟的人养鸟。
7. 黄色房子的主人抽 Dunhill 香烟。
8. 挪威人住第一间房子。
9. 五座房子中间的那座的主人喝牛奶。
10. 抽 Blends 香烟的住在养猫人的隔壁。
11. 养马的人住在抽 Dunhill 香烟者的隔壁。
12. 抽 Blue Master 香烟的喝啤酒。
13. 德国人抽 Prince 香烟。
14. 挪威人住的房子在蓝色房子的隔壁。
15. 抽 Blends 香烟的人有一个喝水的邻居。

答案是德国人养鱼,不知道你是否答对。

这道号称世界上 98% 的人答不上来的难题,就这样被 GLM-Zero-Preview 水灵灵地破解了。从繁琐的推理步骤可以看出, GLM-Zero-Preview 的 CPU 在飞速运转但还是很清醒。

继续乘胜追击,让我们上点强度。

五个海盗发现了 100 个金币,每个海盗都必须投票决定如何分配金币。如果海盗多于一位,只有在超过一半的海盗同意分配方式时,金币才会按照该方式分配。如果海盗少于一位,他会自己拿走所有金币。每个海盗都希望保留尽可能多的金币,同时还希望活命。海盗 1 如何保证自己能得到最大利益而又能保存生命。

「(97, 0, 1, 0, 2)」,面对海盗分金问题,GLM-Zero-Preview 再次轻松拿捏。

相声讲究说学逗唱,其中有个名段子叫「报菜名」。

那么问题来了,可否让 GLM-Zero-Preview 写段素菜版的「报菜名」,你别说,GLM-Zero-Preview 三下五除二就给出了新版本。

对了,GLM-Zero-Preview 同样支持多模态识别能力。

随手拿一瓶饮料并让 GLM-Zero-Preview「扫描」配料表,它能识别其中的科技与狠活吗,我们拿前几年爆火的饮料试了试,而该饮料也被调侃为「喝一口感觉是喝下整个元素周期表」。

它果然一一罗列出屏幕上的配料表,后续根据要求向我们展示了这些配料的作用。

大模型不擅长数学?国产 AI 已经 Next Level

推理模型 GLM-Zero 是 GLM 专注于增强 AI 推理能力的模型系列,擅长处理数理逻辑、代码和需要深度推理的复杂问题。

那让我们先来一个说简单也简单,说难也难的「国际象棋盘与麦粒」问题。

若在国际象棋盘上放置麦粒,第 1 个棋格放 1 粒,此后每一棋格放置的麦粒数是前一棋格的 2 倍,问放满棋盘上所有棋格需要多少麦粒?

经过一番思考,GLM-Zero-Preview 最终得出了正确答案,展现了其强大的计算能力。

此前苹果发布的一篇论文指出,大模型并未真正理解数学概念。一旦题目加上干扰条件,模型的准确率就会下降,我们也试了试。

从「打电话每分钟 10 分钱,打 60 分钟多少钱?」变成「打电话前 10 分钟每分钟 10 分钱,之后每分钟 8 分钱,如此打 60 分钟电话费多钱?」,GLM-Zero-Preview 依然能够准确回答,而且还贴心地将分钱转换成元,有点眼色。

面对更复杂的数学题,GLM-Zero-Preview 同样游刃有余。

先来一道高考数学真题热热身:

在等差数列 {an}{an} 中,a1=−9a1=−9,a5=−1a5=−1。记 Tn=a1+a2+…+anTn=a1+a2+…+an,则数列 {Tn}{Tn}( )。
A. 有最大项,有最小项
B. 有最大项,无最小项
C. 无最大项,有最小项
D. 无最大项,无最小项

GLM-Zero-Preview 选 C 绝不是「物以 C 为贵」,而是给出思考过程,循循诱导,甚至比一些 AI 学习机还要中用得多。

官方表示,在 2025 年考研数学一中,GLM-Zero 得分为 126,达到优秀研究生水平。


为了避免答案不出错,GLM-Zero-Preview 还会自动启用验证流程。

「机械厂加工车间有 85 名工人,平均每人每天加工大齿轮 16 个或小齿轮 10 个,已知 2 个大齿轮与 3 个小齿轮配成一套,问需分别安排多少名工人加工大、小齿轮,才能使每天加工的大小齿轮刚好配套?」

GLM-Zero 迅速给出了答案:「25 名工人加工大齿轮,60 名工人加工小齿轮」,做题水平一流。

哪怕再上一道 AMC 难题,它也能轻松拿捏。

「一个集合由 6 个( 不是不同的 )正整数组成:1 、 7 、 5 、 2 、 5 和 X 。6 个数字的平均值( 算术平均值 )等于集合中的一个值。X 的所有可能值之和是多少?」

这个问题涉及五大点,十几种情况,GLM-Zero-Preview 综合考虑了各种可能性,咔咔一顿输出,给我一种它真的有在模仿人类思考的感觉。

作为智谱首个基于扩展强化学习技术训练的推理模型,GLM-Zero-Preview 在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI o1-preview 相当。

此外,GLM-Zero-Preview 还能够熟练使用多种编程语言,帮助开发者快速编写代码;在代码调试方面,也能够快速识别错误,给出详细的修复建议。

例如,只需要输入指令「帮我用 html 写一个有趣的第一人称射击游戏」,GLM-Zero-Preview 便能迅速独立完成以下游戏。

智谱很快将会推出正式版 GLM-Zero,将深度思考的能力从数理逻辑扩展到更多更通用的技术,继续向 AGI 迈进。

当然,目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型还有不少的差距,但千里之行,始于足下,智谱说了,未来将持续优化迭代强化学习技术。

实际上,智谱等厂商全力押注推理模型,背后反映的是 GPT 时代正在过渡到推理 o 时代。

与以往基于 GPT 的模型不同,推理模型不是为了预测人类的想法而训练,而是通过训练「思维」构建自己的思维框架,通过严谨的推理过程得出结论。

推理时代的到来,标志着 AI 或许开始从「模仿」走向「思考」。

智谱推出的 GLM-Zero-Preview 同样是这一趋势的体现。

当你观察它解答问题时,你会发现它不是直接给出答案,而是展示出一个完整的推理过程 —— 提出假设、分析条件、推导结论,每一步深度思考都清晰可见。

未来,随着更多类似 o1 和 GLM-Zero-Preview 的模型涌现, AI 正在朝着与人类同等的认知水平迈出一大步,换言之,我们或许也正在见证一个重要的历史转折点——

智谱的愿景是「让机器像人一样思考」,当机器开始真正「思考」的时候,人类对智能的理解也将达到一个新的高度。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/oVwrFUX
via IFTTT

早报|爱范儿发布明日产品榜单/华为悬赏 300 万元求解难题/曝英伟达计划 2025 年发布新一代具身机器人芯片

cover

🎉

爱范儿发布明日产品榜单

🤖

英伟达计划 2025 年发布新一代具身机器人芯片

🚇

世界最长高速公路隧道全线贯通

💰

华为悬赏 300 万元求解难题

🚂

铁路 12306 试点推出「系统自动提交购票订单」功能

📈

豆包大模型披露 2024 技术进展

🔓

智元开源百万真机数据集

💼

剪映产品负责人离职

🚘

传特斯拉 Cybertruck 1 月在国内上市,官方辟谣

🚗

法拉第未来再交付一辆 FF 91

📺

逐际动力全尺寸人形技术 demo 发布

📢

天马 Micro-LED 产线全制程贯通

💡

影石创始人:在 AI 硬件上,手机厂商比互联网大厂更有优势

🎮

PixVerse V3.5 正式上线

🚀

REDMI Turbo 4 定档 1 月 2 日

🔍

支付宝推出新一代 AI 视觉搜索产品

🎮

Switch 2 有望于明年 3 月发售

重磅

爱范儿发布明日产品榜单

Tomorrow’s Product Award 是由数字潮牌爱范儿面向趋势消费者打造的年度榜单,旨在发掘过去一年最具标杆意义的「明日产品」。

榜单以「创新、改变、普惠」为核心评选标准,由爱范儿团队联合全球意见领袖,在消费电子、智能出行和人工智能三大前沿领域进行提名并评选,致敬推动行业进步与时代变革的杰出之作。

上榜产品名单👇🏻

英伟达计划 2025 年发布新一代具身机器人芯片

近日,据英国金融时报报道,英伟达计划将于 2025 年上半年推出最新一代人形机器人芯片 Jetson Thor。

报道称,英伟达将自己定位为「领先」的具身机器人芯片平台。英伟达将销售一种「全栈」式的解决方案,从用于训练具身机器人的软件层面到机器人内置的芯片均会一同提供。

英伟达机器人业务负责人兼副总裁 Deepu Talla 向媒体表示,物理 AI 领域和机器人领域的「ChatGPT」时代即将到来,并且他认为市场已经到了「转折点」时刻。

Talla 同时表示,目前爆发式增长的生成式 AI 以及通过模拟生成的环境,都将推动甚至突破机器人市场增长。Talla 还强调了模拟环境对机器人的训练将起到很关键的作用,有助于解决机器人学家所说的「模拟与真实的差距」。Talla 透露,过去 12 个月里,英伟达已经能够结合生成式 AI 去进行模拟实验。

据报道,英伟达目前正面临多家公司的 AI 芯片竞争,包含 AMD 等竞争对手和亚马逊、微软等云计算巨头,同时多家厂商都在减少对英伟达的依赖。据悉,今年 2 月,包括微软和 OpenAI 在内的几家公司均投资了具身机器人公司 Figure AI。

大公司

世界最长高速公路隧道全线贯通

12 月 30 日,据新华社消息,世界最长高速公路隧道—天山胜利隧道全线贯通。

据报道介绍,天山胜利隧道横穿天山中部,全长 22.13 公里,是新疆乌尉(乌鲁木齐至尉犁)高速公路的「咽喉」工程,也是目前世界最长高速公路隧道。天山山脉形成于距今千百万年前,历来是阻隔南北的屏障。隧道建成后,穿越天山仅需约 20 分钟,成为我国加快建设交通强国的重大标志性工程之一。

承担施工任务的中国交建乌尉高速六标段项目总工程师毛锦波介绍,隧道建设先后攻克「长」「多」「深」「高」等难点。

  • 「长」是指隧道单洞长约 22.13 公里,大概相当于 5 座南京长江大桥公路桥的总长;
  • 「多」指断裂带多,天山山脉有「地质博物馆」之称,整个隧道穿越 16 个地质断裂带;
  • 「深」是指隧道埋深和用以通风的竖井深度前所未见,其中二号竖井深 706 米,比北京「中国尊」还要高出上百米;
  • 「高」指高寒、高海拔、高地应力、高地震烈度和高环保要求。

此外,乌尉高速公路预计 2025 年全线建成通车,届时乌鲁木齐市到南疆库尔勒市的驾车时长将从 7 小时左右缩短到 3 个多小时。

华为悬赏 300 万元求解难题

近期,华为在官网发布公告,宣布面向全球启动 2024 奥林帕斯奖(OlympusMons Awards)悬红难题征集,这也是华为公司第五年举办该全球赛事。

根据官网显示,2024 奥林帕斯悬红难题为:

  • 每 bit 极致性价比的存储技术
  • 面向 AI 时代的新型数据底座

2024 年奥林帕斯奖华为共设置了 2 个奥林帕斯奖,5 个奥林帕斯先锋奖,获奖人/团队与华为将与建立技术交流渠道并获得科研助力。

铁路 12306 试点推出「系统自动提交购票订单」功能

12 月 30 日,中国铁路官方公众号发文,宣布铁路 12306( 含网站、手机客户端,下同)进一步优化购票信息预填服务,开设「购票信息预填优化试点」专区。

具体来说,在 2024 年 12 月 30 日至 2025 年 2 月 8 日期间,铁路 12306 将在北京市、天津市、上海市、江苏省、浙江省、广东省各车站往返四川省、重庆市各车站始发终到列车的长途区段车票发售中,试点推出「系统自动提交购票订单」功能。

旅客可预填购票信息并预支付票款,铁路 12306 将根据旅客设定自动为其提交订单,使购票更加便捷。

豆包大模型披露 2024 技术进展

昨日,字节豆包大模型对外披露 2024 全领域技术进展。

官方表示,截至 2024 年 12 月,最新版豆包通用模型 Doubao-pro-1215,综合能力较 5 月提升 32%,已全面对齐 GPT-4o,在数学、专业知识等部分复杂场景任务中,效果表现甚至更好。

另外,在图像与视频能力方面,团队于 9 月推出两款豆包视频生成模型 PixelDance 与 Seaweed,主打复杂提示词精准理解、镜头一致、多交互主体和镜头灵活控制。

而 12 月发布的豆包视觉理解模型 Doubao-vision,可融合视觉与语言多感官深度思考和创作,目前模型能力在十多个主流数据集上比肩 Gemini 2.0 与 GPT-4o。

同时,豆包大模型团队还与近 20 所高校深入合作,支持超过 40 位顶尖学者参与关键 AI 技术攻坚,并与清华 AIR、北大分别成立联合实验室。

智元开源百万真机数据集

12 月 30 日,智元机器人宣布携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,今天重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。

智元官方表示,AgiBot World 这一里程碑式的开源项目,标志着具身智能领域「ImageNet 时刻」已到来。

据官方介绍,AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比 Google 开源的 Open X-Embodiment 数据集,AgiBot World 长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量达到了工业级标准。并能让机器人从简单的桌面任务,走进人类日常生活的方方面面。

据悉,这是智元机器人本年度开源的第三个项目,亦是对智元 818 发布会承诺的完美兑现。智元将按计划在 HuggingFace、Github 以及 agibot-world项目主页上分批上传数据,加速人类迈向通用人工智能的新时代。

剪映产品负责人离职

近日,据智能涌现报道,剪映产品负责人张逍然目前已经离职。

据了解,张逍然是剪映前身业务「脸萌」的早期成员,随着脸萌被字节收购而加入字节。从 2021 年底开始,就负责剪映、醒图、CapCut 等等产品在内的整体产品和业务,伴随着这个业务从初创期走向高速发展期。2024 年初,原抖音 CEO 张楠宣布离开抖音,带队剪映及 CapCut 业务,张逍然则直接向张楠汇报。

剪映是字节跳动在 2019 年推出的视频剪辑产品,最初作为抖音的官方剪辑应用推出。2022 年开始,剪映内部早就开始了对文生图、AI 生成音乐等方向的研究和落地。目前,剪映产品中上线了多种多样的 AI 功能,包括数字人、AI 智能口播剪辑、文生图等等。

传特斯拉 Cybertruck 1 月在国内上市,官方辟谣

据每日经济新闻报道,近期有传言称特斯拉 Cybertruck 计划于 2025 年 1 月 1 日在国内正式开售。12 月 30 日,特斯拉中国方面回应:「假消息,1 月 1 日并没有这个计划。」

不过值得注意的是,特斯拉中国官网近期更新了 Cybertruck 产品信息。据官方信息显示,Cybertruck 国行版将推出三个版本:Cyberbeast 野兽版、全轮驱动版、后轮驱动版。

根据官网显示的信息来看,国行版 Cybertruck 尺寸为 2413.3mm(宽,展开后视镜状态)/ 5682.9mm(长)/ 1790.8mm(高),野兽版和全轮驱动版支持 250 kW 的超级充电峰值功率。另外,在后轮驱动版信息下方,显示「更多信息将于 2025 年提供」。

此外,特斯拉 Cybertruck 也将进入欧洲市场。

近期有一台悬挂阿尔巴尼亚车牌的 Cybertruck 在荷兰的公路上被拍,随后特斯拉首席 Cybertruck 工程师 Wes Morrill 转发并证实了 Cybertruck 目前已在欧洲注册。

特斯拉 CEO 马斯克曾在今年 6 月的年度股东大会上表示,公司或将在 2025 年,将 Cybertruck 推广到北美以外的市场,但 24 年内「肯定仅限于北美」。同时他还暗示,可能会推出专为欧洲和中国市场设计的 Cybertruck 「安全」版。

法拉第未来再交付一辆 FF 91

12 月 30 日,法拉第未来宣布,将在 2025 年 1 月中旬正式向知名企业家及洛杉矶华人社区领袖 Luke Hans 交付 FF 91 2.0 Futurist Alliance(FF 91 2.0 未来主义者联盟版)。

据官方介绍,此次交付的车型为 FF 91 2.0 未来主义者联盟版,全球首批 300 辆,但综合多方消息,此次交付将作为法拉第未来交付的第 15 辆 FF91。

同时,法拉第未来表示此次交付将在洛杉矶举行特别仪式,届时 FF 高管将一同出席。法拉第未来还表示,Luke Hans 作为 FF 开发者共创官,其将在支持 FF 业务发展、产品销售以及协作创新等方面发挥重要作用。

此外,12 月 23 日,法拉第未来创始人贾跃亭曾宣布,再获 3000 万美元融资,并于 2025 年 1 月初举办 FX 重大进展说明会及首批原型车私享会。同月,贾跃亭透露自身债务情况,表示已偿还 100 亿美元债务,再还七八亿美金就回国。

逐际动力全尺寸人形技术 demo 发布

12 月 30 日消息,逐际动力全尺寸人形机器人最新测试视频曝光。在视频中,逐际动力展示了一系列稳定、高动态的全身复杂动作。

官方表示,逐际动力全尺寸人形机器人整机架构工程化稳步提升,同时高力矩密度关节能够输出强大扭矩并实现高性能关节控制,全面提升运动控制算法的控制效果,让机器人以流畅、稳定的姿态完成复杂的全身运动。

天马 Micro-LED 产线全制程贯通

12 月 30 日,天马微电子宣布天马 Micro LED 产线在厦门成功实现全制程贯通。

据官方介绍,显示。本次全制程贯通仪式现场点亮的是天马自主研发生产的 PID 标准显示单元模块。最大特点在于可打破传统显示尺寸限制,实现无尺寸限制的无边框拼接显示。该标准模块以天马 LTPS 基玻璃背板为基础,利用天马 Micro-LED 产线自研的全激光巨量转移工艺。

据了解,天马自 2017 年开始布局 Micro-LED 技术,已发布高透明、无缝拼接、透明可调等的 Micro-LED 显示产品。

天马于 2022 年正式投建了全制程 Micro-LED 产线。该产线采用全激光制作流程,并配备了定制化全自动巨量转移及键合设备。超 30 款量产设备和材料为天马联合供应链上下游企业首次共同开发,实现以自主技术为核心的产线贯通。

影石创始人:在 AI 硬件上,手机厂商比互联网大厂更有优势

在近期举办的极客公园 IF 2025 创新大会上,影石 Insta360 创始人刘靖康谈及了他对于硬件、软件以及 AI 的看法。

在采访中,刘靖康表示,影石 Insta360 的产品今年更新的重点,在致力于怎么帮助客户自动裁剪和编辑。他表示,这一波 AI 能力在手机上能够运行,也在通过云的方式,通过 AI 大模型的能力,帮客户做更加精心的剪辑。

另外,他表示,在 AI +硬件方面,手机厂商比互联网大厂更有优势

他认为,靠公开的数据跟信息训练 AI 模型,可能就是互联网公司最擅长干的事情。但是如果要做一个服务好个人的 AI,它还需要个人的数据,今天互联网公司也不见得有很多个人的数据,而就算有个人的数据,但互联网公司没办法给用户的外卖下个单,没办法操作你手机上的东西,没办法访问你的手机日历,输出某个 action,从位置上来说,手机厂会更有优势。

新产品

PixVerse V3.5 正式上线

12 月 30 日,爱诗科技宣布 PixVerse V3.5 正式上线。

据官方介绍,在 PixVerse V3.5 Turbo 极速生成模式下,平均 10 秒即可生成视频,最快可达 5 秒,能够帮助创作者大幅提升 AI 视频创作效率。同时,模型的语义理解能力、运动稳定性和细节表现力均保持行业一流水准。

同时,PixVerse V3.5 具备领先的动漫生成能力,可以直接通过文生视频描述特定风格,生成对应的动漫效果;或上传各类动漫/动画图片,再输入提示词,创作精彩内容。并且,PixVerse V3.5 支持首尾帧生成,上传两张图片,描述变化过程,即可生成流畅的过渡视频。

目前,PixVerse V3.5 已上线官网。

REDMI Turbo 4 定档 1 月 2 日

12 月 30 日,REDMI 宣布 REDMI Turbo 4 定档,将于 1 月 2 日发布。

官方一同公布了 REDMI Turbo 4 的外观信息。新机将采用竖向双摄排列,摄像头 DECO 为金属材质,直角中框+纯平后盖设计,祥云白配色将采用「红色腰线」和「菱格双拼纹理」设计。值得关注的是,新机双摄 DECO 处配备了 RGB 「旋风双环灯带」。

据悉,新机将首发天玑 8400-Ultra 处理器,搭载 6.67 英寸 1.5K LTPS 直屏;配备后置 50MP+8MP 双摄,前置 20MP;电池容量为 6550mAh,支持 90W 有线充电。

支付宝推出新一代 AI 视觉搜索产品

12 月 30 日,支付宝推出新一代 AI 视觉搜索产品「探一下」。

据介绍,「探一下」基于自研的多模态大模型技术,可「用 AI 之眼探索万物」,提供更快速、有用、趣味的生成式搜索服务。

据悉,用户遇到感兴趣的事物,就能让 AI 通过摄像头,识别花草宠物和潮玩、查询商品药品详情等,还能趣味解读萌宠照、宝宝照等。目前该产品已上线支付宝,在首页点击「扫一扫」后左划即可使用,同时在支小宝 App 也能快速访问。

2024 年以来,支付宝接连发布「支小宝」等 AI 独立应用及智能体开发平台,此次聚焦 AI 视觉多模态赛道推出「探一下」,标志着以支付宝为核心的蚂蚁 AI 战略正持续提速。

Switch 2 有望于明年 3 月发售

据外媒 UAGNA 报道,近期有一位匿名的 Reddit 用户,在平台爆料称 Nintendo Switch 2 将解决 Joy-Con 一直以来存在的漂移问题。

此前, UAGNA 在与供应商沟通后,表示 Switch 2 有望于明年 3 月发售,同时他们还在报道中详细描述了 Switch 2 的部分配置。

Switch 2 可以提供 4K 30 fps 的画面质量,同时新的控制台支持 60W 功耗,另外控制台的后部支架也进行了改造。

新消费

鸿蒙原生版搜狗输入法上线

近期,鸿蒙原生版搜狗输入法应用已正式上线鸿蒙应用市场。

此次上线的鸿蒙原生版搜狗输入法,为用户提供了多样化的输入方式,包括拼音输入、手写输入和语音输入,满足了不同用户在各种场景下的输入需求。

在基本的输入功能外,鸿蒙原生版搜狗输入法还提供了丰富的emoji表情和颜文字,增加了聊天场景下的趣味性和生动性。

另外,用户可以轻松管理和使用剪贴板中的内容,提高效率,并且音效与振动功能也进一步提升了输入的手感和体验。

美团即将在全国上线骑手防疲劳机制

近日,据新浪科技获悉,美团骑手「防疲劳」机制已在全国主要城市范围内启动上线工作。

美团骑手收到的通知显示,跑单超过 8 小时会收到提醒,此后每隔一小时提醒一次;跑单 12 小时将强制下线。美团北京某站长表示,此次上线的防疲劳机制也会平衡考虑骑手当日的接单情况,美团项目组每周都在收集意见反馈,持续完善机制。

同时,根据此前美团披露的骑手「防疲劳试点」数据及调研结果,试点区域 99.82% 正常跑单的骑手不受影响,连续跑单触发休息条款的骑手仅占 0.18%,因此该举措有效保障了骑手休息权,防止极小部分极端案例。

据了解,美团最早在四川、广西、浙江等区域测试了防疲劳管理举措,在此基础上,从今年第二季度开始,美团在华东区域进行多次小范围试点与迭代。

CASETiFY 推出《鱿鱼游戏》合作系列

伴随着《鱿鱼游戏》第二季的上线,CASETiFY 在官方账号宣布推出合作系列。

CASETiFY 表示,此次合作系列采用全新设计,灵感源自新一季电视剧和 CASETiFY 第一批畅销产品。

目前,该联名系列已在 CASETiFY 官网开售。

好看的

《银翼杀手 2099》拍摄杀青

近日,《银翼杀手 2099》导演之一 Karena Evans 透露,「银翼杀手」的剧版续集《银翼杀手 2099》拍摄杀青。

该片讲述 2099 年的洛杉矶,擅用各种身份掩饰自己的科拉,一生都在躲藏逃亡。为了能给弟弟提供一个稳定的未来,她捏造了最后一种身份,不情愿地跟一位临近生命尽头的银翼杀手奥尔雯展开合作。两人卷入了一场愈演愈烈的阴谋当中,它使得这座为重生而战的城市陷入到存亡时刻。

《你的好邻居蜘蛛侠》正式预告

近日,《你的好邻居蜘蛛侠》发布预告,定档明年 1 月 29 日 Disney+ 开播。

从预告中看出,《你的好邻居蜘蛛侠》画风采用了复古漫画风格。剧情方面,据悉该片将探索漫威电影宇宙中「蜘蛛侠」彼得·帕克的起源故事,此前这些故事内容并没有展现在漫威电影宇宙系列电影之中。

《你的好邻居蜘蛛侠》由史蒂夫·迪特寇、斯坦·李编剧,哈德森·汤梅斯、凯瑞·华格伦、泽诺·罗宾逊等配音主演。

《莫莉的冒险》定档 1 月 18 日上映

12 月 30 日,电影莫莉的冒险官方微博宣布,该片将于 1 月 18 日上映。

电影由李念修、袁媛、囧叔编剧,张荣吉执导,陈思诺、蒋勤勤、王千源等主演的剧情电影。

该片于 2023 年 12 月 21 日在海南岛国际电影节上映 ,并于 2025 年 1 月 18 日上映。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/iTahDjr
via IFTTT