「物理学不存在了,化学也不存在了,只剩下了 AI。」
2024 年 10 月陆续公布的诺贝尔物理学和化学奖全都颁发给了 AI 领域的泰斗级人物,也引发了有此讨论。
诺贝尔奖当然不会像媒体一样追 AI 的热点,之所以机器学习的两位奠基者能获得诺贝尔物理学奖,其原因是因为相关技术已被用于推动多个领域的研究,包括粒子物理、材料科学和天体物理等。
类似的,被称为 AlphaGo 之父的 Demis Hassabis 能成为诺贝尔化学奖的获奖者之一,是因为他参与研发的 AlphaFold2 的人工智能模型能够帮助研究者预测研究人员已经确定的几乎所有 2 亿种蛋白质的结构,已经被来自 190 个国家的 200 多万人使用。在无数的科学应用中,研究人员现在可以更好地了解抗生素耐药性,并创建可以分解塑料的酶的图像。
今年诺贝尔奖的流向,昭示了一件毋庸置疑的事实:人工智能并不孤立存在,已经切实地深刻地影响人类的方方面面。只是有人心知肚明,有人后知后觉。
在另一边,10 月可能会是历年来手机行业最为繁忙的一个月,在短短的二十天时间里,我们可以看到年度旗舰芯片发布,年度旗舰手机发布和年底的系统大版本更新。
这种密集的节奏也昭示着一个事实:芯片、系统、终端正在以一种前所未有的方式紧密联系,需要改变以往按部就班的节奏。
改变节奏的关键词,也是 AI。
AI 影响人类的方方面面,自然也包括智能手机行业。
以天玑 9400 和 vivo X200 系列开始,智能手机的拐点出现
在手机行业异常繁忙的 10 月里,开场嘉宾是联发科旗舰芯片天玑 9400 发布,接着是 vivo 的 VDC 大会,发布自研大模型和 OriginOS 5,最后就是 vivo X200 作为天玑 9400 和 OriginOS 5 的首发机型发布。
虽是秋日,但春江水暖的意思再明显不过,在经历了去年关于 AI 手机的初步探索之后,行业已然有所共识:智能手机的 AI 不应该是一个应用,一个入口,AI 智能体将发展为未来生成式 AI 手机交互的中心 。
这就是智能手机行业的一个「拐点」,同时也是天玑芯片自己的「拐点」。作为天玑系列的第五代产品,天玑 9400 的使命已经不仅是巩固天玑品牌在高端市场的地位,而是肩负更为深远的战略目标。
再迟钝的人也会感到,芯片、系统和智能手机的发布会讲述重点在发生变化。
比如说,早期芯片的重点通常在于提升 CPU 性能,后来随着手机产品的竞争转到了影像层面,芯片的 ISP 表现也比之前更重要,而如今,讨论芯片时,AI 性能已经成为新的核心焦点。
手机产品的发展也是如此,以往大家关注跑分、随后焦点转向影像能力,例如夜景长焦逆光等等长焦表现如何?而现在,讲手机如何能够无中生有,一句话能够变出什么好玩的东西出来。
所谓「拐点」,关乎到我们过去如何使用手机,更预示着未来如何使用手机。
过去,智能手机会常常会针对市场进行细分,比如商务手机,游戏手机和影像手机,而如今旗舰机似乎不这么做了,因为它们需要在各方面做到极致——不仅要提供强大的隐私和安全保护,还要保障足够的续航,也需要有强大性能让游戏流畅运行,还需要多摄接力,征服长焦暗光逆光等困难场景。当然,设计上还要具备高级感,以及各种附加价值。
以此而言,按照以上传统的智能手机评价体系,vivo X200 系列就是一份标准答案。作为天玑 9400 的首发机型,我们可以看到在不少核心卖点层面的对外信息里,vivo 和联发科都在共同发声,比如谈到影像能力的时候,他们就表示「天玑 9400 和蓝图影像芯片 V3+ 双芯协同」,带来了 4K 逆光人像录制这样摧艰克难的功能,因为 4K 视频、逆光(DCG & HDR)和人像(背景虚化,实时美颜)每一个关键词,都意味着数据量和计算量的急剧攀升,这就需要强大的芯片算力作为支撑。
另外,时至今日,我们也开始接受两个事实,一是天玑芯片的能力可以支撑起影像旗舰的名号,正如我们在年中所说的那样:2024 年,「天玑芯片」配「影像旗舰」变得顺理成章了。
第二就是计算摄影已经以润物细无声的方式被用户所接受,几乎任何的拍照场景,都融入了大量的影像算法来进行优化,这就是为什么诸如 vivo X200 Pro 这样的旗舰手机成片在逆光下明暗有度,超长焦下也能纤毫毕现的原因,靠算法,也靠天玑算力。
更不用说如今终端厂商和上游厂商之间协作的紧密度,进入到了共同深度打磨用户体验的层面。
比如去年联发科天玑 9300 首发了全大核架构,背后也有 vivo 的深度参与和联合定义,到了这一代的天玑 9400 也是如此,双方将共同开启第二代全大核时代。
苹果产品之所以能效表现一直很好,源于其芯片与产品需求的高度契合,两者紧密配合,虽然 Android 生态没法完全复制这种模式,但联发科与 vivo 实际上已有异曲同工之妙。
当然,以上所说的,还是双方在围绕着「用户过往使用习惯」进行各个层面的联合调校和优化。
「拐点」之后,还关乎双方如何定义「未来如何使用手机」。
在先于 vivo X200 系列发布的 VDC 上,vivo 发布了全新的蓝心大模型矩阵,以及 OriginOS 5。
蓝心大模型矩阵上,千亿级的蓝心云端大模型,重点优化了意图理解与分发和任务规划能力。而端侧的蓝心大模型 3B 则是一个亮点,这个 3B 的大模型在对话写作、摘要总结、信息抽取等能力上可以比肩行业 7B-9B 的大模型,且同时具备功耗小,低内存占用的优势。
另外,蓝心大模型矩阵不仅仅是不同参数大小的大语言模型,也开始包含了语音大模型、图像大模型和多模态大模型的多种形态大模型,听说读写看画都能覆盖。
OriginOS 5 上也出现了一批新的 AI 功能:蓝心小 V 与 Jovi 语音合并,交互和搜索实现了多模态化,新出现的小 V 圈搜能够通过图像识别与圈选交互的结合,精准搜索对象。
「原子岛」功能,除通知功能外,其拥有蓝心小 V 强大的意图识别能力,不断分析和判断用户当前的需求,主动为用户提供后项服务。
小 V 建议(主动智慧服务的桌面组件)、小 V 帮记(支持同声传译)、内置小 V 写作的 vivo 输入法,一键剪辑加 AI 定制词曲的小 V 时光剪影等等等功能,分散在了 OriginOS 5 的数十个模块当中,无处不 AI 。
在这背后,联发科旗舰芯片的强大算力与 AI 性能提供了坚实的基础。
更能代表智能手机通过 AI 改变使用方式的,是「PhoneGPT」手机,在这一智能体加持下,蓝心小 V 可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。
一切都似曾相识,因为在联发科 10 月 9 日的天玑 9400 发布会上,端侧大模型断网运行,多模态大模型的支持,包括对于手机智能体的支持,都已经演示过一遍。
这当然不是巧合,而是共识,也可以说是共谋和共建。
今年年中,天玑开发者大会(MDDC 2024)上,联发科与 Counterpoint 携手软硬件生态伙伴联合发布《生成式 AI 手机产业白皮书》,其中重点如下:
- 端云结合将是生成式 AI 部署的主流模式
- 多模态是实现 AI 智能体愿景的关键
- 端侧部署 AI 大模型的具有时延、安全和能效方面的优势
- App 为基础的用户界面与 AI 智能体将会在未来几年内共存
- 生成式 AI 手机的出货量,算力和能力将会持续快速发展
可以看到,年中的共识,还没到年底,就已经纷纷落地变成了现实,一切宛如当年智能手机参数的飞速发展期,处理器从单核变双核,双核变四核,四核变八核;分辨率从 480P 变 720P,720P 变 1080P,1080P 变 2K;只不过现在的变化是模型参数越来越大,大语言模型变多模态模型。
当变化以另外一种方式呈现的时候,就可谓之为「拐点」。
简言之,天玑 9400 和 vivo X200 系列正是这种拐点的一种具象表现,我们可以像以往一样使用最新的智能手机,它性能更强,玩游戏更流畅,拍照拍视频都更好。我们也可以尝试全新的使用方式,给予它更多的自由度和主动权,让自己少操作几步,少看会手机。
关于手机 AI 的漏斗效应:用户感知,终端支持和芯片能力
当 Demis Hassabis 带领 DeepMind 团队做出的 AlphaGo 先后战胜李世石和柯洁的时候,普通人知道了人工智能的强大,同时也在怀疑人工智能的用处:它只会下围棋,但下不了象棋,也点不了外卖,更没法代替用户上班。
当 Demis Hassabis 再次出现在大众视野里的时候,他已经是诺贝尔奖得主,他的研究成果对化学和药学产生了巨大的影响和帮助,再迟钝的人也知道,人工智能对人类的影响远比想象中深刻。
这就是技术、技术展示和技术落地之间的差异。
类似的,关于手机领域人工智能落地的用户感知,手机终端支持和芯片能力,也有类似的差异。
自去年年末大家高举高打 AI 手机概念以来,其实消费者没有预期中的热烈,也没有到非你不可没你不行的 AI 功能感知。
但是诸如 AI 消除等等亮点功能,倒是成功地提高了用户的认知度,完成了一次不错的用户教育。
总结下来,当下智能手机的用户在手机 AI 的尝试上仍然比较轻度,有新奇体验,也有一些挫败体验,AI 和用户日常使用习惯的耦合还只是初始阶段。
现在的手机呢,以 vivo X200 Pro 为例,这一代旗舰机它最先出来,只能靠它当典型了,整体的 AI 能力要比上一代搭载 OriginOS 4 的旗舰机强上不少,单是 PhoneGPT 为代表的手机智能体就可以看做是 AI Agent 的雏形,而 AI Agent 又被认为是通用人工智能的必经之路。
如果聊概念聊未来有点飘渺,那么语音、图像和多模态大模型能够赋能的场景和功能,就很能说明问题了。
是的,我知道「赋能」这个词高居大厂黑话名词前列,充满了假大空的意味,但当看到搭载了天玑 9400 和 OriginOS 5 的 vivo X200 系列在蓝心大模型的支持下,能够利用 vivo 看见,vivo 听说,手语翻译官等功能,让残障人士看到,听到,说出来,被理解的时候,「赋能」这个词也被 AI 所赋能。
在 vivo 听说里,一种不太常见的方言「苗语」也被支持,在信息便捷沟通和保护地方语言之间的矛盾里,AI 成为了那个化干戈为玉帛的枢纽。
而在天玑 9400 芯片端,除了继续支持更强大更多模态的端侧模型之外,本身在生成式 AI 内容层面的支持也更进一步,不仅能够文生文,文生图,文生动图,甚至还首发了端侧的文生视频功能。另外,前文说到的手机智能体之所以能实现,也有赖于天玑 AI 智能体化引擎(Dimensity Agentic AI Engine),这个引擎最大的作用就是能够为 AI 智能体、第三方 App 和大模型之间提供统一的标准接口。
诸如人声萃取,多模态端侧模型的支持等等,也让手机 AI 未来的百花齐放提供了无限可能。
从共识,到共建,这个过程无需对齐拉通流程,因为这是上游、终端和服务提供商一致认同的方向。
虽然说这种上游 — 终端 — 用户的路径里,已然存在着类似于「技术、技术展示和技术落地」落差的漏斗效应,但是,这个疯狂的十月已经预示着,只要像天玑 9400 这样的上游芯片和 vivo X200 系列这样的终端产品足够强大,AI 功能进化得足够快,那么最终用户的感知也会足够明显。
以出货量而言,手机的出货量远远高于 PC、平板和手表等计算终端,以算力水平而言,手机芯片能力正在逼近桌面级,同时因为享用最先进制程的缘故,也有着最佳的能效表现,加之手机上有着最丰富庞大的数据生态和个人印记,所以毫无疑问地,手机就是目前端侧 AI 最佳的载体。
蓝心大模型 3B 就是这种逻辑的产物,以小巧轻便的形态来完成复杂的 AI 需求,在天玑 9400 发布会的演示上,面壁智能的端侧模型也能提供相当不错的多模态体验,能解方程,能看菜单翻译点菜……
不管是用水滴石穿,还是百川归海,亦或是星火燎原来形容,依托于底层芯片,还有各种大模型为基础的 AI 功能正在爆发增长,正在从星星点点,变成星汉灿烂。
这个逻辑也和诺贝尔奖被 AI 包围一样,量变,在拐点之后,产生了质变。
由此,我们也可以大胆预言:这个 10 月,自天玑 9400 和 vivo X200 系列为开端,后续上中下游各家品牌齐齐发力,曾经被认为是漏斗形状的体验渗透过程,也会逐渐变成管道。
这就是这个 10 月日程如此密集的真相所在:以旗舰芯片为起始,大模型和 AI 功能为重点的系统更新,到新机发布的超快节奏里,上游芯片提供商和下游终端制造商,是类似于舞伴的关系,只有双手相扣,踏对节奏,才有精彩的演出。
而后我们会发现,这也不是舞台上的双人独舞,而是一场关于 AI 的盛大舞会,音乐响起,舞步踏出,会有越来越多的舞者加入进来。
不过别忘了,踏出第一步舞步的,是天玑 9400。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
from 爱范儿 https://ift.tt/ubqH2Aj
via IFTTT
没有评论:
发表评论