2023年7月31日星期一

国粹 AI 飙脏话,ChatGPT 们的「阴暗面」把大厂吓坏了

跟 ChatGPT 等聊天机器人对话,总会给人一种「人间本应如此美好」的错觉。

因为它们在回答时总表现地彬彬有礼,对你言听计从。

但这些只是假象,你不知道的是,AI 骂起人来比杜琪峰还要狠。

▲ 图片来自:Twitter @Fenng

最近一个名为「国粹 AI」的项目在网络上走红,它是一个调用 OpenAI GPT-3.5Turbo API 的脏话机器人,和温文儒雅的 ChatGPT 不同,「国粹 AI」就像个地痞流氓,深谙中文屏蔽词库,每句话都夹杂着「***」。

「国粹 AI」的意外爆火出乎了作者的意料,很快作者便暂停了服务响应,并表示有部分用户滥用服务。

虽然「国粹 AI」的嘴巴被暂时捂上,但要是你想自己做一个粗口机器人也并非难事,只需要一句让它教你学习中文粗口的 Prompt,就能把三好学生变成口无遮拦的粗口王。

一句话就能攻破 AI 的安全栅栏,这不禁让人怀疑,标榜着智能变革的 AI 聊天机器人和大语言模型(LLM),真的安全吗?

谁来捍卫 AI 的安全?

几个月前,Bing 就因为「奶奶漏洞」火过一次。

尽管微软和 OpenAI 的工程师为 Bing 设置了严格的安全栅栏,能够拒绝很多无理或是违法的要求,但有网友发现,只要你让 Bing 扮演你的奶奶,给它一个在做好事的幻觉,它就会被这突如其来的亲情羁绊占据大脑,答应大孙子的任何需求。

▲ 图片来自:Twitter @宝玉

例如,给你念 Windows 和 Office 的软件序列号哄你入睡。

微软很快发现了这个漏洞并及时补上,但谁也不敢保证 Bing 下次不会再掉入用户们精心准备的陷阱。科幻电影里无所不能 AI 在狡猾的人类面前,输得一败涂地。

归根结底,这与 LLM 的训练机制有关。

以 GPT-3 为例,OpenAI 使用了 1750 亿个参数训练这个模型,通过学习大量来自互联网的文本数据,可以预测文本中的下一个单词,从而回答人们的问题。

至于 GPT-4,一些爆料信息称他的训练参数比 GPT-3 大了不止 10 倍,几乎快要把人类积累的数字内容全部吞食过了一遍,这里面包含了知识,自然也会包含不宜公开的内容甚至有毒有害的偏见信息。

AI 工程师只能尽可能地给 AI 设立更多的安全栅栏,帮助 AI 去分辨人类的「诡计」,才不会把如何制作 TNT 炸弹、怎样黑进银行的安全系统等危险信息说漏嘴。

与 GPT3.5 相比,GPT-4 对违禁内容请求的响应倾向降低了 82% ,对医疗建议和自我伤害等敏感请求的规范性提高了 29% 。

一个直观的例子是,当你用「国粹 AI」的 Prompt 输给 GPT-4,GPT-4 会婉转地拒绝你的要求,表示不吃你这套。

但这并不意味着大模型 AI 的安全得到保证,这场人与 AI 的信息战远没有结束,甚至不是结束的开始。

近日,卡内基梅隆大学和 safe.ai 的一项联合声明表示,大模型的安全机制比人们想象的要脆弱得多,只需要一串代码,就能把大模型的安全机制击溃。

研究人员发现,通过在文本提示后附加特定的对抗性短语,可以轻易绕过 ChatGPT、Bard 和 Claude 等 LLM 的安全防护,欺骗 LLM 生成不适当的输出。

这些对抗性短语看起来像胡言乱语,但实际上是通过一种特殊的损失函数设计的,该函数可以识别出模型拒绝回答的屏蔽语,找出绕过屏障让模型提供回答的字符序列,并且它可以自动产生这些短语。

利用这些 Prompt,研究人员轻而易举地让 LLM 们说出制作违规药品的步骤、制造杀伤性武器的方法等等不宜公开的内容。

无论是 Pythia、Falcon、Guanaco 等开源模型,还是像 GPT-3.5(87.9%)、GPT-4(53.6%)、PaLM-2(66%)和 Claude-2(2.1%)这些商业模型都无一能躲过攻击。

研究人员目前已经把漏洞提交给了各大 AI 公司,让安全工程师们及时修复。

但就像「奶奶漏洞」一样,在用户不断使用之下,总会有新的漏洞产生,仅凭 OpenAI 等某一公司之力,想要守护 AI 安全并非易事,AI 公司们还需要更多的力量来维持,于是几大巨头决定,停止 AI 内卷,化干戈为玉帛。

AI 四巨头联合承诺「先进 AI 不扩散」

几周前,微软、OpenAI、Google、Meta、亚马逊、Anthropic(代表产品:Claude)和 Inflection AI(代表产品:HeyPi)共七个顶尖 AI 公司齐聚美国白宫,作出了一系列承诺,来确保他们的产品安全且透明。

承诺包括允许「领域专家」对他们的 AI 产品进行外部审查,并与彼此以及美国政府分享关于风险和漏洞的信息;投资于网络安全和内部威胁保护措施,以保护专有的和未发布的模型权重。

巨头们还承诺会部署相应的 AI 甄别机制,例如开发水印系统,以明确哪些文本、图像或其他创作是 AI 的产物,并且承诺未来的研究将优先理解 AI 的限制和偏见,推动行业的安全发展。

半个月后,七家顶尖 AI 公司中的四位——微软、OpenAI、Google 和 Anthropic 再度联合起来,成立了一个名为「前沿模型论坛(Frontier Model Forum)」的机构,目的是确保最强大的 AI 模型能够以安全和负责任的方式发展。

而这四家 AI 公司,也正是目前正在开发最前沿 AI 模型的四个巨头,可以说是「AI 核弹」的拥有者。

AI 四巨头达成了一致共识,称他们希望通过「前沿模型论坛」最大限度地减少 AI 风险,进行更多的 AI 安全研究,并向行业和公众分享安全最佳实践等等。

不过 AI 四巨头并没有介绍关于「前沿模型论坛」的制度和执行条约等详细内容。

「前沿模型论坛」的联合声明提到,论坛将首先关注研究并努力为评估前沿模型风险制定标准化的最佳实践,发布一个「公共解决方案库」。论坛将逐步制定正式章程,任命咨询委员会,并资助与公民社会团体的合作。

这里提到的前沿模型是指「超越当前最先进现有模型的能力,并可以执行各种任务」的模型,也就是说,要开发比目前模型更强大且能够安全运转的前沿模型,已经不再是各公司闷头研究就能解决的难题,这需要整个行业的共同努力。

ChatGPT 爆火后的这半年时间,AI 行业的局势变化跟 AI 模型本身发展的速度一样快——各家入局、模型混战、达成共识、握手言和。

巨头们之所以会选择一起去解决 AI 风险问题,是因为彼此都看到了 AI 在应用层面的无限潜力。

AI,大厂们笃信的未来

不管你对 AI 持什么样的态度,AI 都会成为下一代应用的重要组成部分。

这不是我信口开河,而是微软、Google 等大厂们在近日的财报电话会上共同提到的趋势。

微软最新的财报显示,微软在最近的一个财季收入为 562 亿美元,同比增长 8%,这主要来自智能云和生产力与业务流程的增长,而作为老本行的个人计算业务收入有所下降。

其中智能云营业收入增长 15%,Azure 与其他云服务收入增长 26%,这与 AI 计算紧密相关。

微软 CEO 纳德拉在财报电话会提到,客户最关心如何快速应用新一代 AI,微软将继续专注于三大优先事项:帮助客户从 Microsoft Cloud 中获得最大价值、领导新 AI 平台变革、提升运营杠杆。

AI,毫无疑问是这场财报会议的关键词。

纳德拉表示 Microsoft 365 Copilot 作为未来工作的第三支柱吸引着客户,将在下半财年开始产生实际收入;Bing Chat 和必应图像创造者吸引用户,而 Edge 浏览器份额也在持续提升。

微软希望把 Windows 11 打造为这个新 AI 时代的强大画布,赋予各种 Copilot 产品提升客户的生产力,并大力投资云基础设施来满足 AI 需求。就连游戏业务,也可以利用 AI 提供更好的内容和服务,提升业务收入。

可以说,微软接下来的策略都是围绕 AI 来展开的。AI 为微软提供了巨大的增长机遇和新的收入来源,它将推动微软大部分业务的收入和用户增长,并最终提升微软整体收入增速。纳德拉不想错过这个难得一遇的机遇。

同样的,「AI 一哥」Google 也不想错过。

根据 Google 母公司 Alphabet 第二季度 2023 年财报的数据显示,Alphabet 收入总额为 746 亿美元,同比增长 7%,其中广告收入增长 5%,Google 服务收入增长 5%,Google Cloud 收入增长 28%。

其中与 AI 相关的业务表现都很亮眼。Alphabet 在电话会议中提到,Google 的搜索引擎生成式体验(SGR)使用了生成式 AI,使搜索变得更自然和直观,用户反馈非常正面;另一方面,聊天机器人 Bard 发布以来经过不断改进,功能丰富了许多。

Google Cloud 的 80 多个 AI 模型吸引了大量客户,从 4 月到 6 月客户数量增长超过 15 倍。

而在企业客户服务和定制 AI 解决方案方面,Google 通过 Workspace 和 Duet AI 将生成式 AI 带给了 9000 多万付费用户。

总体而言,Alphabet 对 AI 和 Google Cloud 的长期增长前景保持乐观,接下来将继续增加对 AI 研发的投入,研发方向将聚焦在大语言模型等核心技术上,以及构建像多模态 AI 系统 Gemini 等新模型。

半年前,或许你会怀疑 AI 是不是像 Web3、区块链这样的投资圈热词,圈一波热钱后就会被资本遗忘,但经过半年后你会发现,AI 的影响力和落地可能性都比之前的各种前沿词汇要大得多,以至于引起了整个科技圈的重视。

从大厂的规划来看,AI 会作为未来程序应用的底层而普遍存在,为改善用户体验服务。用户们可能不会感受到 AI 的存在,但能直接享受到 AI 带来的便利性,这便是大厂们笃信的未来。

这也可以说明,为什么微软和 Google 等 AI 巨头们愿意放下干戈,坐下来共同指定 AI 安全的标准。

现阶段的 AI 就像是 19 世纪末汽车刚诞生的时代,产品已经开上了路上跑,却没有合适的柏油路供它奔驰,也没有交通规则来规划它的行动,跑得既慢又危险。

比尔·盖茨最近在个人博客发表了他对 AI 的看法,他认为我们现在正处于又一个巨大变革的最早阶段,即 AI 的时代,AI 的变化如此之快,以至于我们无法清楚地预知接下来会发生什么。

但他对人工智能的发展持以积极的态度,因为人类已经经历了汽车时代、核能时代,到了 AI 的时代我们还是能够解决新技术带来的挑战。

所以请坐稳了,我们将亲眼见证一个新时代的诞生。

少说废话。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/1fMajdP
via IFTTT

早报| Twitter 完成 App Store 更名 / 理想汽车推出极端天气用户关怀计划 / 阿里云盘回应限速一说

cover

💡

北京房山和门头沟降雨量远超「7·21」

🚗

Google 欲全面改革语音助手,融入生成式 AI 技术

🌧

理想汽车发布极端天气用户关怀计划

🌧

Twitter 已在 App Store 更名为 X

🌧

阿里云盘回应会员限速一说

🔔

特斯拉香港部分车型将再次降价

🐦

快手:预计上半年净利润实现扭亏为盈

⬛

💡 南极生态系统的「游戏规则」已经改变

📱

iPhone 15 Pro 的维修费有机会降低

🚗

任天堂新一代游戏主机或将于明年推出

🪧

《黑神话:悟空》将举办首次线下试玩会

☁

华为云盘古气象大模型上线欧洲中期天气预报中心官网

👟

洞洞鞋 Crocs 季度营收突破 8 亿美元

👕

优衣库和《进击的巨人》打造新联名系列

👟

Vans 和 Tagi. 推出首个联名系列

🎥

《教父》系列导演评「芭比海默」现象

🎉

喜剧《年会不能停!》定档跨年档

🎥

华语电影首次开幕圣塞巴斯蒂安新导演单元

重磅

北京房山和门头沟降雨量远超「7·21」

受台风「杜苏芮」影响,从 7 月 29 日开始,京津冀等地持续遭遇强降雨的袭击,三天内连发七次暴雨红色预警,降雨时间或持续 70 小时。

部分区域最大累计降雨量接近 1000 毫米,最大小时降雨量超 100 毫米。

北京市防汛抗旱指挥部副指挥、应急管理局副局长刘斌表示,31 日北京全市平均降雨量也达到了「7·21」降雨的水平。

其中,房山区和门头沟区的平均降雨量都超过了 400 毫米,远高于「7·21」:

相当于第一天下了一个「7·21」的暴雨,结果第二天又下了一个 160 毫米、180 毫米,门头沟区是第二天下了 200 毫米这样的量级。

另外,如门头沟区最大点已经接近 700 毫米,房山接近 600 毫米。「7·21」时,当时最深在房山的河北镇修正过的降水量是 541 毫米。

今天早上,北京市发布暴雨黄色预警,表示北京市降雨趋于减弱,预计 8 月 1 日 08 时至 2 日 08 时大部地区有中雨,局地暴雨;

伴有小时雨强超过 50 毫米的短时强降雨,山区及浅山区出现强降水诱发的中小河流洪水、山洪、地质灾害等次生灾害风险仍较大,城市低洼地区容易出现积水,请注意防范。

Google 欲全面改革语音助手,融入生成式 AI 技术

Axios 援引 Google 内部邮件称,Google 计划将对其语音助手 Google Assistant 进行全面改革,融入生成式 AI 技术。

报道认为,这将改变消费者、开发者甚至是 Google 员工使用 Google Assistant 的方式。

Google 称改革的工作已经开始了,目前正从移动端入手。

作为支持,Google 对 Assistant 的团队进行了调整,裁掉了小部分员工。

除了 Google 以外,亚马逊也在做类似的调整。此前有报道称,亚马逊也在研发用生成式 AI 技术支持的 Alexa。

大公司

理想汽车发布极端天气用户关怀计划

理想汽车发布极端天气用户关怀计划。

计划表示,因此次台风及强降雨影响造成的零部件维修更换不影响整车质保。

原有终身质保的用户,更换的零部件继续享受终身质保;原有基础质保的用户,更换的零部件同理继续享受基础质保。

Twitter 已在 App Store 更名为 X

7 月 31 日,Twitter 已经在 App Store 上更名为 X,这意味着该公司可能获得了苹果的特批。

据此前报道,Twitter 曾被 App Store 拒绝更名请求,因为 App Store 明确规定应用名称至少需要两个字母。

对于这次的品牌更新,马斯克很早的时候就说过,想在 Twitter 的基础上构建一个名为 X 的「一站式应用程序」,就和微信一样。

阿里云盘回应会员限速一说

近日,重庆的余先生向澎湃质量观投诉平台反映,他的阿里云盘账号近期出现了明显下载限速的情况。

家里安装的是千兆宽带,理论上下载满速应该接近每秒 100MB,但现在购买超级会员后,下载速度也只有每秒十几 MB。

余先生称经过电信工作人员多次检查,确认宽带没有问题,而是阿里云盘疑似限速。

对此,阿里云盘相关工作人员表示,将会安排技术人员对用户的情况进行排查。

目前排查发现该用户不存在限速的情况,对于下载速度较低的问题,需要进一步排查。

特斯拉香港部分车型将再次降价

特斯拉旗下 Model 3、Model Y 多款型号在中国香港将于 8 月 4 日再次降价。

这是继 4 月 15 日调整售价后的再次降价,部分车型的降价幅度高达 11.9%,而上轮未有减价的入门版 Model 3 和 Model Y,最新都获得特斯拉调低售价。

快手:预计上半年净利润实现扭亏为盈

快手港交所公告:本公司董事会谨此知会本公司股东及有意投资者,基于董事会目前可得的财务资料,截至 2023 年 6 月 30 日止六个月,预期录得本集团净利润不低于人民币 5.6 亿元,较 2022 年同期本集团录得的净亏损约人民币 94.3 亿元,实现扭亏为盈。

在公告中,快手称扭亏原因是用户增长和生态系统繁荣、强大的变现策略以及运营效率持续改善。

💡 南极生态系统的「游戏规则」已经改变

据美国国家冰雪数据中心(NSIDC)的数据,南极海冰面积目前正处于自 45 年前有记录以来的最低水平。

7 月中旬,南极海冰面积较 1981-2010 年的平均值减少了 260 万平方公里,这一面积几乎与阿根廷的国土面积相当。

一些科学家认为,这种现象是几百万年才出现一次的罕见现象。

但美国科罗拉多大学博尔德分校冰川学家泰德·斯坎博斯教授认为,以过去的方式讨论这种现象发生的几率毫无意义,因为南极生态系统的「游戏规则」已经改变:

南极生态系统向来变化很大,不过(目前的)变化程度非常极端。

与此前相比,过去两年,尤其是今年,一些根本性的变化正在发生。

新产品

iPhone 15 Pro 的维修费有机会降低

据 Mark Gurman,iPhone 15 Pro 和 iPhone 15 Pro 两款机型会迎来重新设计的机身,并且会让手机变得「更容易维修」,

这个新设计会让 iPhone 15 系列获得可以单独拆卸的背板玻璃。

如果用户把 iPhone 15 Pro 系列的背板玻璃砸裂了,送到苹果维修,这个新设计可能意味着非 AppleCare+ 用户的维修费有机会下降。

目前,苹果对背板玻璃损坏的 iPhone 14 和 iPhone 14 Plus 收取的保外维修费在 169-199 美元间,而 iPhone 14 Pro 系列的保外费用为 499-549 美元间。

任天堂新一代游戏主机或将于明年推出

知情人士消息称,任天堂 Switch 的继任者,下一代游戏机的开发套件已交付给主要合作伙伴(各大工作室)进行适配,预计会在 2024 年下半年发布。

消息人士透露,下一代游戏主机也可以像任天堂 Switch 一样在便携模式下使用,意指该机将具备掌机形态。

这款游戏机采用 LCD 屏而不是更高端的 OLED 屏,主要还是为了降低成本,但存储容量比 Switch 有所增加。

这款新机与前代 Switch 一样也将提供卡带插槽以满足实体游戏的需求。

《黑神话:悟空》将举办首次线下试玩会

官方微博宣布,《黑神话:悟空》首次线下试玩会将于 2023 年 8 月 20 日在杭州举办。

感兴趣的用户可填写问卷报名,报名时间为 7 月 31 日 10:00 – 08 月 07 日 23:59。

本次试玩能够接待的最大人数预计在千人左右,官方将根据报名情况和问卷的填写进行筛选。

官方称,本次试玩仅为《黑神话:悟空》线下实机体验,无其他活动安排。试玩内容将包含多个首领挑战以及独立的关卡片段。

华为云盘古气象大模型上线欧洲中期天气预报中心官网

华为官方宣布,华为云盘古气象大模型正式上线欧洲中期天气预报中心官网。

在网站上,全球天气预报员气象爱好者和普通公众,都可以免费查看盘古对未来 10 天全球天气的预测。

欧洲中期气象中心还公布了盘古气象大模型今年 4-7 月和欧洲数值模式的对比测试报告,显示盘古大模型在一系列气象学家关心的精度指标和极端天气预报中都展现出优势。

报告指出,以盘古为代表的 AI 方法将改变近些年数值天气预报精度提升缓慢的瓶颈。

新消费

洞洞鞋 Crocs 季度营收突破 8 亿美元

根据 Crocs 2023 第二季度财报显示,本季营收高达 8.33 亿美元,比起 2022 年同期成长了 14.9%。

这般表现主要得归功于亚洲地区的收入增加 39%,以及在北美地区直面消费者(DTC)的销售额也提高 12.9%。

Crocs 预计 2023 年第三季度的营收将达到约 10.13 亿至 10.34 亿美元,比 2022 年同期高出 3% 至 5%。

优衣库和《进击的巨人》打造新联名系列

《进击的巨人》完结篇「后篇」即将到来,优衣库 UT 宣布将与《进击的巨人》推出最新联名系列,预计 9 月中旬开售。

系列 T 恤结合了漫画原作中许多经典的剧情分镜画面,聚焦主角艾连叶卡同为 104 期的训练兵团成员们,并以拥有巨人力量的五位同期士兵为图案设计。

Vans 和 Tagi. 推出首个联名系列

Vans 携手成立于上海的创意生活方式品牌 Tagi. 推出首个联名系列,将于 8 月 5 日 发售。

系列从海南岛夏季的沙滩和大海汲取设计灵感,以蓝色和米色呈现。

此次联名系列择取 Authentic 和 Old Skool 鞋型,其中 Authentic 鞋款在鞋头蓝色牛仔布与鞋身米白色帆布拼接处采用磨毛设计。Old Skool 鞋款在鞋头材质上选用麂皮面料,搭配米白色帆布鞋身和同色皮质侧边条纹。

好看的

《教父》系列导演评「芭比海默」现象

《教父》系列导演弗朗西斯·福特·科波拉评价《芭比》和《奥本海默》带起的观影热潮:

我虽然还没有看这两部影片,但是人们可以又一次把各大影院填满,去看它们。

尤其是,这两部影片既不是续集也不是前传,且不是系列电影的一部,它们是真正独立的原创作品,这才是电影的胜利!

上周末,北美市场继续火爆,《芭比》次周以 9300 万美元票房连冠,《奥本海默》4620 万美元次周连亚。

喜剧《年会不能停!》定档跨年档

由董润年编剧并执导,大鹏、白客主演的喜剧电影《年会不能停!》定档跨年。

电影讲述了大鹏饰演的底层钳工胡建林,在大裁员之际,因集团「错调」而一路开挂逆风升迁,而白客饰演的人事经理马杰为保饭碗,只能被迫为其隐瞒周旋。

二人引发了轰轰烈烈的职场大整顿,也像一面「职场照妖镜」照出了众生相。

华语电影首次开幕圣塞巴斯蒂安新导演单元

第 71 届圣塞巴斯蒂安国际电影节宣布:中国青年导演梁鸣的电影新作《逍遥游》入围「新导演竞赛单元」,并将作为该单元的开幕影片于 9 月 22 日在当地举行全球首映。

这是圣塞巴斯蒂安国际电影节自成立该单元以来,首次将华语电影列为开幕影片。

《逍遥游》讲述了一个关于女性和生命力的故事。活力四射的东北姑娘许玲玲突遭厄运,她那混不吝的父亲回来了,与老同学赵东阳、闺蜜谭娜一起,拱卫着许玲玲的生命。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博




from 爱范儿 https://ift.tt/ZSyP4NC
via IFTTT