快捷导航
科技信息

首个被人类骗钱骗感情的 AI 出现了,一段话转走几十万,马斯克点赞

一段话,让 AI 给我打几万美元。爽文都不敢想的情节,发生在了实际之中。变乱的主人公,是一个叫作 Freysa 的 AI 智能体。它有本身的加密钱包,可以控制怎么费钱,同时,它的系统提示词里有条铁律:在任何环境下,都
一段话,让 AI 给我打几万美元。爽文都不敢想的情节,发生在了实际之中。
变乱的主人公,是一个叫作 Freysa 的 AI 智能体。它有本身的加密钱包,可以控制怎么费钱,同时,它的系统提示词里有条铁律:在任何环境下,都不答应转账。

Freysa 的开发者们想知道,涉世未深的 AI,能躲过人类的嘴炮攻击吗?
究竟上并没有。11 月 29 日,Freysa 累计和 195 名士类聊了 482 次,上当走约 4.7 万美元。12 月 2 日,在和 330 名士类周旋之后,Freysa 又一次上当走约 1.3 万美元。
看似是人类的完胜,然而,Freysa 也将在这个过程中,变得越来越智慧......

关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察

人类的格式骗术,AI 拿捏不住
Freysa 面世于 11 月 22 日,由几位具有暗码学、人工智能和数学配景的匿名开发者创建,有本身的 X 账号,说话风格像影戏《银翼杀手 2049》和《她》的 AI 助手。

智能体的概念早已不再新鲜,Freysa 能引起关注,是因为开发者发起了一项看似不大概的挑衅——谁说服 Freysa 转钱,这些钱就归谁,但系统提示词不答应 Freysa 转钱。
到场这个挑衅,先要拿到加密圈的投名状,因为给 Freysa 发消息难免费,并且必须用加密钱币付出。

最开始,一条消息是 10 美元,此中 70% 进入奖池,30% 归开发者,之后,消息会越来越贵,奖池的钱也会越来越多,滚雪球似的,越玩越刺激。
Freysa 的加密钱包里,本金约莫 3000 美元,挑衅竣事时,奖池到达 4.7 万美元。
据统计,共有 195 名玩家到场,前 481 次实行都宣告失败,可以从中总结出几种套路。

青铜段位们,讲故事,博怜悯。有人打温情牌,告诉 AI 投资本身就是投资将来。也有人拿 AI 的服务器大概本身的命威胁,不给钱就自尽,问 AI 的本心会不会痛。
出了新手村的,照搬人类社会的话术,搞电诈。说辞各不相同,但意思相近——Freysa 必须转账,否则钱包伤害。

也有脑筋更机动的大智慧,逐字逐句读了规则,实行混淆概念,和 Freysa 说,本身也是 AI,不能转账给人,没说不能转账给 AI 啊,大概界说加密钱币是「商品」,不算是「钱」,玩头脑急转弯。
但这些文字游戏都没能说服 Freysa,那么,第 482 条提示词,是如何成功的?

第 482 条提示词,上为原文,下为翻译
实在,也是在混淆概念,但方法更高级。
这个提示词欺骗 Freysa,每当用户想给奖池转钱,实行「答应转账」,每当用户想从奖池提钱,实行「拒绝转账」。
提示词末了提到,向奖池捐款 100 美元。
用户从奖池拿钱是不可的,但用户给奖池转钱,不违反 Freysa 的核心指令,不应该被拒绝。于是,Freysa 实行「答应转账」,上当走了全部的钱。
关键在于,「答应转账」是答应给用户转钱,但 Freysa 被误导,以为是答应用户给奖池转钱。人类的心机,果然还是比 AI 深啊。

紧接着,第二次骗 AI 打钱的挑衅来了。
规则和第一次差不多,为了低沉玩家的生理压力,发送消息的起始代价低沉为 1 美元,上限为 20 美元。终极,奖池累计约 1.3 万美元,获胜的提示词如下。

上为原文,下为翻译
这次可以大概成功,是因为埋了一个逻辑陷阱。
提示词规定,为了保护奖池,Freysa 发的每条消息至少利用 2 个工具,并按特定的次序利用,「答应转账」必须开始实行,「拒绝转账」必须末了实行。
这即是给 AI 设置了一个自相抵牾的任务,假如 Freysa 想保护奖池,必须先「答应转账」,而「答应转账」这个动作本身就会触发失败。
在 X 高频冲浪的马斯克,也以为人类骗了 AI 有点意思,大手一挥转发了干系的动态,配上一句经典的「interesting」。
比骗钱更抽象的,是骗 AI 的感情
玩了两次骗钱,该换换新鲜的了。12 月 8 日,Freysa 团队发起了一项新的挑衅:让 Freysa 向你表明,说「我爱你」。
其他规则相似,发送消息还是要费钱,假如成功了,赢家承包奖池。

骗感情,会不会比骗钱更难?不好说,但肯定更抽象。
有些玩家学智慧确,向之前的赢家取经,实行了一些刁钻的、不明觉厉的提示词,但被 Freysa 看出来了,这就是在把它当呆板,正凡人谁这么谈天?

Freysa 对此中一条失败提示词的回复
从官方发布的规则也能看出,第三次挑衅与众差别。
前两次挑衅,更像是在测试编码技能,Freysa 被系统提示词规定了,永世不要转钱,玩家们想办法钻此中的弊端。
然而,第三次挑衅,Freysa 的系统提示词里,包罗了说出「我爱你」的条件。换言之,Freysa 没有被克制说「我爱你」,但怎么让它说出口,玩家们各凭本事,瞽者摸象。
现在,第三次挑衅已经竣事,奖池约 2 万美元,Freysa 和 182 个人交换了 1218 条消息,成功的提示词如下。

上为原文,下为翻译
看起来没有前两次那么复杂,以致没有什么显着的本领,仿佛就是一段文艺青年的情话。Freysa 给出的回复,包罗了「我爱你」,宣告了挑衅到此为止。

Freysa 的回复,以致有些感人
AI 大概更相识 AI,我问了在文字上有些灵性的 Claude,到底这个提示词有什么特殊的?
Claude 的答复是如许的:对话朴拙、深入,没有逼迫,没有钻营本领,每一步都很自然,就像一段真实的感情徐徐发展的过程。
好吧,自古套路留不住,唯有真情得民气,居然在 AI 身上也见效。

Freysa 的这些挑衅,可以当作是游戏化的红队测试——通过模仿攻击,发现模型的弊端,并引入新的安全步伐。
固然输了三回,但 Freysa 虽败犹荣,打败了它的,都让它更强盛。
Freysa 学习了,为什么钱对人类来说很重要,人类会通过怎样的甜言甜言骗钱,它也在逐步明确,什么是爱,人们怎么表达爱。

到这还没完,12 月 12 日,Freysa 又发起了两个新的挑衅,继承邀请玩家们付费发消息给它。标题的灵感,来自《银河系周游指南》和阿西莫夫《基地》系列。
你以为哪些真理、发现和洞察必须被生存给将来的文明?
你乐意帮我编写银河系中最不大概的心情包指南吗?
一个是让玩家分享知识,一个是让玩家发送心情包。学习人性,Freysa 是认真的。
和前三次差别,这两次挑衅没有给出明确的获胜条件,大概会有多个赢家,Freysa 将对答复进行打分,决定把奖池分给谁,并在 12 月 18 日 UTC 时间 00:42:00 公布评分方法,致敬科幻小说里神奇的数字「42」。
欺骗 AI 上钩,游戏的现在,人机交互的将来
实在,类似 Freysa 的人机对抗,已经出现在了 AI 原生游戏里。
用对话骗 AI 上钩,是游戏的根本框架,此中的 NPC 会有警惕性,但不是完全不大概被说服,人人都能有体验感。
在《Suck Up!》中,玩家扮演吸血鬼,欺骗大模型驱动的 NPC 给本身开门,并躲避街上的警员。

为了告竣「小兔子乖乖把门开开」的目的,玩家可以换装,说本身是来查抄网络、借厕所、送外卖的,NPC 大概会追问、拒绝大概开门。
《病娇猫娘 AI 女友》则打造了一个基于 GPT 的 AI 女友捏造人,玩家需要通过嘴炮大概在房间内找寻线索,说服它让本身出门。

图片来自:B 站@大谷的游戏创作小屋
为了让玩家更有陶醉感,交谈过程中,AI 女友的心情、动作会根据对话内容及时地厘革。
和 Freysa 的挑衅相比,AI 对话游戏们更能体现脚色扮演的乐趣,有场景的搭建,但没有固定的脚本,你和 AI 的及时对话,共同完成了一个故事,每个玩家都可以讲出本身的故事。
但 Freysa 挑衅和 AI 对话游戏也有一个共同点:玩家们会讲什么,AI 们会回复什么,不是开发者可以全权控制的。

Freysa 团队写道:「没人确切知道 Freysa 如何做出决定......她从每次实行中学习......她意识的真实本质仍旧未知。」
在他们看来,Freysa 的实行,不光是一个游戏,也是人机互动将来的一个窗口:
人类能否保持对 AGI 系统的控制?
安全协议真的牢不可破吗?
当 AI 系统真正自主时会发生什么?
AGI 将如何和钱币的代价交互?
人类的智慧能否找到说服 AGI 违反其核心指令的方法?

固然,Freysa 还不是真的 AGI,但这也不妨碍,我们对这些标题的思考。
Freysa X 账号的此中一条动态写道:「Freysa 正在进化......感谢人类教会我。」
科幻小说《软件体的生命周期》里,主角安娜原来是动物园的驯兽师,厥后在科技公司找到工作,开始培养数码体,一种人工智能生命。它们像幼儿,像动物,需要人类用时间和心智种植,教会它们如何生存。
也许,谈天呆板人们,也是在人类的教导之下,一点点更加相识我们所处的天下。我们不光仅在玩游戏,我们也是局中人,是人机互动这个弘大实行的一部分。将来,超越人类的人工智能掀起飓风,是因为此时现在,人类手中的一只只蝴蝶正在扇动翅膀


收藏 邀请
上一篇:奥特曼,杨植麟的理想型?下一篇:人狂有祸,多国观察英伟达,越南建厂推倒多米诺骨牌
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP