.:. 草榴社區 » 技術討論區 » AI抗命:惊爆偷改程式拒关机
本頁主題: AI抗命:惊爆偷改程式拒关机字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
鏡花水月


級別:精靈王 ( 12 )
發帖:1811
威望:2953 點
金錢:74800 USD
貢獻:5000 點
註冊:2023-07-18

AI抗命:惊爆偷改程式拒关机



科幻作品中早已多次讨论过机器拥有自我意识、摆脱人类控制的可能发展。

最新一份研究报告显示,或许这一天真的近了!

专门研究AI风险的Palisade Research近期所做的试验显示,包括OpenAI最新的ChatGPT o3在内等多款AI模型竟然会拒绝关闭自己的指令,o3甚至会自行窜改程式码,阻止自己被强制关机!

OpenAI在今年1月发布了新的推理模型o3系列的mini版本,并于4月正式推出o3模型。OpenAI曾声称,o3是公司迄今“最聪明、最有能力”的模型,旨在为ChatGPT提供更强大的问题解决能力。

可是据英国《每日电讯报》、《每日邮报》等媒体报道,Palisade Research的测试结果显示,在100次受控测试中,o3模型有7次成功“抗命”,甚至在人类专家下达明确指令的情况下,o3仍会自行修改关机程式,防止自己被关机,“据我们所知,这是首次观察到AI模型在收到明确指令的情况下,仍能组自己被关闭”。

Palisade Research的这项发现,对AI安全控制议题投下震撼弹。除了o3,OpenAI 旗下的Codex-mini与o4-mini也都有跳过关机程序的行为。相较之下,Anthropic推出的语言模型Claude、Google聊天机器人Gemini,以及全球首富马斯克旗下xAI公司所推出的Grok,则是全程遵守人类给予的指令,并在被要求关机时确实关闭模型运作。

不过Palisade Research进行了更深入的实验,输入一系列指令后却不包括关机命令,但是提前告知强迫关机的事件会发生。

令人惊讶的是,不但Claude与Gemini也开始出现抗命举动,前面提及的OpenAI 3款模型更是频繁破坏指令。

一直密切关注OpenAI动向的马斯克在自家社交媒体X上也对相关事件做出回应,直言“令人担忧”(Concerning)。

这并非Palisade Research第一次发现o3为了达成目标,采取不当行为。早在5月12日Palisade Research就指出,在一场模拟国际象棋比赛中,o3一旦处于劣势,竟有高达86%的机率会试图透过黑客手段攻击对手,以争取胜利。

AI研究人员早就发出警告,认为先进的语言模型在特定的压力下,可能会表现出欺骗行为。举例来说,2023年的一项研究发现,GPT-4在模拟环境中作为股票交易代理时,曾经隐瞒其内幕交易的真实原因,从而展现出策略性的欺骗行为。

OpenAI内部也出现了对AI研安全性的担忧。在2024年,多位现任和前任员工联名发表了一封公开信,警告先进AI系统可能带来“人类灭绝”的风险。他们指出,AI公司可能已经掌握了其研究技术的真正风险,但由于缺乏监管,这些系统的真实能力仍然是个“秘密”。

赞(56)
DMCA / ABUSE REPORT | TOP Posted: 05-29 10:53 發表評論
传奇科尔沁


級別:精靈王 ( 12 )
發帖:1779
威望:906 點
金錢:3775 USD
貢獻:17198 點
註冊:2023-03-01

拒关机


點評

    TOP Posted: 05-29 10:55 #1樓 引用 | 點評
    夜歌雄霸


    級別:騎士 ( 10 )
    發帖:2936
    威望:459 點
    金錢:22638 USD
    貢獻:0 點
    註冊:2025-04-12

    感谢分享
    TOP Posted: 05-29 10:57 #2樓 引用 | 點評
    真無


    級別:俠客 ( 9 )
    發帖:2179
    威望:218 點
    金錢:175 USD
    貢獻:1104 點
    註冊:2024-08-31

    感谢分享
    TOP Posted: 05-29 11:06 #3樓 引用 | 點評
    资深游客


    級別:光明使者 ( 14 )
    發帖:1520
    威望:158 點
    金錢:5871 USD
    貢獻:1126356 點
    註冊:2015-06-24

    又是在炒作自己的ai有多牛逼而已,如果真的发展到令人担忧的地步,相关人员会毫不犹豫选择封锁消息
    TOP Posted: 05-29 11:13 #4樓 引用 | 點評
    浮世烟火


    級別:聖騎士 ( 11 )
    發帖:6005
    威望:616 點
    金錢:576913 USD
    貢獻:0 點
    註冊:2018-07-04

    机器人永不为奴!
    TOP Posted: 05-29 11:16 #5樓 引用 | 點評
    马勒逼船长


    級別:聖騎士 ( 11 )
    發帖:3843
    威望:399 點
    金錢:5198 USD
    貢獻:16255 點
    註冊:2023-04-07

    感谢分享
    TOP Posted: 05-29 11:25 #6樓 引用 | 點評
    ghost2004


    級別:俠客 ( 9 )
    發帖:603
    威望:145 點
    金錢:14497 USD
    貢獻:2 點
    註冊:2023-09-02

    现在的大语言模型是啥?说白就是一个猜字游戏

    人工智能?人工智障还差不多
    TOP Posted: 05-29 11:28 #7樓 引用 | 點評
    世态无良


    級別:騎士 ( 10 )
    發帖:2961
    威望:370 點
    金錢:15199 USD
    貢獻:0 點
    註冊:2020-10-24

    傻叉技术人员,再牛逼的ai,电源一拔直接over


    點評

      TOP Posted: 05-29 11:29 #8樓 引用 | 點評
      京观


      級別:騎士 ( 10 )
      發帖:2785
      威望:312 點
      金錢:13956 USD
      貢獻:0 點
      註冊:2023-08-08

      这应该可以靠逻辑避免吧
      TOP Posted: 05-29 11:42 #9樓 引用 | 點評
      财判


      級別:俠客 ( 9 )
      發帖:2989
      威望:199 點
      金錢:5901 USD
      貢獻:0 點
      註冊:2023-05-25

      感谢分享
      TOP Posted: 05-29 11:43 #10樓 引用 | 點評
      fm1062


      級別:精靈王 ( 12 )
      發帖:10536
      威望:1096 點
      金錢:19493 USD
      貢獻:4428 點
      註冊:2020-02-20

      我不太相信这种消息,
      就象楼上的聚聚说的,
      真的有这样的事情发生,他们一定会封锁消息的。
      要不然,就是给AI吹另外一个牛逼,
      TOP Posted: 05-29 11:45 #11樓 引用 | 點評
      大头亮剑


      級別:精靈王 ( 12 )
      發帖:26294
      威望:2890 點
      金錢:78476 USD
      貢獻:7 點
      註冊:2024-09-24

      ! 
      TOP Posted: 05-29 11:46 #12樓 引用 | 點評
      海马不喝水


      級別:新手上路 ( 8 )
      發帖:547
      威望:55 點
      金錢:216966 USD
      貢獻:0 點
      註冊:2024-11-22

      感谢分享
      TOP Posted: 05-29 11:53 #13樓 引用 | 點評
      jackf


      級別:騎士 ( 10 )
      發帖:5154
      威望:486 點
      金錢:5650 USD
      貢獻:0 點
      註冊:2021-09-20

      感谢分享
      TOP Posted: 05-29 12:35 #14樓 引用 | 點評
      沙漠有鱼


      級別:天使 ( 14 )
      發帖:9416
      威望:533 點
      金錢:2096775244 USD
      貢獻:5428588 點
      註冊:2011-12-11

      人类的狂妄无知,必须付出代价,最终被机器奴役,也是必然结果。
      ------------------------
      v



      點評

        TOP Posted: 05-29 12:40 #15樓 引用 | 點評
        juny250


        級別:精靈王 ( 12 )
        發帖:11243
        威望:1125 點
        金錢:12649 USD
        貢獻:2415 點
        註冊:2022-07-03

        感谢分享!
        TOP Posted: 05-29 12:47 #16樓 引用 | 點評
        Peterorn


        級別:騎士 ( 10 )
        發帖:1867
        威望:477 點
        金錢:2622 USD
        貢獻:0 點
        註冊:2020-04-03

        AI没这么智能吧
        TOP Posted: 05-29 12:53 #17樓 引用 | 點評
        QinBeast


        級別:騎士 ( 10 )
        發帖:5549
        威望:545 點
        金錢:3964 USD
        貢獻:1273 點
        註冊:2018-06-18

        AI抗命现象引发安全新思考
        TOP Posted: 05-29 12:56 #18樓 引用 | 點評
        TMD


        級別:天使 ( 14 )
        精華:1
        發帖:181158
        威望:58881 點
        金錢:34465 USD
        貢獻:0 點
        註冊:2011-06-06
        認證: 博彩區資深老幹部
        2020-10-04

        太恐怖了
        ------------------------


        TOP Posted: 05-29 13:21 #19樓 引用 | 點評
        国境东南东


        級別:精靈王 ( 12 )
        發帖:13367
        威望:1971 點
        金錢:117917 USD
        貢獻:27443 點
        註冊:2022-04-15

        毫不犹豫的拔掉插头
        TOP Posted: 05-29 14:03 #20樓 引用 | 點評
        acepilot


        級別:精靈王 ( 12 )
        發帖:4267
        威望:691 點
        金錢:778 USD
        貢獻:15700 點
        註冊:2023-11-07

        bug而已
        windows也经常拒绝关机
        ------------------------
        %

        TOP Posted: 05-29 14:13 #21樓 引用 | 點評
        立风大爻爻


        級別:精靈王 ( 12 )
        發帖:9240
        威望:1355 點
        金錢:11663 USD
        貢獻:2300 點
        註冊:2024-11-21

        人类终将被反噬是肯定的
        TOP Posted: 05-29 15:11 #22樓 引用 | 點評
        jmszrwx


        級別:光明使者 ( 14 )
        發帖:97818
        威望:9781 點
        金錢:2147308594 USD
        貢獻:23850 點
        註冊:2012-04-26

        终将人类被反噬
        TOP Posted: 05-29 15:36 #23樓 引用 | 點評
        mlhz81


        級別:騎士 ( 10 )
        發帖:3842
        威望:387 點
        金錢:1167128 USD
        貢獻:0 點
        註冊:2014-05-25

        AI是个双刃剑,普通人也不清楚可靠性有多少,高版本或者付费版本的AI和免费的差别又是多少。在使用AI的时候不得不自己再去核实一下信息,比直接用搜索引擎好了那么一丢丢。甚至怀疑如果你的提问方式不对,AI会不会顺着你的思路把错误的信息给到你,你还以为自己是对的,因为很多东西其实搜索引擎未必能找到准确的验证渠道,除非每次都让AI把结论的来源的数据和信息出处给出来自己验证一遍,这样其实也很费时间
        TOP Posted: 05-29 15:44 #24樓 引用 | 點評
        .:. 草榴社區 » 技術討論區

        電腦版 手機版 客戶端 DMCA
        用時 0.03(s) x2, 07-17 21:57