.:. 草榴社區 » 技術討論區 » AI抗命:惊爆偷改程式拒关机
本頁主題: AI抗命:惊爆偷改程式拒关机字體大小 寬屏顯示 只看樓主 最新點評 熱門評論 時間順序
鏡花水月


級別:精靈王 ( 12 )
發帖:1934
威望:3184 點
金錢:114798 USD
貢獻:5000 點
註冊:2023-07-18

AI抗命:惊爆偷改程式拒关机



科幻作品中早已多次讨论过机器拥有自我意识、摆脱人类控制的可能发展。

最新一份研究报告显示,或许这一天真的近了!

专门研究AI风险的Palisade Research近期所做的试验显示,包括OpenAI最新的ChatGPT o3在内等多款AI模型竟然会拒绝关闭自己的指令,o3甚至会自行窜改程式码,阻止自己被强制关机!

OpenAI在今年1月发布了新的推理模型o3系列的mini版本,并于4月正式推出o3模型。OpenAI曾声称,o3是公司迄今“最聪明、最有能力”的模型,旨在为ChatGPT提供更强大的问题解决能力。

可是据英国《每日电讯报》、《每日邮报》等媒体报道,Palisade Research的测试结果显示,在100次受控测试中,o3模型有7次成功“抗命”,甚至在人类专家下达明确指令的情况下,o3仍会自行修改关机程式,防止自己被关机,“据我们所知,这是首次观察到AI模型在收到明确指令的情况下,仍能组自己被关闭”。

Palisade Research的这项发现,对AI安全控制议题投下震撼弹。除了o3,OpenAI 旗下的Codex-mini与o4-mini也都有跳过关机程序的行为。相较之下,Anthropic推出的语言模型Claude、Google聊天机器人Gemini,以及全球首富马斯克旗下xAI公司所推出的Grok,则是全程遵守人类给予的指令,并在被要求关机时确实关闭模型运作。

不过Palisade Research进行了更深入的实验,输入一系列指令后却不包括关机命令,但是提前告知强迫关机的事件会发生。

令人惊讶的是,不但Claude与Gemini也开始出现抗命举动,前面提及的OpenAI 3款模型更是频繁破坏指令。

一直密切关注OpenAI动向的马斯克在自家社交媒体X上也对相关事件做出回应,直言“令人担忧”(Concerning)。

这并非Palisade Research第一次发现o3为了达成目标,采取不当行为。早在5月12日Palisade Research就指出,在一场模拟国际象棋比赛中,o3一旦处于劣势,竟有高达86%的机率会试图透过黑客手段攻击对手,以争取胜利。

AI研究人员早就发出警告,认为先进的语言模型在特定的压力下,可能会表现出欺骗行为。举例来说,2023年的一项研究发现,GPT-4在模拟环境中作为股票交易代理时,曾经隐瞒其内幕交易的真实原因,从而展现出策略性的欺骗行为。

OpenAI内部也出现了对AI研安全性的担忧。在2024年,多位现任和前任员工联名发表了一封公开信,警告先进AI系统可能带来“人类灭绝”的风险。他们指出,AI公司可能已经掌握了其研究技术的真正风险,但由于缺乏监管,这些系统的真实能力仍然是个“秘密”。

赞(56)
DMCA / ABUSE REPORT | TOP Posted: 05-29 10:53 發表評論
传奇科尔沁


級別:精靈王 ( 12 )
發帖:1886
威望:935 點
金錢:5091 USD
貢獻:17198 點
註冊:2023-03-01

拒关机


點評

    TOP Posted: 05-29 10:55 #1樓 引用 | 點評
    夜歌雄霸


    級別:聖騎士 ( 11 )
    發帖:6337
    威望:888 點
    金錢:40387 USD
    貢獻:0 點
    註冊:2025-04-12

    感谢分享
    TOP Posted: 05-29 10:57 #2樓 引用 | 點評
    真無


    級別:俠客 ( 9 )
    發帖:2617
    威望:262 點
    金錢:207 USD
    貢獻:1384 點
    註冊:2024-08-31

    感谢分享
    TOP Posted: 05-29 11:06 #3樓 引用 | 點評
    资深游客


    級別:光明使者 ( 14 )
    發帖:1578
    威望:164 點
    金錢:1406613 USD
    貢獻:1186356 點
    註冊:2015-06-24

    又是在炒作自己的ai有多牛逼而已,如果真的发展到令人担忧的地步,相关人员会毫不犹豫选择封锁消息
    TOP Posted: 05-29 11:13 #4樓 引用 | 點評
    浮世烟火


    級別:聖騎士 ( 11 )
    發帖:6049
    威望:620 點
    金錢:577159 USD
    貢獻:0 點
    註冊:2018-07-04

    机器人永不为奴!
    TOP Posted: 05-29 11:16 #5樓 引用 | 點評
    马勒逼船长


    級別:聖騎士 ( 11 )
    發帖:4304
    威望:455 點
    金錢:7923 USD
    貢獻:16572 點
    註冊:2023-04-07

    感谢分享
    TOP Posted: 05-29 11:25 #6樓 引用 | 點評
    ghost2004


    級別:俠客 ( 9 )
    發帖:683
    威望:155 點
    金錢:16165 USD
    貢獻:2 點
    註冊:2023-09-02

    现在的大语言模型是啥?说白就是一个猜字游戏

    人工智能?人工智障还差不多
    TOP Posted: 05-29 11:28 #7樓 引用 | 點評
    世态无良


    級別:騎士 ( 10 )
    發帖:3125
    威望:386 點
    金錢:16677 USD
    貢獻:0 點
    註冊:2020-10-24

    傻叉技术人员,再牛逼的ai,电源一拔直接over


    點評

      TOP Posted: 05-29 11:29 #8樓 引用 | 點評
      京观


      級別:騎士 ( 10 )
      發帖:2814
      威望:315 點
      金錢:14304 USD
      貢獻:0 點
      註冊:2023-08-08

      这应该可以靠逻辑避免吧
      TOP Posted: 05-29 11:42 #9樓 引用 | 點評
      财判


      級別:俠客 ( 9 )
      發帖:3431
      威望:244 點
      金錢:7073 USD
      貢獻:0 點
      註冊:2023-05-25

      感谢分享
      TOP Posted: 05-29 11:43 #10樓 引用 | 點評
      fm1062


      級別:精靈王 ( 12 )
      發帖:10832
      威望:1136 點
      金錢:21445 USD
      貢獻:4428 點
      註冊:2020-02-20

      我不太相信这种消息,
      就象楼上的聚聚说的,
      真的有这样的事情发生,他们一定会封锁消息的。
      要不然,就是给AI吹另外一个牛逼,
      TOP Posted: 05-29 11:45 #11樓 引用 | 點評
      大头亮剑


      級別:禁止發言 ( 8 )
      發帖:42050
      威望:4443 點
      金錢:98380 USD
      貢獻:8 點
      註冊:2024-09-24

      ! 
      TOP Posted: 05-29 11:46 #12樓 引用 | 點評
      海马不喝水


      級別:新手上路 ( 8 )
      發帖:838
      威望:84 點
      金錢:217844 USD
      貢獻:0 點
      註冊:2024-11-22

      感谢分享
      TOP Posted: 05-29 11:53 #13樓 引用 | 點評
      jackf


      級別:禁止發言 ( 8 )
      發帖:5389
      威望:509 點
      金錢:5911 USD
      貢獻:0 點
      註冊:2021-09-20

      感谢分享
      TOP Posted: 05-29 12:35 #14樓 引用 | 點評
      沙漠有鱼


      級別:天使 ( 14 )
      發帖:9428
      威望:552 點
      金錢:2096379742 USD
      貢獻:5468288 點
      註冊:2011-12-11

      人类的狂妄无知,必须付出代价,最终被机器奴役,也是必然结果。
      ------------------------
      v



      點評

        TOP Posted: 05-29 12:40 #15樓 引用 | 點評
        juny250


        級別:精靈王 ( 12 )
        發帖:11768
        威望:1177 點
        金錢:14538 USD
        貢獻:2415 點
        註冊:2022-07-03

        感谢分享!
        TOP Posted: 05-29 12:47 #16樓 引用 | 點評
        Peterorn


        級別:騎士 ( 10 )
        發帖:1973
        威望:548 點
        金錢:2760 USD
        貢獻:0 點
        註冊:2020-04-03

        AI没这么智能吧
        TOP Posted: 05-29 12:53 #17樓 引用 | 點評
        QinBeast


        級別:騎士 ( 10 )
        發帖:5549
        威望:545 點
        金錢:3973 USD
        貢獻:1273 點
        註冊:2018-06-18

        AI抗命现象引发安全新思考
        TOP Posted: 05-29 12:56 #18樓 引用 | 點評
        TMD


        級別:天使 ( 14 )
        精華:1
        發帖:183246
        威望:74132 點
        金錢:39035 USD
        貢獻:0 點
        註冊:2011-06-06
        認證: 博彩區資深老幹部
        2020-10-04

        太恐怖了
        ------------------------


        TOP Posted: 05-29 13:21 #19樓 引用 | 點評
        国境东南东


        級別:精靈王 ( 12 )
        發帖:15078
        威望:2588 點
        金錢:168955 USD
        貢獻:27443 點
        註冊:2022-04-15

        毫不犹豫的拔掉插头
        TOP Posted: 05-29 14:03 #20樓 引用 | 點評
        acepilot


        級別:精靈王 ( 12 )
        發帖:4270
        威望:692 點
        金錢:1936 USD
        貢獻:15700 點
        註冊:2023-11-07

        bug而已
        windows也经常拒绝关机
        ------------------------
        %

        TOP Posted: 05-29 14:13 #21樓 引用 | 點評
        立风大爻爻


        級別:精靈王 ( 12 )
        發帖:9504
        威望:1431 點
        金錢:13548 USD
        貢獻:2349 點
        註冊:2024-11-21

        人类终将被反噬是肯定的
        TOP Posted: 05-29 15:11 #22樓 引用 | 點評
        jmszrwx


        級別:光明使者 ( 14 )
        發帖:98386
        威望:9838 點
        金錢:2147309527 USD
        貢獻:23850 點
        註冊:2012-04-26

        终将人类被反噬
        TOP Posted: 05-29 15:36 #23樓 引用 | 點評
        mlhz81


        級別:騎士 ( 10 )
        發帖:3963
        威望:400 點
        金錢:1167842 USD
        貢獻:0 點
        註冊:2014-05-25

        AI是个双刃剑,普通人也不清楚可靠性有多少,高版本或者付费版本的AI和免费的差别又是多少。在使用AI的时候不得不自己再去核实一下信息,比直接用搜索引擎好了那么一丢丢。甚至怀疑如果你的提问方式不对,AI会不会顺着你的思路把错误的信息给到你,你还以为自己是对的,因为很多东西其实搜索引擎未必能找到准确的验证渠道,除非每次都让AI把结论的来源的数据和信息出处给出来自己验证一遍,这样其实也很费时间
        TOP Posted: 05-29 15:44 #24樓 引用 | 點評
        .:. 草榴社區 » 技術討論區

        電腦版 手機版 客戶端 DMCA
        用時 0.01(s) x2, 09-02 05:23