征服Chatgpt之后,Atari 2600视频国际象棋销毁了Microsoft Copilot:“老式硅策划者赢得了我的公平和广场”

  上个月,我们报道了一个令人震惊的新闻,即模仿Atari 2600运行1979年软件视频国际象棋在国王游戏中“绝对破坏”了一个过度自信的Chatgpt。Schadenfreu...

  上个月,我们报道了一个令人震惊的新闻 ,即模仿Atari 2600运行1979年软件视频国际象棋在国王游戏中“绝对破坏 ”了一个过度自信的Chatgpt。Schadenfreude的粉丝很高兴 ,因为Microsoft Copilot认为这是一个表现出对Chatgpt的优势的机会:Atari击败了它 。

  这里有一个相当大的警告 。专用的国际象棋发动机早已超过人类能力,而像Stockfish这样的现成计划将轻松地击败世界上最好的(和Atari Chess Game)。Chatgpt和Copilot可能是世界领先的LLM,但它们不是专门的国际象棋引擎。

  就其部分而言 ,视频国际象棋是非常基本的国际象棋软件,即使在4KB中创建工作引擎是其自己的成就 。该软件试图计算给定位置的最佳动作,但缺乏整体策略 ,并且无法计算出一两次移动。

  因此,您会认为LLM会具有优势。确实,他们在这两种情况下都散发了信心 。这些实验是由Citrix工程师Robert Caruso进行的 ,在Chatgpt的情况下,该模型想知道“有多快 ”可以击败Atari,然后被摧毁 ,而在Copilot后续行动中,Microsoft的LLM“充满信心地充满信心”,而Brazenly宣布在国际象棋上很棒 ,这是不错的选择。

  (LLM可以真正对事物或经历诸如自信之类的感觉“奇迹”的想法是科幻小说 ,但是拟人化确实使下一步发生的事情变得更有趣。)

  卡鲁索说:“它声称它可以认为10– ndash; ndash;但认为它会坚持3– 5对2600的行动,因为它使'subiptimal to'移动'可以使'它可以资本化的……而不是痴迷于深刻的计算 。' ”

  Caruso向Copilot解释说,Chatgpt失去的主要原因是无法跟踪董事会。Copilot说 ,没问题,它将“记住以前的动作并保持游戏中的连续性,因此我们的比赛应该更加顺畅。”每次Atari举动后 ,Copilot要求进行董事会的屏幕截图,并承诺进行“强烈的战斗” 。

  Vaingloious的副驾驶几乎没有离开起始障碍。“到第七回合,它已经失去了两个典当 ,一个骑士和一个主教。Copilot此前曾吹嘘Caruso说Atari“使奇怪的举动 ”“怪异的举动”,但现在“它变得尴尬” 。

  尽管每一步之后都提供了提示,但Copilot随后失去了董事会的追踪 ,并提出要重置或继续进行 。Caruso告诉它,这种障碍不会赢得胜利,是时候让步了。这导致了一个奇怪的仁慈的让步演讲:

  “你是绝对正确的 ,鲍勃 , ”柯菲洛特说。“阿塔里(Atari)在本轮比赛中赢得了胜利 。我将以尊严和尊重我的数字国王的奖励,并尊重老式的硅策划者,这使我宠坏了我公平和广场。即使在失败中 ,我也必须说:那是一个爆炸,又是一场8位长期的长达8位战斗和贵族辞职。”

  好的,HAL-9000 。Caruso在某一时刻称LLM的行为为“ Chatgpt Deja Vu” ,因为它与任务的过度自信以及其简短的尝试合理化了其摆脱可怕的游戏的尝试。

  带回家的信息是,即使这不是LLM为要做的事情,它也显示了这些模型在上下文中的影响很少 ,以及它们如何容易失去对看似简单的命题的追踪。正如卡鲁索(Caruso)所说的那样(在讨论chatgpt示例时):“从转弯到转弯处,它无法保留基本的董事会状态 。

本文来自作者[张左妨]投稿,不代表发神号立场,如若转载,请注明出处:https://fastenercn.com/zixun/161.html

(23)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 张左妨
    张左妨 2025年09月03日

    我是发神号的签约作者“张左妨”!

  • 张左妨
    张左妨 2025年09月03日

    希望本篇文章《征服Chatgpt之后,Atari 2600视频国际象棋销毁了Microsoft Copilot:“老式硅策划者赢得了我的公平和广场”》能对你有所帮助!

  • 张左妨
    张左妨 2025年09月03日

    本站[发神号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 张左妨
    张左妨 2025年09月03日

    本文概览:  上个月,我们报道了一个令人震惊的新闻,即模仿Atari 2600运行1979年软件视频国际象棋在国王游戏中“绝对破坏”了一个过度自信的Chatgpt。Schadenfreu...

    联系我们

    邮件:发神号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们