热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
AI 在 ICPC 世界总决赛中正式战胜了我。
这让我想起了一项罕见的 ICPC 技能:能够快速阅读队友的代码并发现错误。
这项技能需要多年的训练,这也解释了为什么 AI 通常使编码变得更慢(见 arXiv:2507.09089)。无论 AI 变得多强大,人类仍然可能需要花时间来验证 AI 的输出……
但想象一下,如果从明天开始 ChatGPT 的工作方式发生变化:不是用户–代理聊天,而是用户–代理–仲裁者的三方聊天。⚖️
代理(比如说 GPT-5)必须说服仲裁者(比如说 GPT-4o)其解决方案是正确的;用户的角色是挑战它并说服仲裁者反对。正如验证 (P) 比发明 (NP) 更容易一样,交互式证明 (IP) 路径可以进一步减少所需的人类技能和时间。
这样的 AI–仲裁者系统可能会将负担转移出人类,让我们更少关注后勤(例如,校对代码),而更多关注重要的决策。这会是通往下一代通用 AI 的道路吗?🚀
热门
排行
收藏