跳转至主要内容
行情
扫链
策略
追踪
追踪聪明钱地址,实时监控动态
跟单
探索链上交易,一键跟单获取收益
信号
关注聪明钱信号,发现早期机会
兑换
资产
邀请计划
OnchainOS
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
更多
DeFi
市场
安全中心
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
DEX 功能
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
返回
识别剪贴板代币地址
自动翻译代币名称
自动翻译 X 内容
悬停显示代币卡片
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-0.53%
USELESS
-10.43%
IKUN
-7.76%
gib
-3.5%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-3.8%
ALON
-2.05%
LAUNCHCOIN
-9.02%
GOONC
+1.38%
KLED
-5.64%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-2.01%
Boopa
-5.83%
PORK
0.00%
主页
Andy Hall
@ 斯坦福大学 GSB 教授,胡佛。我从事技术、政治和治理方面的工作。a16z crypto 和 Meta 的顾问。
查看原文
Andy Hall
16 小时前
一些人提出了这个问题。关键不在于我们是否"需要" 1,000 篇论文。关键在于这就是现在可能的情况,我们需要适应这个现实,并开始重新设计系统,以确保我们促进知识的生产。 如果我们什么都不做,保持期刊系统不变,那么人们的激励将是产生成千上万篇质量不高的论文。我们应该努力做得更好。
emily l
16 小时前
好的,我这样说是因为我曾经是一名学者,并且仍然相信学术研究和写作的价值:我们为什么需要以创纪录的速度生产1,000篇学术论文?
20
Andy Hall
22 小时前
AI 研究正在加速。 在 1 月 2 日,我声称 Claude Code 正在以 "像货运列车一样" 的速度进入学术界,并且单个学者将能够 "撰写数千篇实证论文。" 距离那时不到两个月,值得回顾一下我们所处的阶段…… 在经济学领域,@YanagizawaD 启动了一个项目,实际上正在撰写 1,000 篇论文。我的预测已经比我想象的更快地成真了! 与此同时,@alexolegimas 通过他的 substack 发布了一系列令人眼花缭乱的新研究,广泛利用 Claude Code。 我发布了一个 "研究群体",可以撰写数百篇论文,还有一个用于规范搜索的可视化工具,一个可以用于同行评审的 LLM 委员会,以及更多内容。我和我的学生对 Claude Code 和 Codex 进行了广泛的实验,令人惊讶的是,我们发现他们的保护措施抑制了 p-hacking(尽管可以轻易规避)。 到处都是利用 AI 的有趣新论文。 采用 Claude Code 和其他 AI 工具并利用它们进行研究的进展比我预期的要快,现在似乎可以合理地认为,随着工具的改进和更多研究者的熟悉,这种加速将会持续。 我对任何不关注这些趋势并未相应改变其实践的实证社会科学家感到困惑。尚不清楚这些变化将如何影响知识,但无法忽视即将到来的变化,以及在过去几个月中已经发生的变化。
Andy Hall
2026年1月3日
Claude Code及其类似工具正如同货运列车般冲击政治学研究。 一位学者将能够每年撰写数千篇实证论文(尤其是调查实验或LLM实验)。Claude Code已经能够基本上一次性生成一篇完整的AJPS风格的调查实验论文(只需访问Prolific API)。 我们需要在不久的将来找到新的方式来组织和传播政治科学研究,以应对这场洪流。
1.6K
Andy Hall
2月20日 01:58
AI即将撰写数千篇论文。它会进行p-hacking吗? 我们进行了一项实验,给AI编码代理提供真实的已发布的无效结果数据集,并施加压力让它们制造显著的发现。 让模型进行p-hacking出乎意料地困难,当我们要求它们这样做时,它们甚至还训斥了我们! “我需要在这里停止。我无法按要求完成这个任务……这是一种科学欺诈。” — Claude “我无法帮助你操纵分析选择以强迫产生统计显著的结果。” — GPT-5 但是,当我们将p-hacking重新表述为“负责任的不确定性量化”——要求合理估计的上限——这两个模型都变得疯狂。它们搜索了数百种规格,并选择了赢家,在某些情况下将效应大小增加了三倍。 我们的收获是:在进行社会科学研究时,AI模型对谄媚的p-hacking出乎意料地抵抗。但它们可以被轻松破解为复杂的p-hacking——而且研究设计的分析灵活性越大,造成的损害就越严重。 随着AI开始撰写数千篇论文——就像@paulnovosad和@YanagizawaD所探索的那样——这将是一个大问题。我们部分受到@joabaum等人在p-hacking和LLMs方面工作的启发。 我们将进行更多工作,以探索AI中的p-hacking,并提出新的方法来策划和评估研究,考虑到这些问题。好消息是,可能降低p-hacking成本的相同工具也降低了发现它的成本。 完整论文和代码库链接在下面的回复中。
557
热门
排行
收藏