热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Vincent Weisser
@primeintellect CEO / 开放和去中心化 AGI + 科学
开源强化学习环境可能是确保开源AGI最重要的部分。

will brown10 小时前
我会坦白,我确实对这个项目有一个非常具体的使命。半模糊的私有测试版推出是其中的一部分。我们正在寻找的任务集是其中的一部分。GPU悬赏是其中的一部分。恶搞帖子是其中的一部分。播客是其中的一部分。思想共享在这里至关重要。让我解释一下。
目前,关于RL环境的讨论主要集中在这一波新兴创业公司上,它们的商业模式是向少数大型实验室独家构建和销售环境。Mechanize是其中最响亮的,但还有很多其他公司。实验室不再花费在指令调优样本和注释上,而是渴望购买私有环境,作为模型训练的下一个重要消耗资源。
这一现象既是开源模型保持竞争力的严重风险,也是如果我们能够改变重心的重大机会。如果好的环境都很昂贵且隐藏,开源模型将会进一步落后。这基本上就是预训练数据所发生的情况。但如果能够出现一个足够强大的开源工具生态系统,用于环境和训练,那么开源选项也可以成为最先进的。这在某种程度上就是PyTorch所发生的。
改变这一局面的目标是我的目标,也是我们的目标。我加入Prime Intellect是因为每个人都极其有才华,对人人都能获得的开源AGI的使命非常认真,并且不怕说出来,因为团队有一个独特的结构优势,这意味着我们可以真正采取一些实质性的行动。我们出售计算能力。我们构建基础设施以改善您可以用这些计算能力做的事情。我们研究如何使这些计算能力以新的方式互操作。我们正在训练更大更好的模型。我们有正确的激励去做艰难而必要的工作。这些部分都是相互关联的。
我们不能单独完成这项工作。没有人可以。需要全球的初创公司、企业、学生和教授。开放研究目前没有工具来研究大型实验室认为对未来进展至关重要的问题。我们必须找到一种方法来构建这些工具。我们正在努力使这变得更容易。我们都必须在合作上变得更好,不要重新发明轮子,将单个部分组装成更大的拼图。让我们把迄今为止共同完成的工作整理好,使其协同工作,吸引更多人加入,并开始进行更多的正和游戏。如果我们找不到更好的合作方式,我们将走向一个AI未来,在这个未来中,我们集体根本不知道这些模型是什么,因为帷幕从未被揭开,我们能看到的一切只是玩具。
在这个领域,您可以建立一种不同类型的公司;一种仍然允许您向大型实验室销售,但不是独家的;一种仍然允许您拥有商业秘密的护城河并获得可观的年收入,但不会让我们对正在构建的未来知之甚少。
browserbase。cursor。exa。modal。morph。还有无数其他公司。让我们做更多这样的事情。您可以通过制作强大的工具和代理的工具来建立一家伟大的公司,这些工具反映了人们希望模型实际执行的高价值任务。让其中一些元素可以自由尝试,另一些元素则通过API托管。按使用量收费,并提供一些高级企业功能。构建最佳的LLM形状的Excel克隆,或Figma克隆,或TurboTax克隆。稍微改变一下以避免诉讼,然后让私人客户看到更具诉讼韧性的版本。在这个领域享受一些健康的竞争,并找到在关键地方合作的方法。找到您的角度,并做到如此出色,以至于您可以向每个人销售,无论是用于RL还是实际使用。达到临界质量,并做到如此实惠,以至于没有人值得尝试重建您已经制作的东西。
这是我希望我们最终能达到的时间线。这是一个大实验室仍然可以做得很好的世界,可能会提供最简单的方法来花费更多以获得更好的整体性能。但这也是一个开源模型并不落后太多的世界,所有关心的人基本上都可以看到发生了什么,并理解我们使用的模型实际上是如何训练的。如果您正在考虑创办或加入一家专注于RL环境的公司,我敦促您思考您隐含地押注于哪个时间线,并反思您对此的感受。
9.27K
Vincent Weisser 已转发
我会坦白,我确实对这个项目有一个非常具体的使命。半模糊的私有测试版推出是其中的一部分。我们正在寻找的任务集是其中的一部分。GPU悬赏是其中的一部分。恶搞帖子是其中的一部分。播客是其中的一部分。思想共享在这里至关重要。让我解释一下。
目前,关于RL环境的讨论主要集中在这一波新兴创业公司上,它们的商业模式是向少数大型实验室独家构建和销售环境。Mechanize是其中最响亮的,但还有很多其他公司。实验室不再花费在指令调优样本和注释上,而是渴望购买私有环境,作为模型训练的下一个重要消耗资源。
这一现象既是开源模型保持竞争力的严重风险,也是如果我们能够改变重心的重大机会。如果好的环境都很昂贵且隐藏,开源模型将会进一步落后。这基本上就是预训练数据所发生的情况。但如果能够出现一个足够强大的开源工具生态系统,用于环境和训练,那么开源选项也可以成为最先进的。这在某种程度上就是PyTorch所发生的。
改变这一局面的目标是我的目标,也是我们的目标。我加入Prime Intellect是因为每个人都极其有才华,对人人都能获得的开源AGI的使命非常认真,并且不怕说出来,因为团队有一个独特的结构优势,这意味着我们可以真正采取一些实质性的行动。我们出售计算能力。我们构建基础设施以改善您可以用这些计算能力做的事情。我们研究如何使这些计算能力以新的方式互操作。我们正在训练更大更好的模型。我们有正确的激励去做艰难而必要的工作。这些部分都是相互关联的。
我们不能单独完成这项工作。没有人可以。需要全球的初创公司、企业、学生和教授。开放研究目前没有工具来研究大型实验室认为对未来进展至关重要的问题。我们必须找到一种方法来构建这些工具。我们正在努力使这变得更容易。我们都必须在合作上变得更好,不要重新发明轮子,将单个部分组装成更大的拼图。让我们把迄今为止共同完成的工作整理好,使其协同工作,吸引更多人加入,并开始进行更多的正和游戏。如果我们找不到更好的合作方式,我们将走向一个AI未来,在这个未来中,我们集体根本不知道这些模型是什么,因为帷幕从未被揭开,我们能看到的一切只是玩具。
在这个领域,您可以建立一种不同类型的公司;一种仍然允许您向大型实验室销售,但不是独家的;一种仍然允许您拥有商业秘密的护城河并获得可观的年收入,但不会让我们对正在构建的未来知之甚少。
browserbase。cursor。exa。modal。morph。还有无数其他公司。让我们做更多这样的事情。您可以通过制作强大的工具和代理的工具来建立一家伟大的公司,这些工具反映了人们希望模型实际执行的高价值任务。让其中一些元素可以自由尝试,另一些元素则通过API托管。按使用量收费,并提供一些高级企业功能。构建最佳的LLM形状的Excel克隆,或Figma克隆,或TurboTax克隆。稍微改变一下以避免诉讼,然后让私人客户看到更具诉讼韧性的版本。在这个领域享受一些健康的竞争,并找到在关键地方合作的方法。找到您的角度,并做到如此出色,以至于您可以向每个人销售,无论是用于RL还是实际使用。达到临界质量,并做到如此实惠,以至于没有人值得尝试重建您已经制作的东西。
这是我希望我们最终能达到的时间线。这是一个大实验室仍然可以做得很好的世界,可能会提供最简单的方法来花费更多以获得更好的整体性能。但这也是一个开源模型并不落后太多的世界,所有关心的人基本上都可以看到发生了什么,并理解我们使用的模型实际上是如何训练的。如果您正在考虑创办或加入一家专注于RL环境的公司,我敦促您思考您隐含地押注于哪个时间线,并反思您对此的感受。
45.76K
Vincent Weisser 已转发
我必须坦白,我确实对这个项目有一个非常具体的使命。半模糊的私人测试版推出是其中的一部分。我们正在寻找的任务集是其中的一部分。GPU悬赏是其中的一部分。恶搞帖子是其中的一部分。播客是其中的一部分。思想共享在这里至关重要。让我解释一下。
目前,关于RL环境的讨论主要集中在这一波新兴创业公司上,它们的商业模式是向少数大型实验室独家构建和销售环境。Mechanize是其中最响亮的,但还有很多其他公司。实验室不再花费在指令调优样本和注释上,而是渴望购买私人环境,作为他们下一个重要的可消耗资源用于模型训练。
这一现象既是开源模型保持竞争力的严重风险,也是如果我们能够改变重心的重大机会。如果好的环境都很昂贵且隐藏,开源模型将会进一步落后。这基本上就是预训练数据所发生的情况。但如果能够出现一个足够强大的开源工具生态系统,用于环境和训练,那么开源选项也可以成为最先进的。这在某种程度上就是PyTorch所经历的。
改变这一局面的目标就是我的目标。我们的目标。我加入Prime Intellect是因为每个人都极其有才华,对人人都能获得的开源AGI使命非常认真,并且不怕说出来,因为团队有一个独特的结构优势,这意味着我们可以真正采取一些实质性的行动。我们出售计算能力。我们构建基础设施以改善您可以用这些计算能力做的事情。我们研究如何以新的方式使这些计算能力互操作。我们正在训练更大更好的模型。我们有正确的激励去做艰难而必要的工作。这些部分都是相互关联的。
我们不能单靠自己。没有人可以。需要全球的创业公司、企业、学生和教授。开放研究目前没有工具来研究大型实验室认为对未来进展至关重要的问题。我们必须找到一种方法来构建这些工具。我们正在努力使这变得更容易。我们都必须在合作上变得更好,不要重新发明轮子,将单个部分组装成更大的拼图。让我们把迄今为止共同完成的工作整理好,使其协同工作,吸引更多人加入,并开始进行更多的正和游戏。我们所构建的一切都是为了使这变得更容易。如果我们找不到更好的合作方式,我们将走向一个AI未来,在这个未来中,我们集体根本不知道这些模型是什么,因为帷幕从未被揭开,我们能看到的一切只是玩具。
在这个领域,您可以建立一种不同类型的公司;一种仍然允许您向大型实验室销售,但不是独家的;一种仍然允许您拥有商业秘密护城河并获得可观的ARR,但不会让我们对正在构建的未来知之甚少。
browserbase。cursor。exa。modal。morph。还有无数其他公司。让我们做更多这样的事情。您可以通过制作强大的工具和代理的工具来建立一家伟大的公司,这些工具反映了人们希望模型实际执行的高价值任务。让其中一些元素可以自由尝试,另一些元素则通过API托管。按使用量收费,并提供一些高级企业功能。构建最佳的LLM形状的Excel克隆,或Figma克隆,或TurboTax克隆。稍微改变一下以避免诉讼,然后让私人客户看到更具诉讼抗风险的版本。在这个领域享受一些健康的竞争,并找到在关键地方合作的方法。找到您的角度,并做到如此出色,以至于您可以向每个人销售,无论是用于RL还是实际使用。达到临界质量,并做到如此实惠,以至于没有人值得去重建您已经制作的东西。
这是我希望我们最终能达到的时间线。这是一个大实验室仍然可以做得很好,并且可能提供最简单的方法来花费更多以获得更好的整体性能的世界。但这也是一个开源模型并不落后太远的世界,所有关心的人基本上都可以看到发生了什么,并理解我们使用的模型实际上是如何训练的。如果您正在考虑创办或加入一家专注于RL环境的公司,我敦促您思考您隐含地押注的时间线,并反思您对此的感受。
5.53K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可