Confesso que tenho uma missão muito específica em mente com este projeto. O lançamento beta privado semi-vago faz parte disso. O conjunto de tarefas que estamos terceirizando faz parte disso. as recompensas da GPU fazem parte disso. os shitposts fazem parte disso. os podcasts fazem parte disso. O mindshare é crucial aqui. Deixe-me explicar. atualmente, grande parte da discussão em torno dos ambientes RL está focada nessa nova onda de startups cujo modelo de negócios é construir e vender ambientes para um número muito pequeno de grandes laboratórios em regime de exclusividade. mecanizar é o mais barulhento, mas há vários deles. Em vez de gastar em amostras e anotações de ajuste de instruções, os laboratórios estão ansiosos para comprar ambientes privados como seu próximo grande recurso consumível para treinamento de modelos. Esse fenômeno é um sério risco para a perspectiva de os modelos de código aberto permanecerem competitivos, bem como uma grande oportunidade de inclinar a balança se pudermos mudar o centro de gravidade. Se bons ambientes são todos caros e ocultos, os modelos de código aberto ficarão ainda mais para trás. Isso é essencialmente o que aconteceu com os dados de pré-treinamento. Mas se um ecossistema suficientemente robusto de ferramentas de código aberto para ambientes e treinamento puder surgir, a opção de código aberto também pode ser o estado da arte. Isso é mais ou menos o que aconteceu com o PyTorch. Inclinar a balança aqui é o meu objetivo. nosso objetivo. Entrei para o Prime Intellect porque todos eram incrivelmente talentosos, levavam muito a sério a missão da AGI de código aberto para todos e não tinham medo de dizer isso, e porque a equipe tinha uma vantagem estrutural singular que significava que poderíamos realmente dar algumas mudanças reais. vendemos computação. Construímos infraestrutura para melhorar o que você pode fazer com essa computação. Fazemos pesquisas sobre como fazer essa computação interoperar de novas maneiras. Estamos treinando modelos maiores e melhores. Temos os incentivos certos para fazer o trabalho árduo e necessário. essas peças estão todas conectadas. não podemos fazer isso sozinhos. ninguém pode. Serão necessárias startups, empresas, estudantes e professores de todo o mundo. Atualmente, a pesquisa aberta não possui as ferramentas para estudar as questões que os grandes laboratórios consideram mais cruciais para o progresso futuro. temos que encontrar uma maneira de construir essas ferramentas. Estamos tentando tornar isso mais fácil. Todos nós temos que melhorar em trabalhar juntos, em não reinventar a roda, em montar peças individuais em quebra-cabeças maiores. Vamos pegar o que fizemos coletivamente até agora, limpá-lo, fazê-lo funcionar juntos, trazer mais pessoas para a tenda e começar a jogar mais jogos de soma positiva. se não conseguirmos encontrar maneiras melhores de trabalhar juntos, estamos caminhando para um futuro de IA em que coletivamente *não sabemos o que são esses modelos*, porque a cortina nunca é levantada e tudo o que podemos realmente ver é apenas um brinquedo. há um tipo diferente de empresa que você pode construir neste espaço; um que ainda permite que você venda para os grandes laboratórios, mas não exclusivamente; um que ainda permite que você tenha seus fossos de segredos comerciais e imprima um ARR doce, mas não nos torna coletivamente menos informados sobre o futuro que estamos construindo. base do navegador. cursor. exa. modal. Morph. e inúmeros outros. Vamos fazer mais desses. você pode construir uma grande empresa criando ferramentas e arreios poderosos para agentes que refletem as tarefas de alto valor que as pessoas desejam que os modelos realmente façam. tenha elementos abertos para experimentar livremente e elementos hospedados por trás de uma API. Cobrar por uso com alguns recursos premium do Enterprise. construa o melhor clone do Excel em forma de LLM, ou clone figma, ou clone turbotax. Altere-o apenas o suficiente para evitar uma ação judicial e, em seguida, deixe os clientes privados verem a versão mais robusta da ação judicial. Desfrute de uma competição saudável na arena e encontre maneiras de fazer parceria onde for importante. encontre seu ângulo e seja tão bom que você possa vender para todos, seja para RL ou para uso real. Atinja a massa crítica e seja tão acessível que não vale a pena para ninguém tentar reconstruir o que você já fez. Esta é a linha do tempo em que espero que acabemos. É um mundo onde os grandes laboratórios ainda podem se sair muito bem e provavelmente oferecerão as maneiras mais fáceis de gastar um pouco mais para obter um melhor desempenho geral. Mas também é aquele em que os modelos de código aberto não ficam muito atrás, e todos que se importam o suficiente podem basicamente ver o que está acontecendo e entender como os modelos que usamos são realmente treinados. Se você está pensando em iniciar ou ingressar em uma empresa focada em ambientes de RL, recomendo que pense em qual linha do tempo está apostando implicitamente e reflita sobre como se sente sobre isso.
126,14K