Uma startup de 6 pessoas com $500k acaba de superar a Microsoft! O MLE-Bench da OpenAI é um benchmark que testa agentes em tarefas de engenharia de Machine Learning. NEO @withneo, o primeiro agente MLE autônomo, obteve 34,2% contra 22,4% da Microsoft no benchmark. Isto é enorme!
5,75K