Представляем Husky Hold’em Bench, первый оценочный инструмент для покерных ботов на ОС!
В последнее время мы видели много отличной работы в ОС по оценке LLM на стратегическом игровом процессе.
Вот еще один с изюминкой: модель не может напрямую выбирать свои действия, а вместо этого должна реализовать свою политику на python в условиях временных и памятьных ограничений, которые исключают методы грубой силы и таблицы поиска.
Затем мы ставим ботов друг против друга в формате кругового турнира на 6 игроков со всеми комбинациями. Как показывают себя некоторые из ведущих моделей рассуждений?
Представляем Husky Hold’em Bench, первый оценочный инструмент для покерных ботов на ОС!
В последнее время мы видели много отличной работы в ОС по оценке LLM на стратегическом игровом процессе.
Вот еще один с изюминкой: модель не может напрямую выбирать свои действия, а вместо этого должна реализовать свою политику на python в условиях временных и памятьных ограничений, которые исключают методы грубой силы и таблицы поиска.
Затем мы ставим ботов друг против друга в формате кругового турнира на 6 игроков со всеми комбинациями. Как показывают себя некоторые из ведущих моделей рассуждений?
Hermes-4-14B был выпущен!
Наш самый компактный LLM из серии Hermes 4 может использоваться локально и оптимизирован для потребительского оборудования, предоставляя доступ к его мощному гибридному рассуждению и вызову инструментов прямо у вас дома.
Модель теперь доступна в Nous Chat для онлайн-использования и может быть загружена на HuggingFace.