Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Давайте создадим агент автоматизации браузера с использованием gpt-oss (100% локально):
Браузер по-прежнему является самым универсальным интерфейсом с 4,3 миллиарда страниц, посещаемых каждый день!
Вот быстрая демонстрация того, как мы можем полностью автоматизировать это!
Технологический стек:
- @stagehanddev открытая автоматизация браузера на базе ИИ
- @crewAIInc для оркестрации
- @ollama для запуска gpt-oss
Поехали!🚀
Обзор системы:
- Пользователь вводит запрос на автоматизацию.
- Агент планирования создает план автоматизации.
- Агент автоматизации браузера выполняет его с помощью инструмента Stagehand.
- Агент ответа генерирует ответ.
Теперь давайте погрузимся в код!
1️⃣ Определите LLM
Мы используем три LLM:
- Планировщик LLM: Создает структурированный план для задачи автоматизации.
- Автоматизация LLM: Выполняет план с помощью инструмента Stagehand.
- Ответ LLM: Синтезирует окончательный ответ.
Посмотрите это 👇

2️⃣ Определите агента планировщика автоматизации
Агент планировщика получает задачу автоматизации от пользователя и создает структурированный макет для выполнения агентом браузера.
Посмотрите это 👇

3️⃣ Определите инструмент браузера Stagehand
Пользовательский инструмент CrewAI использует ИИ для взаимодействия с веб-страницами.
Он использует агентские возможности Stagehand для автономной навигации по URL, выполнения действий на странице и извлечения данных для ответов на вопросы.
Посмотрите это 👇

4️⃣ Определите Агент Автоматизации Браузера
Агент Автоматизации Браузера использует упомянутый инструмент Stagehand для автономного управления браузером и выполнения планов.
Посмотрите это 👇

5️⃣ Определите Агент Синтеза Ответов
Агент Синтеза выполняет функцию окончательного контроля качества, уточняя вывод от агента автоматизации браузера для генерации отшлифованного ответа.
Посмотрите это 👇

6️⃣ Создайте поток Agentic CrewAI
Наконец, мы соединяем наших агентов в рамках рабочего процесса, используя потоки CrewAI.
Проверьте это 👇

Готово! Давайте посмотрим, как работает наш многоагентный браузерный автоматизированный рабочий процесс! 🚀
Проверьте это 👇

Вы можете найти весь код и все, что вам нужно, в репозитории GitHub, указанном ниже.
Посмотрите это 👇
Чтобы подвести итог, вот обзор системы для вашего сведения:
- Пользователь вводит запрос на автоматизацию.
- Агент планирования создает план автоматизации.
- Агент автоматизации браузера выполняет его с помощью инструмента Stagehand.
- Агент ответа генерирует ответ.
Проверьте это👇
Если вы нашли это полезным, поделитесь с вашей сетью.
Найдите меня → @akshay_pachaar ✔️
Для получения дополнительных сведений и учебных материалов по LLM, AI-агентам и машинному обучению!

10 авг., 20:51
Давайте создадим агент автоматизации браузера с использованием gpt-oss (100% локально):
86,27K
Топ
Рейтинг
Избранное