Давайте создадим агент автоматизации браузера с использованием gpt-oss (100% локально):
Браузер по-прежнему является самым универсальным интерфейсом с 4,3 миллиарда страниц, посещаемых каждый день! Вот быстрая демонстрация того, как мы можем полностью автоматизировать это! Технологический стек: - @stagehanddev открытая автоматизация браузера на базе ИИ - @crewAIInc для оркестрации - @ollama для запуска gpt-oss Поехали!🚀
Обзор системы: - Пользователь вводит запрос на автоматизацию. - Агент планирования создает план автоматизации. - Агент автоматизации браузера выполняет его с помощью инструмента Stagehand. - Агент ответа генерирует ответ. Теперь давайте погрузимся в код!
1️⃣ Определите LLM Мы используем три LLM: - Планировщик LLM: Создает структурированный план для задачи автоматизации. - Автоматизация LLM: Выполняет план с помощью инструмента Stagehand. - Ответ LLM: Синтезирует окончательный ответ. Посмотрите это 👇
2️⃣ Определите агента планировщика автоматизации Агент планировщика получает задачу автоматизации от пользователя и создает структурированный макет для выполнения агентом браузера. Посмотрите это 👇
3️⃣ Определите инструмент браузера Stagehand Пользовательский инструмент CrewAI использует ИИ для взаимодействия с веб-страницами. Он использует агентские возможности Stagehand для автономной навигации по URL, выполнения действий на странице и извлечения данных для ответов на вопросы. Посмотрите это 👇
4️⃣ Определите Агент Автоматизации Браузера Агент Автоматизации Браузера использует упомянутый инструмент Stagehand для автономного управления браузером и выполнения планов. Посмотрите это 👇
5️⃣ Определите Агент Синтеза Ответов Агент Синтеза выполняет функцию окончательного контроля качества, уточняя вывод от агента автоматизации браузера для генерации отшлифованного ответа. Посмотрите это 👇
6️⃣ Создайте поток Agentic CrewAI Наконец, мы соединяем наших агентов в рамках рабочего процесса, используя потоки CrewAI. Проверьте это 👇
Готово! Давайте посмотрим, как работает наш многоагентный браузерный автоматизированный рабочий процесс! 🚀 Проверьте это 👇
Вы можете найти весь код и все, что вам нужно, в репозитории GitHub, указанном ниже. Посмотрите это 👇
Чтобы подвести итог, вот обзор системы для вашего сведения: - Пользователь вводит запрос на автоматизацию. - Агент планирования создает план автоматизации. - Агент автоматизации браузера выполняет его с помощью инструмента Stagehand. - Агент ответа генерирует ответ. Проверьте это👇
Если вы нашли это полезным, поделитесь с вашей сетью. Найдите меня → @akshay_pachaar ✔️ Для получения дополнительных сведений и учебных материалов по LLM, AI-агентам и машинному обучению!
Akshay 🚀
Akshay 🚀10 авг., 20:51
Давайте создадим агент автоматизации браузера с использованием gpt-oss (100% локально):
86,27K