Laten we een Browser Automation Agent bouwen met gpt-oss (100% lokaal):
De browser is nog steeds de meest universele interface met 4,3 miljard pagina's die elke dag worden bezocht! Hier is een snelle demo van hoe we dit volledig kunnen automatiseren! Technische stack: - @stagehanddev open-source AI browserautomatisering - @crewAIInc voor orkestratie - @ollama om gpt-oss uit te voeren Laten we gaan!🚀
Systeemoverzicht: - Gebruiker voert een automatiseringsquery in. - Planner Agent maakt een automatiseringsplan aan. - De Browser Automation Agent voert het uit met behulp van de Stagehand-tool. - De Response Agent genereert een antwoord. Laten we nu de code induiken!
1️⃣ Definieer LLM We gebruiken drie LLM's: - Planner LLM: Maakt een gestructureerd plan voor een automatiseringstaak. - Automation LLM: Voert het plan uit met behulp van de Stagehand-tool. - Response LLM: Synthesiseert de uiteindelijke reactie. Bekijk dit 👇
2️⃣ Definieer Automatiseringsplanner Agent De planner agent ontvangt een automatiseringstaak van de gebruiker en creëert een gestructureerde lay-out voor uitvoering door de browseragent. Bekijk dit 👇
3️⃣ Definieer Stagehand Browser Tool Een op maat gemaakt CrewAI-tool maakt gebruik van AI om te interageren met webpagina's. Het benut de agentische mogelijkheden van Stagehand om autonoom URL's te navigeren, pagina-acties uit te voeren en gegevens te extraheren om vragen te beantwoorden. Bekijk dit 👇
4️⃣ Definieer Browser Automatiseringsagent Browser Automatiseringsagent maakt gebruik van de eerder genoemde Stagehand-tool voor autonome browsercontrole en uitvoering van plannen. Bekijk dit 👇
5️⃣ Definieer Reactie Synthese Agent De Synthese Agent fungeert als de laatste kwaliteitscontrole, waarbij de output van de browserautomatiseringsagent wordt verfijnd om een gepolijste reactie te genereren. Bekijk dit 👇
6️⃣ Maak CrewAI Agentic Flow Ten slotte verbinden we onze Agents binnen een workflow met CrewAI Flows. Bekijk dit 👇
Klaar! Laten we onze multi-agent browserautomatiseringsworkflow in actie zien! 🚀 Bekijk dit 👇
Je kunt alle code en alles wat je nodig hebt vinden in de hieronder gedeelde GitHub-repository. Bekijk dit 👇
Om samen te vatten, hier is het systeemoverzicht ter referentie: - Gebruiker voert een automatiseringsquery in. - Planner Agent maakt een automatiseringsplan aan. - De Browser Automation Agent voert het uit met behulp van de Stagehand-tool. - De Response Agent genereert een antwoord. Bekijk dit👇
Als je het inzichtelijk vond, deel het dan opnieuw met je netwerk. Vind me → @akshay_pachaar ✔️ Voor meer inzichten en tutorials over LLM's, AI Agents en Machine Learning!
Akshay 🚀
Akshay 🚀10 aug, 20:51
Laten we een Browser Automation Agent bouwen met gpt-oss (100% lokaal):
86,27K