Hãy xây dựng một Đại lý Tự động hóa Trình duyệt sử dụng gpt-oss (100% địa phương):
Trình duyệt vẫn là giao diện phổ biến nhất với 4,3 tỷ trang được truy cập mỗi ngày! Dưới đây là một bản demo nhanh về cách chúng ta có thể tự động hóa hoàn toàn điều này! Công nghệ: - @stagehanddev tự động hóa trình duyệt AI mã nguồn mở - @crewAIInc để điều phối - @ollama để chạy gpt-oss Đi nào!🚀
Tổng quan hệ thống: - Người dùng nhập một truy vấn tự động hóa. - Đại lý lập kế hoạch tạo ra một kế hoạch tự động hóa. - Đại lý tự động hóa trình duyệt thực hiện nó bằng cách sử dụng công cụ Stagehand. - Đại lý phản hồi tạo ra một phản hồi. Bây giờ, hãy cùng khám phá mã nguồn!
1️⃣ Định nghĩa LLM Chúng tôi sử dụng ba LLM: - LLM Lập kế hoạch: Tạo một kế hoạch có cấu trúc cho một nhiệm vụ tự động hóa. - LLM Tự động hóa: Thực hiện kế hoạch bằng cách sử dụng công cụ Stagehand. - LLM Phản hồi: Tổng hợp phản hồi cuối cùng. Xem cái này 👇
2️⃣ Định nghĩa Đại lý Lập kế hoạch Tự động hóa Đại lý lập kế hoạch nhận một nhiệm vụ tự động hóa từ người dùng và tạo ra một bố cục có cấu trúc để thực hiện bởi đại lý trình duyệt. Xem cái này 👇
3️⃣ Định nghĩa Công cụ Trình duyệt Stagehand Một công cụ CrewAI tùy chỉnh sử dụng AI để tương tác với các trang web. Nó tận dụng khả năng tác động của Stagehand để tự động điều hướng các URL, thực hiện các hành động trên trang và trích xuất dữ liệu để trả lời các câu hỏi. Xem cái này 👇
4️⃣ Định nghĩa Đại lý Tự động hóa Trình duyệt Đại lý Tự động hóa Trình duyệt sử dụng công cụ Stagehand đã đề cập ở trên để kiểm soát trình duyệt tự động và thực hiện kế hoạch. Xem cái này 👇
5️⃣ Định nghĩa Đại lý Tổng hợp Phản hồi Đại lý Tổng hợp hoạt động như kiểm soát chất lượng cuối cùng, tinh chỉnh đầu ra từ đại lý tự động hóa trình duyệt để tạo ra một phản hồi hoàn thiện. Xem cái này 👇
6️⃣ Tạo luồng Agentic CrewAI Cuối cùng, chúng ta kết nối các Đại lý của mình trong một quy trình làm việc bằng cách sử dụng Luồng CrewAI. Kiểm tra điều này 👇
Xong rồi! Hãy xem quy trình tự động hóa trình duyệt đa tác nhân của chúng ta hoạt động như thế nào! 🚀 Kiểm tra cái này 👇
Bạn có thể tìm thấy tất cả mã nguồn và mọi thứ bạn cần trong Kho lưu trữ GitHub được chia sẻ bên dưới. Hãy xem cái này 👇
Để tóm tắt, đây là cái nhìn tổng quan về hệ thống để bạn tham khảo: - Người dùng nhập một truy vấn tự động hóa. - Đại lý lập kế hoạch tạo ra một kế hoạch tự động hóa. - Đại lý tự động hóa trình duyệt thực hiện nó bằng cách sử dụng công cụ Stagehand. - Đại lý phản hồi tạo ra một phản hồi. Kiểm tra cái này👇
Nếu bạn thấy nội dung này hữu ích, hãy chia sẻ lại với mạng lưới của bạn. Tìm tôi → @akshay_pachaar ✔️ Để biết thêm thông tin chi tiết và hướng dẫn về LLMs, AI Agents, và Machine Learning!
Akshay 🚀
Akshay 🚀20:51 10 thg 8
Hãy xây dựng một Đại lý Tự động hóa Trình duyệt sử dụng gpt-oss (100% địa phương):
86,27K