互聯網對於訓練網頁代理來說是一個不理想的教室。 在實時網站上的每一次點擊都會消耗時間並且有被禁止的風險。這篇研究論文指出了一條不同的道路,通過在一個理想化的網絡版本上訓練代理。 它使用預測模型來學習網站如何對點擊按鈕或提交表單等行為作出反應。然後,代理在腦中進行瀏覽會話以進行練習。 這種排練是在不接觸真實網站的情況下進行的.. 而且似乎在代理上線後能夠轉化為更強的表現。 dynaweb的數據顯示,webarena上有16%的相對改善,並且在webvoyager上有新的最先進結果。 我們會看到每個主要企業工具都有特定領域的模擬器嗎? 鏈接:arxiv. org/pdf/2601.22149v1