Există vreun loc de joacă sau echivalent pentru a vedea utilizarea instrumentelor / performanța agentică a diferitelor modele? Vreau în esență să-i dau 5 instrumente și solicitarea mea obișnuită Iar locul de joacă generează ~5-10 cutii și rulează toate modelele selectate Și apoi observ + schimb model, prompt
4,77K