Wir machen Roboter leistungsfähiger als je zuvor in der physischen Welt. 🤖 Gemini Robotics 1.5 ist ein verbessertes agentisches System, das besser argumentieren, vorausplanen, digitale Werkzeuge wie @Google Search nutzen, mit Menschen interagieren und vieles mehr kann. So funktioniert es 🧵
Viele unserer täglichen Aktivitäten erfordern viele Schritte, um sie abzuschließen, und können für Roboter äußerst herausfordernd sein. Stellen Sie sich vor, Sie fragen: „Kannst du basierend auf meinem Standort diese Objekte in die richtigen Kompost-, Recycling- und Mülltonnen sortieren?“ 🗑️ Der Roboter muss im Internet nach lokalen Richtlinien suchen, die Objekte betrachten, herausfinden, wie man sie sortiert, und dann die Aufgabe abschließen. ↓
Um diese Anfragen zu bewältigen, kann Gemini Robotics 1.5 neue agentische Anwendungen mit zwei Schlüssel-AI-Modellen, die zusammenarbeiten, unterstützen: 🔹Gemini Robotics-ER 1.5: Dies fungiert als das hochrangige Gehirn, interagiert mit Menschen, versteht seine Umgebung, orchestriert Werkzeuge und erstellt einen detaillierten Plan zur Durchführung einer Aufgabe. 🔹Gemini Robotics 1.5: Dies ist verantwortlich für die Ausführung, indem es Anweisungen in präzise Motorbefehle übersetzt, die benötigt werden, damit der Roboter sich bewegt und allgemein handelt.
Gemini Robotics-ER 1.5 ist das erste Denkmodell, das für verkörpertes Denken optimiert ist, und erzielt erstklassige Leistungen bei akademischen und internen Benchmarks. 🧠 Sein Verständnis der realen Welt macht es zu einem perfekten hochrangigen Orchestrator für Roboter. Sehen Sie, wie es dabei hilft, einen geschäftigen Schreibtisch zu organisieren ↓
Traditionell übersetzen VLA-Modelle Anweisungen direkt in robotische Bewegungen. 🦾 Gemini Robotics 1.5 kann jetzt nachdenken, bevor es handelt, und eine interne Abfolge von Überlegungen in natürlicher Sprache generieren. Dies macht die Roboteraktionen interpretierbarer und ermöglicht nützlichere Aufgaben - wie das Organisieren von Wäsche nach Farbe. ↓
Was passiert, wenn du dem Roboter sagst, er solle „einen Koffer für meine Reise nach London packen“? 🧳 Er kann das Wetter nachschlagen, darüber nachdenken, was er einpacken soll, wo er es herbekommt und wie er es packt. In diesem Prozess kann das Modell lange Aufgaben in einfachere zerlegen und sich an Veränderungen in seiner Umgebung anpassen. ↓
Roboter kommen in allen Formen und Größen, mit unterschiedlichen Formen, Sensorik und Freiheitsgraden. 💡 Gemini Robotics 1.5 kann über verschiedene Ausführungen lernen und kann Wissen, das von einem Roboter erlernt wurde, auf einen anderen übertragen, ohne dass eine Spezialisierung erforderlich ist.
Wir bewegen uns jetzt über Modelle hinaus, die auf einzelne Anweisungen reagieren, und schaffen Systeme, die Probleme auf eine allgemeine Weise wirklich angehen können - auf dem Weg zur Lösung von AGI in der physischen Welt. Entwickler können jetzt Gemini Robotics-ER 1.5 über die Gemini API in @GoogleAIStudio nutzen. Erfahren Sie mehr →
318,64K