PUMP la vendita pubblica è finita, inizialmente avevo investito molto su Bybit, lasciando solo 1/2 sulla catena, alla fine solo quello sulla catena ha avuto successo, per fortuna non ho coperto in anticipo... A proposito, recentemente nella comunità AI molte persone stanno discutendo di VLA (Vision‑Language‑Action) Ho fatto una ricerca sui progetti sulla catena per vedere se qualcuno stava lavorando su VLA, e ho visto questo progetto CodecFlow @Codecopenflow, ho comprato un po'. == Cosa fa il progetto CodecFlow == Una breve introduzione a VLA, VLA è un'architettura di modello che consente all'AI non solo di "parlare", ma anche di "fare". I tradizionali LLM (come GPT) possono solo comprendere il linguaggio e fornire suggerimenti, ma non possono eseguire azioni, non possono cliccare sullo schermo, non possono afferrare oggetti. Il modello VLA significa integrare tre grandi capacità: 1. Visione: comprendere immagini, screenshot, input della fotocamera o dati dei sensori 2. Linguaggio: comprendere i comandi in linguaggio naturale degli esseri umani 3. Azione: generare comandi eseguibili, come clic del mouse, input da tastiera, controllo di bracci meccanici CodecFlow sta lavorando su VLA sulla catena, tutti i processi operativi possono essere registrati sulla catena, auditabili, verificabili e liquidabili. In breve, è l'infrastruttura di base per un "robot AI". == Perché ho prestato particolare attenzione a questo progetto? == Ho scoperto che i loro sviluppatori sono i principali contributori del progetto open source LeRobot, il più popolare nel campo VLA! LeRobot è la base di alto livello per costruire modelli VLA nel mondo open source, inclusi SmolVLA e altri modelli leggeri che possono funzionare su laptop. Questo significa che questo team comprende davvero l'architettura VLA e i robot. Ho visto che continuano a costruire, il prezzo della moneta è anche stabilmente in aumento, io stesso sono molto ottimista sul settore VLA, e guardando la tendenza generale, VLA e i robot sono sicuramente il futuro nel mercato. • I giganti del Web2 (Google, Meta, Tesla) si sono attualmente impegnati a fondo nella formazione di VLA e robot; • Ci sono pochi progetti Web3 che possono eseguire applicazioni VLA, e sono molto rari • VLA ha l'opportunità di esprimere un enorme valore in scenari come DePIN, automazione web, esecuzione di agenti AI sulla catena. CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Fai sempre le tue ricerche.
CodecFlow
CodecFlow26 giu 2025
Che cos'è un operatore $CODEC? È qui che i modelli di visione-linguaggio-azione rendono finalmente l'intelligenza artificiale utile per il lavoro reale. Un operatore è un agente software autonomo alimentato da modelli VLA che esegue attività attraverso un ciclo continuo di percezione-ragione-azione. Gli LLM possono pensare e parlare brillantemente, ma non possono puntare, cliccare o afferrare nulla. Sono puri motori di ragionamento senza alcun fondamento nel mondo fisico. I VLA combinano la percezione visiva, la comprensione del linguaggio e l'output di azioni strutturate in un unico passaggio in avanti. Mentre un LLM descrive ciò che dovrebbe accadere, un modello VLA lo fa effettivamente accadere emettendo coordinate, segnali di controllo e comandi eseguibili. Il flusso di lavoro dell'operatore è: - Percezione: acquisisce schermate, feed della telecamera o dati del sensore. - Ragionamento: elabora le osservazioni insieme alle istruzioni in linguaggio naturale utilizzando il modello VLA. - Azione: esegue le decisioni attraverso le interazioni dell'interfaccia utente o il controllo hardware, il tutto in un unico ciclo continuo. Esempi: LLM vs. operatore alimentato dal modello VLA Pianificazione di una riunione LLM: fornisce una spiegazione dettagliata della gestione del calendario, delineando i passaggi per programmare una riunione. Operatore con modello VLA: - Acquisisce il desktop dell'utente. - Identifica l'applicazione del calendario (ad esempio, Outlook, Google Calendar). - Passa al giovedì, crea una riunione alle 14:00 e aggiunge i partecipanti. - Si adatta automaticamente alle modifiche dell'interfaccia utente. Robotica: smistamento di oggetti LLM: genera istruzioni scritte precise per l'ordinamento degli oggetti, come l'identificazione e l'organizzazione dei componenti rossi. Operatore con modello VLA: - Osserva lo spazio di lavoro in tempo reale. - Identifica i componenti rossi tra gli oggetti misti. - Pianifica traiettorie prive di collisioni per un braccio robotico. - Esegue operazioni di pick-and-place, adattandosi dinamicamente a nuove posizioni e orientamenti. I modelli VLA colmano finalmente il divario tra l'IA che può ragionare sul mondo e l'IA che può effettivamente cambiarlo. Sono loro che trasformano l'automazione da fragile rispetto delle regole a risoluzione adattiva dei problemi: lavoratori intelligenti. "Gli script tradizionali si interrompono quando l'ambiente cambia, ma gli operatori utilizzano la comprensione visiva per adattarsi in tempo reale, gestendo le eccezioni invece di bloccarsi".
11,23K