ho davvero apprezzato questo documento di openai su come le persone usano chatgpt. la domanda per l'inferenza continuerà a esplodere nei prossimi 1-2 anni. è chiaro che una quota significativa di essa richiederà accesso in tempo reale al web. oggi, le opzioni che hanno le aziende di intelligenza artificiale sono: estrarre dati da google, estrarre dati da bing (che ha ucciso la loro api), o riordinare i risultati di ricerca memorizzati/estratti con reti neurali (alcuni startup lo stanno facendo). nessuna di queste opzioni scala realmente. oggi, Grass è utilizzato dalle aziende per fornire incredibili quantità di dati di addestramento (2-3 petabyte al giorno), la maggior parte dei quali è multimodale. poiché la domanda di calcolo per l'inferenza capovolge l'addestramento, ci aspettiamo che la stessa infrastruttura utilizzata per raccogliere dati di addestramento venga utilizzata per il Recupero di Contesto Live.