Ahora que hemos superado un gran obstáculo, demostrando que el entrenamiento descentralizado de IA es posible, este conocimiento nos lleva a la siguiente etapa de pensar sobre el papel de la pila de IA descentralizada de inferencia. Dado que las redes pueden producir modelos, la inferencia descentralizada se vuelve *mucho* más interesante. ¿Por qué? Bueno, la inferencia previamente descentralizada significaba poder tomar una red d y servir resultados del modelo. Los modelos eran modelos tradicionales de código abierto o cerrado. Y el nombre del juego era reducir los costos para que el cliente prefiriera una inferencia d en lugar de una normal. Pero esto es problemático en la inferencia d, porque la d- en realidad hace que la inferencia sea más costosa (con algunas soluciones especulativas, la más emocionante es el subsidio). Sin embargo, si sabemos que las redes pueden producir y poseer colectivamente modelos, entonces la inferencia se convierte en el punto en el que se generan los ingresos. Los clientes *deben* ir a la red para obtener resultados del modelo, por lo que muchos esquemas de tokenización dependerán de esta instalación. Por ejemplo, si desea tokenizar modelos de deAI, deberá redirigir el flujo de ingresos de inferencia a los titulares de tokens. La inferencia descentralizada es un área interesante en la que pensar, pero se convierte en un área *crítica* cuando nos sentamos a construir los modelos de tokens del espacio deAI.