La búsqueda en cuadrícula para encontrar configuraciones óptimas del núcleo en intervalos POW2 + la coincidencia más cercana para el número de tokens entre medias conduce a configuraciones subóptimas para algunos recuentos de tokens No es el fin del mundo, pero sería bueno tener un modelo de recursos para seleccionar la configuración óptima sin buscar caro