la búsqueda en cuadrícula para encontrar configuraciones óptimas de núcleo en intervalos de potencias de 2 + la coincidencia más cercana para los recuentos de tokens intermedios conduce a configuraciones subóptimas para algunos recuentos de tokens no es el fin del mundo, pero sería bueno tener un modelo de recursos para seleccionar la configuración óptima sin una búsqueda costosa