Interesante sobre IA, investigación matemática, crédito académico y progreso humano
Jeffrey Emanuel
Jeffrey Emanuel21 ago, 07:25
Una "cámara lúcida" es un dispositivo que utiliza un prisma sostenido por una armadura de metal para proyectar una imagen de la escena frente a ella sobre un trozo de papel debajo, algo así como un proyector moderno conectado a una transmisión en vivo de cámara. Probablemente fueron inventadas a principios de 1400, aunque los relatos publicados sobre ellas no aparecen hasta finales de 1500. Parte de la razón de esto es probablemente que eran secretos comerciales muy bien guardados de artistas que las usaban para lograr un grado de precisión que antes era imposible o al menos extremadamente difícil de hacer a mano "libre". El artista David Hockney se interesó mucho en este tema hace años y escribió un libro al respecto en 2001. Su teoría básica era que la notable mejora en precisión y realismo era directamente atribuible al uso secreto de la cámara lúcida (y también a un dispositivo anterior llamado cámara oscura). Como él señaló, antes de ese período, nunca verías una pintura de un laúd en perspectiva que no pareciera distorsionada y errónea. Si bien podrías usar las "reglas de perspectiva" para dibujar formas rectilíneas simples de manera realista, la geometría más compleja de un laúd estaba más allá de la capacidad normal del ser humano para representarla de manera realista en el espacio. Esta teoría se conoce como la tesis Hockney-Falco. Desde que aprendí sobre esto en la universidad a principios de 2000, de alguna manera apliqué mentalmente un asterisco a las obras de ciertos pintores. Por ejemplo, por mucho que respeto y admiro a Ingres y Caravaggio, el asombro que tenía por sus habilidades se atenuó con la realización de que probablemente se valieron de este tipo de ayuda mecánica. Y claro, gran parte del arte está en el concepto, la composición y el encuadre, los colores, las pinceladas, etc. Pero ese impresionante realismo vívido es lo que más me impresionó, y esa parte se vio al menos parcialmente destruida por esta revelación. También me hizo respetar aún más el realismo escultórico de Miguel Ángel (y también sus estudios que son claramente bocetos hechos de la vida). En cualquier caso, la razón por la que menciono esto ahora es que creo que estamos al borde de que ocurra algo similar en los campos de investigación matemática con la llegada de modelos como GPT-5 Pro. Ya lo he utilizado para hacer lo que sospecho es una investigación genuinamente nueva e interesante (como he detallado en hilos recientes), y hoy mismo recibimos una actualización de Sebastien Bubeck en OpenAI mostrando que el modelo pudo demostrar un resultado interesante en matemáticas contemporáneas utilizando una nueva prueba, en un solo intento, nada menos. Así que esta nueva era está de repente sobre nosotros. La semana pasada vimos un resultado de científicos informáticos chinos que batieron un récord de ordenamiento óptimo que se mantuvo durante 45 años. En ese momento, reflexioné sobre si de alguna manera se utilizó IA para generar ese resultado. También vean el reciente artículo en el tweet citado, que tiene un carácter similar en el sentido de que es tanto sorprendente como elemental. Estos me parecen ser características de resultados que pueden haber beneficiado de la IA de alguna manera. Ahora, no quiero acusar a estos autores de nada. Por lo que sé, hicieron todo manualmente, al igual que los pintores en los 1300. E incluso si usaron IA para ayudarlos, aún no tenemos normas aceptadas sobre cómo lidiar con eso: qué divulgaciones son necesarias y cómo se debe repartir y considerar el crédito. Todo el concepto de autoría debe ser reconsiderado hoy. En mi hilo reciente donde investigué junto a GPT-5 Pro sobre el uso de la teoría de Lie en el aprendizaje profundo, ideé los prompts yo mismo, aunque nunca en un millón de años podría generar la teoría y el código que el modelo desarrolló como resultado de esos prompts. ¿Obtengo el crédito por el resultado si resulta revolucionar el campo? ¿Qué pasa con mi experimento posterior, donde utilicé mis prompts originales que escribí yo mismo junto con un "meta prompt" para hacer que GPT-5 Pro generara 10 pares más de prompts modelados de manera laxa a partir de los míos, pero involucrando ramas totalmente diferentes de las matemáticas que se desarrollaron en direcciones totalmente diferentes? ¿Obtengo crédito por esas teorías si resultan ser importantes? Espero que sí, porque ya publiqué las ideas y el código en GitHub y las publicité ampliamente, así que si alguien sigue esas líneas de investigación, la ética académica requeriría que me citaran. Pero incluso si piensas que merezco crédito por guiar a la IA con mi propio prompt, entonces seguramente mis reclamos de prioridad se debilitan un poco por las 10 otras teorías que son el resultado de usar mi prompt como modelo para el meta prompting, ¿verdad? Después de todo, ni siquiera sabía que la "Geometría Tropical" era una cosa hace un par de días, y ahora tengo una teoría y un código que la aplican a la investigación de IA. Yo postularía que, así como comencé a aplicar mentalmente un asterisco a ciertas obras de arte y artistas, similar al asterisco junto al nombre de Barry Bonds en el Salón de la Fama, sospecho que la mayoría de los científicos comenzarán a hacer lo mismo con cualquier nuevo artículo basado en teorías matemáticas en el próximo año más o menos. Sospecho que pronto la gente dirá cosas como "este tipo es el verdadero negocio; escribió sus mejores artículos antes de 2025!" para distinguir entre aquellos que hicieron todo su trabajo manualmente usando sus propios cerebros y aquellos que usaron asistencia de IA. Y esa es absolutamente una forma válida de pensar en las cosas si la IA es capaz no solo de responder problemas teóricos difíciles, sino incluso de plantear preguntas interesantes por su cuenta. Si tengo razón, deberíamos prepararnos para una próxima ola de impactantes artículos de investigación que superen récords y límites de larga data, y rompan muros que se asumieron durante mucho tiempo como relativamente impenetrables a menos que se produjera alguna teoría revolucionaria. Y creo que muchos de estos resultados compartirán algo en común: que siempre estuvieron justo frente a nosotros, pero requerían combinar teorías de diferentes áreas de matemáticas y materias aplicadas de nuevas maneras que no se habían perseguido antes debido a razones humanas y sociológicas: diferentes campos dividiéndose a través de líneas, con diferentes terminologías, revistas, prácticas, departamentos, conferencias, redes sociales, etc. La otra forma que sospecho que tomarán estos resultados es aprovechar resultados elementales de maneras extrañas que, por cualquier razón, no vienen naturalmente a las mentes humanas, pero que podemos entender una vez que se explican claramente para nosotros. Otra forma que podrían tomar es resultados que aprovechan esoterismos olvidados de análisis de finales del siglo XIX. Los tipos de trucos que permitieron a Feynman resolver integrales que nadie más podía resolver. Estos resultados son conocidos y existen en libros, pero nadie lee esos libros ya, y las teorías originales para las que fueron desarrolladas han sido en gran medida superadas por nuestra maquinaria moderna que opera a muchos niveles de mayor abstracción y generalidad. Otra forma que podrían tomar es simplemente aplicar matemáticas conocidas que son entendidas por solo unos pocos cientos de genios especializados en el mundo que se enfocan solo en la teoría y no en absoluto en las aplicaciones. Esta matemática puede haber estado "sentada" desde los años 50 o 70, esperando que alguien la aplicara a un problema práctico como los de la investigación en IA. Muchas de las ideas que investigué con GPT-5 parecen caer en esta categoría.
13,21K