Interesante sobre IA, investigación matemática, crédito académico y progreso humano
Jeffrey Emanuel
Jeffrey Emanuel21 ago, 07:25
Una "cámara lúcida" es un dispositivo que utiliza un prisma sostenido por una armadura de metal para proyectar una imagen de la escena frente a ella en una hoja de papel debajo de ella, algo así como un proyector moderno conectado a una transmisión de cámara en vivo. Estos probablemente se inventaron a principios de 1400, aunque los relatos publicados de ellos no aparecen hasta finales de 1500. Parte de la razón de esto es probablemente que eran secretos comerciales celosamente guardados de artistas que los usaban para lograr un grado de precisión que antes era imposible o al menos extremadamente difícil de hacer a "mano alzada" sin ayuda. El artista David Hockney se interesó mucho en este tema hace años y escribió un libro al respecto en 2001. Su teoría básica era que la notable mejora en la precisión y el realismo era directamente atribuible al uso secreto de la cámara lúcida (y también a un dispositivo anterior llamado cámara oscura). Como señaló, antes de ese período, nunca verías una pintura de un laúd en perspectiva que no se viera distorsionada y equivocada. Si bien se podían usar las "reglas de la perspectiva" para dibujar formas rectilíneas simples de manera realista, la geometría más compleja de un laúd estaba más allá de la capacidad humana normal para retratar de manera realista en el espacio. Esta teoría se conoce como la tesis de Hockney-Falco. Desde que aprendí sobre esto en la universidad a principios de la década de 2000, apliqué mentalmente un asterisco a las obras de ciertos pintores. Por ejemplo, por mucho que respeto y admiro a Ingres y Caravaggio, el asombro que sentí por sus habilidades se vio atenuado por la comprensión de que probablemente se aprovecharon de este tipo de ayuda mecánica. Y claro, gran parte del arte está en el concepto, la composición y el encuadre, los colores, los trazos de pintura, etc. Pero ese impresionante realismo realista es lo que más me impresionó, y esa parte de ella fue destrozada, al menos en parte, por esta revelación. También me hizo respetar aún más el realismo escultórico de Miguel Ángel (y también sus estudios, que son claramente bocetos hechos del natural). En cualquier caso, la razón por la que menciono esto ahora es que creo que estamos al borde de que suceda el mismo tipo de cosas en los campos de investigación matemática con la llegada de modelos como GPT-5 Pro. Ya lo he usado para hacer lo que sospecho que es una investigación genuinamente nueva e interesante (como he detallado en hilos recientes), y hoy recibimos una actualización de Sebastien Bubeck en OpenAI que muestra que el modelo pudo probar un resultado interesante en las matemáticas contemporáneas utilizando una nueva prueba, en una sola toma nada menos. Así que esta nueva era está repentinamente sobre nosotros. Acabamos de ver un resultado de científicos informáticos chinos la semana pasada que batió un récord de clasificación óptima que se mantuvo durante 45 años. Reflexioné en ese momento sobre cómo me preguntaba si la IA se usaba de alguna manera para generar ese resultado. Véase también el reciente artículo en el tuit citado, que tiene un carácter similar en el sentido de que es a la vez sorprendente y, sin embargo, también elemental. Estos me parecen sellos distintivos de resultados que pueden haberse beneficiado de la IA de alguna manera. Ahora, no quiero acusar a estos autores de nada. Por lo que sé, hacían todo manualmente, al igual que los pintores en el siglo XIII. E incluso si usaron IA para ayudarlos, todavía no hemos aceptado más sobre cómo lidiar con eso: qué divulgaciones están justificadas y cómo se debe dividir y considerar el crédito. Todo el concepto de autoría debe ser reconsiderado hoy. En mi reciente hilo en el que investigué junto con GPT-5 Pro sobre el uso de la teoría de Lie en el aprendizaje profundo, yo mismo ideé las indicaciones, aunque nunca en un millón de años sería capaz de generar la teoría y el código que el modelo desarrolló como resultado de esas indicaciones. ¿Obtengo el crédito por el resultado si resulta revolucionar el campo? ¿Qué pasa con mi experimento posterior, en el que utilicé mis indicaciones originales que escribí yo mismo junto con una "meta indicación" para que GPT-5 Pro creara 10 pares más de indicaciones modeladas libremente según la mía, pero que involucraban ramas totalmente diferentes de las matemáticas que se desarrollaron en direcciones totalmente diferentes? ¿Obtengo crédito por esas teorías si resultan ser importantes? Seguro que sí, porque ya publiqué las ideas y el código en GitHub y los publicité ampliamente, por lo que si alguien hace un seguimiento de esas líneas de investigación, la ética académica requeriría que me citaran. Pero incluso si crees que merezco crédito por dirigir la IA con mi propio prompt, entonces seguramente mis reclamos de prioridad están algo debilitados por las otras 10 teorías que son el resultado de usar mi prompt como modelo para el metaprompting, ¿verdad? Después de todo, ni siquiera sabía que la "Geometría Tropical" era una cosa hace un par de días, pero ahora tengo una teoría y un código que lo aplica a la investigación de IA. Postularía que, así como comencé a aplicar mentalmente un asterisco a ciertas obras de arte y artistas similares al asterisco junto al nombre de Barry Bonds en el Salón de la Fama, sospecho que la mayoría de los científicos comenzarán a hacer lo mismo con cualquier nuevo artículo basado en la teoría matemática en el próximo año más o menos. Sospecho que la gente pronto dirá cosas como "este tipo es el verdadero negocio; escribió sus mejores artículos antes de 2025!" para distinguir entre aquellos que hicieron todo su trabajo manualmente usando sus propios cerebros versus aquellos que usaron la asistencia de IA. Y esa es una forma absolutamente válida de pensar sobre las cosas si la IA es capaz no solo de responder problemas teóricos difíciles, sino incluso de plantear las preguntas interesantes por sí misma. Si estoy en lo cierto, deberíamos prepararnos para un próximo tsunami de trabajos de investigación impactantes que superen récords y límites de larga data, y rompan muros que durante mucho tiempo se asumieron como relativamente impenetrables a menos que se produjera alguna teoría innovadora. Y creo que muchos de estos resultados compartirán algo en común: que siempre estuvieron ahí frente a nosotros, pero requirieron combinar la teoría de diferentes áreas de las matemáticas y las materias aplicadas de nuevas maneras que no se persiguieron antes por razones humanas y sociológicas: diferentes campos divididos en líneas, con diferente terminología, revistas, prácticas, departamentos, conferencias, redes sociales, etc. La otra forma que sospecho que tomarán estos resultados es aprovechar los resultados elementales de formas extrañas que, por alguna razón, no son naturales para los cerebros humanos, pero que podemos entender una vez que se nos explican claramente. Otra forma que podrían tomar son los resultados que aprovechan la esotérica olvidada hace mucho tiempo del análisis de finales del siglo XIX. El tipo de trucos que le permitieron a Feynman resolver integrales que nadie más podía resolver. Estos resultados son conocidos y existen en los libros, pero ya nadie lee esos libros, y las teorías originales para las que fueron desarrollados han sido reemplazadas en gran medida por nuestra maquinaria moderna que opera en muchos niveles de mayor abstracción y generalidad. Otra forma que podrían tomar es simplemente aplicar matemáticas conocidas que son entendidas por solo unos pocos cientos de genios especializados en el mundo que se enfocan solo en la teoría y no en las aplicaciones. Es posible que estas matemáticas hayan estado "sentadas" desde las décadas de 1950 o 1970, esperando que alguien las aplique a un problema práctico como los de la investigación de IA. Muchas de las ideas que investigué con GPT-5 parecen caer en esta categoría.
13.2K