Intéressant sur l'IA, la recherche mathématique, le crédit académique et le progrès humain
Jeffrey Emanuel
Jeffrey Emanuel21 août, 07:25
Un "camera lucida" est un dispositif qui utilise un prisme tenu par une armature métallique pour projeter une image de la scène devant lui sur une feuille de papier en dessous, un peu comme un projecteur moderne connecté à un flux de caméra en direct. Ces dispositifs ont probablement été inventés au début des années 1400, bien que des comptes rendus publiés à leur sujet n'apparaissent qu'à la fin des années 1500. Une partie de la raison à cela est probablement qu'ils étaient des secrets commerciaux étroitement gardés par des artistes qui les utilisaient pour atteindre un degré de précision qui était auparavant impossible ou du moins extrêmement difficile à réaliser à main levée. L'artiste David Hockney s'est beaucoup intéressé à ce sujet il y a des années et a écrit un livre à ce sujet en 2001. Sa théorie de base était que l'amélioration remarquable de la précision et du réalisme était directement attribuable à l'utilisation secrète de la camera lucida (et aussi d'un dispositif antérieur appelé camera obscura). Comme il l'a souligné, avant cette période, vous ne verriez jamais une peinture d'un luth en perspective qui ne semblait pas déformée et incorrecte. Bien que vous puissiez utiliser les "règles de la perspective" pour dessiner des formes rectilignes simples de manière réaliste, la géométrie plus complexe d'un luth dépassait la capacité humaine normale à la représenter de manière réaliste dans l'espace. Cette théorie est connue sous le nom de thèse Hockney-Falco. Depuis que j'ai appris cela à l'université au début des années 2000, j'ai en quelque sorte mentalement appliqué un astérisque aux œuvres de certains peintres. Par exemple, autant je respecte et admire Ingres et Caravaggio, l'admiration que j'avais pour leurs compétences a été tempérée par la réalisation qu'ils avaient probablement recours à ce genre d'aide mécanique. Et bien sûr, une grande partie de l'art réside dans le concept, la composition et le cadrage, les couleurs, les coups de pinceau, etc. Mais ce réalisme saisissant et vivant est ce qui m'a le plus impressionné, et cette partie a été en quelque sorte brisée par cette révélation. Cela m'a également fait respecter encore plus le réalisme sculptural de Michel-Ange (et aussi ses études qui sont clairement des croquis faits d'après nature). Quoi qu'il en soit, la raison pour laquelle j'en parle maintenant est que je crois que nous sommes à l'aube de la même chose dans les domaines de la recherche mathématique avec l'avènement de modèles comme GPT-5 Pro. Je l'ai déjà utilisé pour faire ce que je soupçonne être une recherche réellement nouvelle et intéressante (comme je l'ai détaillé dans des fils récents), et nous avons juste aujourd'hui reçu une mise à jour de Sebastien Bubeck chez OpenAI montrant que le modèle a pu prouver un résultat intéressant en mathématiques contemporaines en utilisant une nouvelle preuve, en une seule fois tout de même. Donc, cette nouvelle ère est soudainement sur nous. Nous avons vu un résultat de scientifiques informatiques chinois la semaine dernière battant un record de tri optimal qui tenait depuis 45 ans. Je me suis demandé à l'époque si l'IA avait été utilisée d'une manière ou d'une autre pour générer ce résultat. Voir aussi le récent article dans le tweet cité, qui a un caractère similaire en ce sens qu'il est à la fois surprenant et pourtant élémentaire. Cela me semble être des caractéristiques de résultats qui ont pu bénéficier de l'IA d'une manière ou d'une autre. Maintenant, je ne veux pas accuser ces auteurs de quoi que ce soit. Pour autant que je sache, ils ont tout fait manuellement, tout comme les peintres des années 1300. Et même s'ils ont utilisé l'IA pour les aider, nous n'avons pas encore de mœurs acceptées sur la façon de traiter cela : quelles divulgations sont justifiées, et comment le crédit devrait être réparti et considéré. Le concept même d'auteur doit être reconsidéré aujourd'hui. Dans mon fil récent où j'ai enquêté aux côtés de GPT-5 Pro sur l'utilisation de la théorie de Lie dans l'apprentissage profond, j'ai conçu les invites moi-même, même si je ne serais jamais capable en un million d'années de générer la théorie et le code que le modèle a développés à la suite de ces invites. Est-ce que je reçois le crédit pour le résultat si cela s'avère révolutionner le domaine ? Qu'en est-il de mon expérience subséquente, où j'ai utilisé mes invites originales que j'ai écrites moi-même avec une "meta invite" pour amener GPT-5 Pro à proposer 10 autres paires d'invites modélisées librement sur les miennes, mais impliquant des branches totalement différentes des mathématiques qui se sont développées dans des directions totalement différentes. Est-ce que je reçois le crédit pour ces théories si elles s'avèrent importantes ? J'espère bien, car j'ai déjà publié les idées et le code sur GitHub et les ai largement diffusés, donc si quelqu'un suit ces pistes d'enquête, l'éthique académique exigerait qu'il me cite. Mais même si vous pensez que je mérite du crédit pour avoir orienté l'IA avec ma propre invite, alors mes revendications de priorité sont quelque peu affaiblies pour les 10 autres théories qui résultent de l'utilisation de mon invite comme modèle pour la méta-invitation, n'est-ce pas ? Après tout, je ne savais même pas que la "Géométrie Tropicale" était une chose il y a quelques jours, et maintenant j'ai une théorie et un code qui l'appliquent à la recherche en IA. Je soutiendrais que, tout comme j'ai commencé à appliquer mentalement un astérisque à certaines œuvres d'art et artistes semblable à l'astérisque à côté du nom de Barry Bonds au Hall of Fame, je soupçonne que la plupart des scientifiques commenceront à faire la même chose pour tout nouveau document basé sur des théories mathématiques dans l'année qui vient. Je soupçonne que les gens commenceront bientôt à dire des choses comme "ce gars est le vrai deal ; il a écrit ses meilleurs articles avant 2025 !" pour distinguer ceux qui ont fait tout leur travail manuellement en utilisant leur propre cerveau de ceux qui ont utilisé l'assistance de l'IA. Et c'est absolument une façon valide de penser si l'IA est capable non seulement de répondre à des problèmes théoriques difficiles mais même de poser des questions intéressantes par elle-même. Si j'ai raison, nous devrions nous préparer à un tsunami de documents de recherche choquants qui battent des records et des limites de longue date, et brisent des murs qui étaient longtemps supposés être relativement impénétrables sans une théorie révolutionnaire. Et je crois que beaucoup de ces résultats partageront quelque chose en commun : qu'ils étaient toujours juste là devant nous, mais nécessitaient de combiner des théories de différentes zones des mathématiques et des sujets appliqués de nouvelles manières qui n'avaient pas été poursuivies auparavant en raison de raisons humaines et sociologiques : différents domaines se divisant le long de lignes, avec une terminologie, des revues, des pratiques, des départements, des conférences, des réseaux sociaux, etc. L'autre forme que je soupçonne que ces résultats prendront est de tirer parti de résultats élémentaires de manière bizarre qui, pour une raison ou une autre, ne viennent pas naturellement aux cerveaux humains, mais que nous pouvons comprendre une fois qu'ils sont clairement expliqués pour nous. Une autre forme qu'ils pourraient prendre est des résultats qui tirent parti d'esotérisme longtemps oublié de l'analyse de la fin du 19ème siècle. Les types de tours qui ont permis à Feynman de résoudre des intégrales que personne d'autre ne pouvait résoudre. Ces résultats sont connus et existent dans des livres, mais personne ne lit ces livres aujourd'hui, et les théories originales pour lesquelles ils ont été développés ont été largement supplantées par notre machinerie moderne qui fonctionne à de nombreux niveaux d'abstraction et de généralité accrus. Une autre forme qu'ils pourraient prendre est simplement d'appliquer des mathématiques connues qui ne sont comprises que par quelques centaines de génies spécialisés dans le monde qui se concentrent uniquement sur la théorie et pas du tout sur les applications. Cette mathématique a peut-être juste "dormie" depuis les années 1950 ou 1970, attendant que quelqu'un l'applique à un problème pratique tel que ceux de la recherche en IA. Beaucoup des idées que j'ai explorées avec GPT-5 semblent tomber dans cette catégorie.
13,2K