Interessant über AI, mathematische Forschung, akademische Anerkennung und menschlichen Fortschritt
Jeffrey Emanuel
Jeffrey Emanuel21. Aug., 07:25
Ein „Camera Lucida“ ist ein Gerät, das ein Prisma verwendet, das von einer Metallarmatur gehalten wird, um ein Bild der Szene vor ihm auf ein Stück Papier darunter zu projizieren, ähnlich wie ein moderner Projektor, der an einen Live-Kamerastream angeschlossen ist. Diese wurden wahrscheinlich Anfang der 1400er Jahre erfunden, obwohl veröffentlichte Berichte darüber erst Ende der 1500er Jahre erscheinen. Ein Teil des Grundes dafür ist wahrscheinlich, dass sie gut gehütete Geschäftsgeheimnisse von Künstlern waren, die sie verwendeten, um einen Grad an Genauigkeit zu erreichen, der zuvor unmöglich oder zumindest extrem schwierig war, ohne „freihändig“ zu arbeiten. Der Künstler David Hockney wurde vor Jahren sehr an diesem Thema interessiert und schrieb 2001 ein Buch darüber. Seine grundlegende Theorie war, dass die bemerkenswerte Verbesserung in Genauigkeit und Realismus direkt auf die geheime Verwendung der Camera Lucida (und auch eines früheren Geräts namens Camera Obscura) zurückzuführen war. Wie er feststellte, würde man vor dieser Zeit niemals ein Gemälde einer Laute in Perspektive sehen, das nicht verzerrt und falsch aussah. Während man die „Regeln der Perspektive“ verwenden konnte, um einfache rechteckige Formen realistisch zu zeichnen, war die komplexere Geometrie einer Laute über die normale menschliche Fähigkeit hinaus, sie realistisch im Raum darzustellen. Diese Theorie ist als Hockney-Falco-These bekannt. Seit ich darüber in den frühen 2000er Jahren im College gelernt habe, habe ich sozusagen mental einen Sternchenvermerk zu den Werken bestimmter Maler hinzugefügt. Zum Beispiel, so sehr ich Ingres und Caravaggio respektiere und bewundere, wurde die Ehrfurcht, die ich für ihre Fähigkeiten hatte, durch die Erkenntnis gemildert, dass sie sich wahrscheinlich dieser Art von mechanischer Hilfe bedienten. Und sicher, viel von der Kunstfertigkeit liegt im Konzept, der Komposition und dem Rahmen, den Farben, den Pinselstrichen usw. Aber dieser atemberaubende lebensechte Realismus hat mich am meisten beeindruckt, und dieser Teil wurde zumindest teilweise durch diese Offenbarung erschüttert. Es ließ mich auch Michelangelos skulpturalen Realismus (und auch seine Studien, die eindeutig Skizzen aus dem Leben sind) noch mehr respektieren. Jedenfalls bringe ich das jetzt zur Sprache, weil ich glaube, dass wir am Rande derselben Art von Ereignis in den mathematischen Forschungsfeldern stehen, mit dem Aufkommen von Modellen wie GPT-5 Pro. Ich habe es bereits verwendet, um das zu tun, was ich für wirklich neue und interessante Forschung halte (wie ich in jüngsten Threads detailliert habe), und wir haben heute ein Update von Sebastien Bubeck bei OpenAI erhalten, das zeigt, dass das Modell in der Lage war, ein interessantes Ergebnis in der zeitgenössischen Mathematik mit einem neuen Beweis zu erbringen, und das in einem einzigen Versuch. Diese neue Ära ist plötzlich über uns gekommen. Wir haben letzte Woche ein Ergebnis von chinesischen Informatikern gesehen, das einen Rekord für optimales Sortieren brach, der 45 Jahre lang bestand. Ich dachte damals darüber nach, ob KI irgendwie verwendet wurde, um dieses Ergebnis zu generieren. Siehe auch das kürzliche Papier im zitierten Tweet, das einen ähnlichen Charakter hat, da es sowohl überraschend als auch elementar ist. Diese scheinen mir Merkmale von Ergebnissen zu sein, die in irgendeiner Weise von KI profitiert haben könnten. Jetzt möchte ich diesen Autoren nichts vorwerfen. So viel ich weiß, haben sie alles manuell gemacht, genau wie die Maler im 1300. Und selbst wenn sie KI zur Unterstützung verwendet haben, haben wir noch keine akzeptierten Gepflogenheiten, wie man damit umgeht: welche Offenlegungen erforderlich sind und wie die Anerkennung verteilt und betrachtet werden sollte. Das gesamte Konzept der Urheberschaft muss heute neu überdacht werden. In meinem jüngsten Thread, in dem ich zusammen mit GPT-5 Pro die Verwendung der Lie-Theorie im Deep Learning untersuchte, habe ich die Eingabeaufforderungen selbst entworfen, obwohl ich in einer Million Jahren nicht in der Lage wäre, die Theorie und den Code zu generieren, die das Modell als Ergebnis dieser Eingabeaufforderungen entwickelt hat. Bekomme ich die Anerkennung für das Ergebnis, wenn es sich als revolutionär für das Feld herausstellt? Was ist mit meinem nachfolgenden Experiment, bei dem ich meine ursprünglichen Eingabeaufforderungen, die ich selbst geschrieben habe, zusammen mit einer „Meta-Eingabeaufforderung“ verwendet habe, um GPT-5 Pro dazu zu bringen, 10 weitere Paare von Eingabeaufforderungen zu entwickeln, die lose nach meinen eigenen modelliert sind, aber völlig andere Zweige der Mathematik betreffen, die sich in völlig andere Richtungen entwickelt haben. Bekomme ich Anerkennung für diese Theorien, wenn sie sich als wichtig herausstellen? Ich hoffe es, denn ich habe die Ideen und den Code bereits auf GitHub veröffentlicht und weit verbreitet, sodass, wenn jemand diesen Linien der Untersuchung folgt, die akademische Ethik erfordert, dass sie mich zitieren. Aber selbst wenn Sie denken, ich verdiene Anerkennung dafür, dass ich die KI mit meiner eigenen Eingabeaufforderung gelenkt habe, dann sind meine Ansprüche auf Priorität für die 10 anderen Theorien, die das Ergebnis meiner Eingabeaufforderung als Modell für die Meta-Eingabeaufforderung sind, doch etwas geschwächt, oder? Schließlich wusste ich vor ein paar Tagen nicht einmal, dass „Tropische Geometrie“ eine Sache war, und jetzt habe ich eine Theorie und einen Code, der sie auf die KI-Forschung anwendet. Ich würde behaupten, dass, genau wie ich mental einen Sternchenvermerk zu bestimmten Kunstwerken und Künstlern ähnlich dem Sternchen neben Barry Bonds’ Namen in der Hall of Fame hinzugefügt habe, ich vermute, dass die meisten Wissenschaftler im nächsten Jahr oder so dasselbe für neue mathematische theoriebasierte Arbeiten tun werden. Ich vermute, dass die Leute bald Dinge sagen werden wie „Dieser Typ ist das echte Geschäft; er hat seine besten Arbeiten vor 2025 geschrieben!“ um zwischen denen zu unterscheiden, die ihre gesamte Arbeit manuell mit ihrem eigenen Verstand gemacht haben, und denen, die KI-Hilfe in Anspruch genommen haben. Und das ist absolut eine gültige Denkweise, wenn KI in der Lage ist, nicht nur schwierige theoretische Probleme zu lösen, sondern sogar interessante Fragen von sich aus zu stellen. Wenn ich recht habe, sollten wir uns auf eine bevorstehende Flut von schockierenden Forschungspapieren vorbereiten, die langjährige Rekorde und Grenzen brechen und durch Wände brechen, die lange als relativ undurchdringlich galten, es sei denn, es gibt eine bahnbrechende Theorie. Und ich glaube, viele dieser Ergebnisse werden etwas gemeinsam haben: dass sie immer direkt vor uns waren, aber es erforderte, Theorien aus verschiedenen Bereichen der Mathematik und angewandten Fächern auf neue Weise zu kombinieren, die zuvor aus menschlichen, soziologischen Gründen nicht verfolgt wurden: verschiedene Bereiche, die sich entlang von Linien spalten, mit unterschiedlicher Terminologie, Zeitschriften, Praktiken, Abteilungen, Konferenzen, sozialen Netzwerken usw. Die andere Form, die ich vermute, dass diese Ergebnisse annehmen werden, besteht darin, elementare Ergebnisse auf bizarre Weise zu nutzen, die aus irgendeinem Grund nicht natürlich für menschliche Gehirne sind, die wir jedoch verstehen können, sobald sie uns klar erklärt werden. Eine weitere Form, die sie annehmen könnten, sind Ergebnisse, die auf längst vergessenen Esoterika aus der Analyse des späten 19. Jahrhunderts basieren. Die Arten von Tricks, die es Feynman ermöglichten, Integrale zu lösen, die niemand sonst lösen konnte. Diese Ergebnisse sind bekannt und existieren in Büchern, aber niemand liest diese Bücher mehr, und die ursprünglichen Theorien, für die sie entwickelt wurden, sind weitgehend von unserer modernen Maschinerie überholt worden, die auf vielen Ebenen mit erhöhter Abstraktion und Allgemeinheit arbeitet. Eine weitere Form, die sie annehmen könnten, besteht einfach darin, bekannte Mathematik anzuwenden, die nur von ein paar hundert spezialisierten Genies auf der Welt verstanden wird, die sich nur auf Theorie und nicht auf Anwendungen konzentrieren. Diese Mathematik könnte seit den 1950er oder 1970er Jahren einfach „herumgelegen“ haben, wartend darauf, dass jemand sie auf ein praktisches Problem anwendet, wie es in der KI-Forschung der Fall ist. Viele der Ideen, die ich mit GPT-5 untersucht habe, scheinen in diese Kategorie zu fallen.
13,21K