GPT-5 a été annoncé comme réduisant les hallucinations et il semble qu'il tienne ses promesses. 99,5 -> 99,9 représente 80 % d'erreurs en moins. Je ne comprends pas pourquoi les gens ne font pas plus de bruit à ce sujet. Les hallucinations sont l'un des plus grands problèmes des LLM et certains pensaient qu'elles étaient insolubles.
OpenRouter
OpenRouter15 août, 00:29
Après une semaine, GPT-5 a dominé nos classements de modèles propriétaires pour la précision d'appel d'outils🥇 En deuxième position, Claude 4.1 Opus, à 99,5% Détails 👇
135,47K