أنا في حيرة من أمري بشأن هذا. إنه غير متوافق تماما مع تجربتي اليومية الفعلية في LLMs ، وهي أنها في الغالب تبدو متشابهة الآن ، وكانت منذ Claude 3.5 Sonnet. إما أن المعايير أصبحت بلا معنى أو أصبحت النماذج جيدة جدا بحيث لا يمكن الشعور بمزيد من التحسينات من خلال المشاعر ، ولكن فقط من خلال التحليل الدقيق.
Tolga Bilge
Tolga Bilge‏11 أغسطس، 10:47
هل السيني في الغرفة معنا الآن؟
‏‎6.19‏K