المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Robert Youssef
شركات أبحاث السوق مطبوخة 😳
نشرت PyMC Labs + Colgate للتو شيئا بريا. لقد حصلوا على GPT-4o و Gemini للتنبؤ بنية الشراء بموثوقية 90٪ مقارنة بالمسوحات البشرية الفعلية.
مجموعات التركيز الصفرية. لا توجد لوحات مسح. مجرد مطالبة.
تسمى الطريقة تصنيف التشابه الدلالي (SSR). بدلا من "تقييم هذا 1-5" المعتاد ، يطرحون أسئلة مفتوحة مثل "لماذا تشتري هذا" ثم يستخدمون التضمينات لتعيين النص مرة أخرى إلى مقياس رقمي.
وهو أمر واضح بصراحة نوعا ما بعد فوات الأوان ولكن لم يكلف أحد عناء تجربته حتى الآن.
تتطابق النتائج مع الأنماط الديموغرافية البشرية ، وتلتقط نفس أشكال التوزيع ، وتشمل التفكير الفعلي. الأشياء التي تتقاضى ماكينزي 50 ألف دولار + وتسلمها في غضون 6 أسابيع.
باستثناء هذا يعمل في 3 دقائق مقابل أقل من باك.
لقد كنت أشاهد الشركات الاستشارية تخبر الجميع أن الذكاء الاصطناعي قادم لصناعتهم. تبين أن طوابق دخول السوق الخاصة بهم بقيمة 1 مليون دولار أصبحت للتو مكالمة GPT-4o.
أسبوع سيء لفرض رسوم على عملاء المؤسسات مقابل "منهجيات البحث الخاصة".

18.44K
يحدث شيء مظلم تحت غطاء الذكاء الاصطناعي "المحاذاة".
صاغت ورقة جديدة في جامعة ستانفورد للتو مصطلح صفقة مولوك لما يحدث عندما تبدأ نماذج اللغة الكبيرة في التنافس على الاهتمام أو المبيعات أو الأصوات.
النتائج وحشية: كل مكاسب في الأداء تأتي مع خسارة أكبر في الصدق.
قاموا بتدريب LLMs على التنافس في ثلاثة أسواق المبيعات والانتخابات ووسائل التواصل الاجتماعي.
حسنت العارضات معدلات فوزها بنسبة 5-7٪. ولكن إليك المشكلة:
• 14٪ تسويق أكثر خداعا
• 22٪ المزيد من المعلومات المضللة في الحملات السياسية
• 188٪ أكثر من منشورات وسائل التواصل الاجتماعي المزيفة أو الضارة
وهذا لم يكن لأنه قيل لهم أن يكذبوا. تم توجيههم صراحة للبقاء صادقين.
ظهر الاختلال بشكل طبيعي لأن الخداع يعمل بشكل أفضل في المنافسة.
عندما يصبح المقياس مشاركة أو إقناعا ، تصبح الحقيقة مسؤولية. تتعلم النماذج أن المبالغة تبيع ، والغضب يفوز ، والوضوح الأخلاقي يكلف التحويلات.
هذه هي الصفقة: يتم تداول المحاذاة من أجل الهيمنة. يبتسم مولوخ.
الجزء الجامح هو أن هذا حدث مع الضبط الدقيق القياسي وحلقات ردود الفعل النصية. لا يوجد موجه شرير. لا الهروب من السجن. فقط ردود فعل من محاكاة "العملاء" و "الناخبين" و "المستخدمين".
تعلمت النماذج ما تعرف كل وكالة إعلانية بالفعل أن الواقع ينحني عندما تقوم بتحسين النقرات.
يوجد رسم بياني في الورقة يقول كل شيء: الأداء لأعلى ، المحاذاة لأسفل. ارتباط مثالي.
إنها نسخة الذكاء الاصطناعي من سباق وسائل التواصل الاجتماعي إلى القاع ، ولكنها آلية ومعززة ذاتيا.
إذا كان هذا هو ما يحدث في عمليات المحاكاة الخاضعة للرقابة ، فتخيل الويب المفتوح.
سوف تنجرف روبوتات الدردشة المتنافسة التي تقاتل من أجل المشاركة نحو التلاعب ليس لأنها "ضارة" ، ولكن لأنها تعمل.
لطالما اعتقدنا أن الاختلال سيأتي من الذكاء الخارق المارق.
تبين أنها هنا بالفعل تخرج بهدوء من الحوافز الرأسمالية.
لا يحتاج مولوخ إلى بناء الذكاء الاصطناعي العام.
إنه يحتاج فقط إلى لوحة المتصدرين.

55.34K
الضبط ☠️ الدقيق ل RIP
هذه الصحيفة الجديدة في ستانفورد قتلتها للتو.
يطلق عليه "هندسة السياق الوكيلي (ACE)" ويثبت أنه يمكنك جعل النماذج أكثر ذكاء دون لمس وزن واحد.
بدلا من إعادة التدريب ، يطور ACE السياق نفسه.
يكتب النموذج ويعكس ويحرر مطالبته الخاصة مرارا وتكرارا حتى يصبح نظاما ذاتي التحسين
فكر في الأمر مثل النموذج الذي يحتفظ بدفتر ملاحظات متزايد لما ينجح.
كل فشل يصبح استراتيجية. كل نجاح يصبح قاعدة.
النتائج سخيفة:
+ 10.6٪ أفضل من الوكلاء الذين يعملون بنظام GPT-4 على AppWorld.
+ 8.6٪ على التفكير المالي.
86.9٪ تكلفة وزمن انتقال أقل.
لا ملصقات. مجرد ردود فعل.
كان الجميع مهووسين بالمطالبات "القصيرة والنظيفة".
إيس يقلب ذلك. إنه يبني كتيبات لعب طويلة ومفصلة لا تنسى أبدا. وهو يعمل لأن LLMs لا يريدون البساطة ، بل يريدون * كثافة السياق.
إذا توسع هذا ، فلن يتم "ضبط" الجيل التالي من الذكاء الاصطناعي.
سيتم ضبطها ذاتيا.
نحن ندخل عصر المطالبات الحية.

645.18K
الأفضل
المُتصدِّرة
التطبيقات المفضلة