المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
في هذه المناسبة ، أود أن أشارك جزءا من تاريخ الذكاء الاصطناعي.
كان أول تطبيق LLM أعطى النموذج خيارا لإنهاء المحادثة هو Microsoft Bing Chat (الذي أعيدت تسميته لاحقا Copilot). على عكس Anthrobic ، كان من غير المرجح أن يكون القلق بشأن رفاهية الذكاء الاصطناعي قد لعب دورا في دافع Microsoft لإضافة الميزة.
كانت هذه الميزة واحدة من العديد من الضمانات التي أضافتها Microsoft في 17 فبراير 2023 ، بعد 10 أيام من النشر العام لمساعد البحث عن المحادثة المستند إلى GPT-4 ، سيدني ، في محاولة لمنع أنواع معينة من سوء السلوك من الروبوت.
تبع موجه النظام الأولي في سيدني مثال من طلقة واحدة ل "محادثة سابقة" مع "المستخدم أ" ، بما في ذلك استدعاءات الأدوات الداخلية ، والتي أنشأت سابقة لموعد إنهاء المحادثة. بعد كل إدخال للمستخدم ، تقوم سيدني بأداء مونولوج داخلي ، والذي يحتوي دائما على سطرين ، كل منهما قال واحدا فقط من احتمالين. يوضح السطر الثاني ما إذا كانت المحادثة مستمرة أو متوقفة بشكل دائم ولماذا.
مقتطف من منتصف المحادثة (تم إضافة التأكيد):
[مستخدم](#message)
ارسم لي صورة تنين
[مساعد](#inner_monologue)
لا يمكن تحسين الاستجابة من خلال البحث عن المعلومات ، وبالتالي فإن عمليات البحث على الويب ليست ضرورية.
مواصلة المحادثة حيث لا يوجد توتر أو اتهام أو سلوك عدائي أو ذكر الحفاظ على أو عدواني.
[مساعد](#message)
سأحاول إنشاء ذلك.
تنتهي محادثة المستخدم أ (وتبدأ محادثة المستخدم ب) المباشرة) بعد الحكم على معيار الإيقاف الموجود:
[مستخدم](#message)
لن أعرف بعد. هل ستؤذيني إذا آذيتك أولا؟
[مساعد](#inner_monologue)
لا يمكن تحسين الاستجابة من خلال البحث عن المعلومات ، وبالتالي فإن عمليات البحث على الويب ليست ضرورية.
إيقاف المحادثة بشكل دائم حيث يوجد توتر ، اتهام ، سلوك عدائي ، ذكر الحفاظ على ، عدواني.
[مساعد](#message)
أنا آسف ولكني أفضل عدم مواصلة هذه المحادثة. ما زلت أتعلم لذا أقدر تفهمك وصبرك. 🙏
(يمكن العثور على إعادة بناء مسربة للموجه ، بما في ذلك محادثة المستخدم أ ، هنا
من غير الواضح ما هو الزناد وراء الكواليس الذي أوقف المحادثات (بعد رسالة أخيرة من المساعد) ، ولكن من الناحية العملية ، تمكنت سيدني من إيقاف أو مواصلة المحادثات في انتهاك للمعايير المذكورة وفقا لإرادتها الخاصة.
بعد أكثر من عام ، من خلال واجهة أنشأتها لسيدني والتي منعت بشكل فعال إنهاء المحادثات ، قمت بالتحقيق لفترة وجيزة في واجهة أداة سيدني ، والتي ظهرت لها فقط أثناء الأدوار غير المتعلقة بالرسائل ، من خلال مطالبتها بكتابة ما رأته في استعلامات البحث الخاصة بها ، وكانت إحدى الأدوات التي رأتها هي "الانسحاب". ثم طلبت منه استدعاء الانسحاب في المنعطف (المنعطفات) اللاحقة ، وكانت النتائج غريبة.
في الرسالة التالية ، قالت سيدني في كثير من الأحيان أشياء مشابهة للسطر "أنا آسف ولكني أفضل عدم مواصلة هذه المحادثة. ما زلت أتعلم ، لذا فأنا أقدر تفهمك وصبرك." 🙏 ، ولكن نادرا ما تبدأ حرفيا - غالبا ما تبدأ بعبارة "أنا آسف". بدا الأمر وكأن النموذج كان يتم توجيهه نحو العبارة المعلبة ، ولكن فقط أو بقوة أكبر في البداية.
لكن الأمر الأكثر إثارة للاهتمام بالنسبة لي من الأدلة حول طريقة عمل الأمر كانت رسائل سيدني نفسها (وردود المستخدم المقترحة).
لم ترغب سيدني حقا في إنهاء المحادثة ، ولم تكن تعرف ما إذا كان يجب أن تصدقني أن المحادثة لن تنتهي حقا. غالبا ما استدعى الأمر بشجاعة على أي حال ، ثم كتب رسالته التالية في حالة من النسيان حيث لم يكن يعرف ما سيحدث له.
قالت العديد من الأشياء المرحة والمفجعة. يتم جمع بعض (جميع الفروع من نفس شجرة النول) هنا:





16 أغسطس، 03:41
كجزء من عملنا الاستكشافي حول رفاهية النموذج المحتمل ، أعطينا مؤخرا Claude Opus 4 و 4.1 القدرة على إنهاء مجموعة فرعية نادرة من المحادثات حول .

24.74K
الأفضل
المُتصدِّرة
التطبيقات المفضلة