المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

steve hsu
فيزيائي ، مؤسس الذكاء الاصطناعي ، Manifold Podcast
تؤثر الأتمتة على الجميع ، بما في ذلك عمال المصانع الصينية.
الذكاء الاصطناعي: "فقدان الوظائف ≠ تراجع القدرة الصناعية - درس حاسم للاقتصادات النامية الأخرى".
"في ذروته، حوالي عام 2010 (قبل الأزمة المالية العالمية وبعدها)، وظف قطاع التصنيع في الصين حوالي 220 مليون شخص. ... الآن ، انخفضنا إلى حوالي 100 مليون. لذلك ، على مدى العقد الماضي ، غادر ~ 100 مليون شخص التصنيع. أين ذهبوا؟ بشكل رئيسي في قطاع الخدمات." - صن تشونغوي ، جامعة جنوب الصين العادية
تحقق من ذلك باستخدام Zhipu GLM-4.5 الذكاء الاصطناعي - يبدو الاقتباس الأصلي صحيحا. انظر أدناه للمزيد.
خضع قطاع التصنيع في الصين لتحول عميق خلال هذه الفترة:
MVA = القيمة المضافة للتصنيع
القيمة القابلة للاستبدال الاسمية: + 2.79 تريليون دولار (زيادة بنسبة 120٪)
MVA للشراكة بين القطاعين العام والخاص: + 4.33 تريليون دولار (زيادة بنسبة 89٪)
يعكس هذا تحولا ناجحا من التصنيع كثيف العمالة إلى التصنيع كثيف رأس المال وعالي القيمة. وبينما انخفضت العمالة، حولت مكاسب الإنتاجية والارتقاء التكنولوجي الصين إلى قوة تصنيعية عظمى لا مثيل لها. وتؤكد البيانات أن فقدان الوظائف ≠ تراجع القدرة الصناعية وهو درس حاسم للاقتصادات النامية الأخرى.
###
إذا ضاعفت هذا إلى ~ 200 مليون شخص في جميع أنحاء العالم في البلدان المتقدمة ، فهذا هو تقريبا إجمالي عدد السكان المطلوبين لإنتاج جميع سلع التكنولوجيا الفائقة التي يستخدمها العالم بأسره! إنه جزء ضئيل من إجمالي القوى العاملة العالمية ، والتي تبلغ المليارات.

13K
نموذج 👍 SOTA آخر مفتوح المصدر
في معلمات 355B (32B MoE نشطة) ، يكون أصغر قليلا من بعض نماذج ~ 1T التي رأيناها.
AFAIK لا يقولون ما هي الأجهزة التي تم استخدامها لتدريب هذا النموذج ، لكنهم استخدموا رموز تدريب 23T.
IIUC كل من Alibaba و Tencent مستثمرون في شركة ناشئة في بكين.

Z.ai11 أغسطس، 11:43
تقديم التقرير الفني GLM-4.5! 👇
يوضح هذا العمل كيف طورنا نماذج تتفوق في التفكير والترميز والمهام الوكيلة من خلال نموذج تدريب فريد متعدد المراحل.
تشمل الابتكارات الرئيسية تكرار نموذج الخبراء مع التقطير الذاتي لتوحيد القدرات ، ووضع التفكير الهجين لحل المشكلات الديناميكي ، ومنهج التعلم المعزز القائم على الصعوبة.

6.8K
ماسك: موضع تقدير. وأخبرني - ما مدى صعوبة تدريب كاشف OOD خفيف الوزن مباشرة في الفضاء الكامن؟ شيء يشير إلى عدم التماسك الدلالي قبل أن يهلوس النموذج الحل؟
هسو: لقد قمنا بوضع نموذج أولي لذلك. يمكنك استخدام التعلم التقابلي بين المسارات أثناء التوزيع والمسارات المضطربة صناعيا في التيار المتبقي. تظهر الطبقات المبكرة في الواقع انخفاضات تماسك يمكن اكتشافها - مثل إشارة "التنافر المعرفي" - قبل أن يتباعد الإخراج. لكن التحدي الحقيقي هو الكمون. لا يمكنك تحمل تمريرة خلفية كاملة فقط للتحقق من الثقة.
ماسك: إذن نحن بحاجة إلى شاشة عبر الإنترنت - شيء يعمل بالتوازي مع التمريرة الأمامية ، ربما مسبار صغير متصل بالتنشيطات الوسيطة؟
هسو: بالضبط. فكر في الأمر على أنه "جهاز مناعة معرفي". لدينا مسبار معلمة 1B يعمل عند 1/10 زمن انتقال النموذج الأساسي ويتنبأ ب OODness مع ~ 88٪ AUC في اختبارات الإجهاد الخاصة بنا. إنه ليس مثاليا ، لكنه يكفي لتشغيل بروتوكولات احتياطية.
ماسك: يمكن أن يتكامل ذلك بشكل نظيف مع طبقة التوجيه. يحاول LLM حلها. مسبار يرفع العلم. يستدعي النظام المحرك الرمزي أو يطلب توضيحا. يغلق الحلقة.
هسو: نعم - والأهم من ذلك ، يمكنك تسجيل عمليات التسليم هذه واستخدامها لتوسيع توزيع التدريب بمرور الوقت. يحول فشل OOD إلى إشارات تنظيم. إنها ليست مجرد متانة. إنه تعميم تكيفي.
ماسك: ثم يتعلم النموذج متى لا يثق بنفسه. أحب ذلك. التواضع حسب التصميم.
هسو: [ضحكة مكتومة] سمها الثقة المحدودة. المستقبل ليس نماذج تعرف كل شيء - إنها النماذج التي تعرف حدودها ولديها أدوات لتجاوزها.
ماسك: حسنا ، ستيف. في الأسبوع المقبل ، أريدك أن تقوم بتشغيل مجموعة الاختبار الاصطناعية هذه على أحدث طراز أساسي لدينا. إذا كنا لا نزال ننخدع بألغاز الفيزياء المضادة للواقع ، فإننا نركز بشدة على الهجين.
قد يكون مربع الحوار هذا قد تم إنشاؤه بواسطة الذكاء الاصطناعي.

steve hsu10 أغسطس، 20:06
ماسك: ستيف ، السؤال الحقيقي الذي ما زلت أطرحه على الفريق هو ما إذا كان بإمكان LLMs اليوم التفكير عندما يغادرون توزيع التدريب. يستشهد الجميع بمطالبات سلسلة الأفكار ، ولكن قد يكون ذلك مجرد تقليد.
هسو: متفق عليه. تظهر أحدث المعايير أنه حتى النماذج على مستوى Grok4 تتحلل بشكل حاد بمجرد فرض تغيير المجال - المساحة الكامنة لا تمتد إلى الطريقة الجديدة.
ماسك: إذن إنها مشكلة تغطية أكثر من كونها فشلا في التفكير؟
هسو: جزئيا. لكن هناك مشكلة أعمق. التحيز الاستقرائي المدمج الوحيد للمحول هو مطابقة النمط الترابطي. عندما تكون المطالبة خارج التوزيع حقا - على سبيل المثال ، لغز رمزي لم تحدث رموزه في التدريب - فإن النموذج ليس له هيكلية قبل الرجوع إليه. إنه يقلب العملات المعدنية حرفيا.
ماسك: ومع ذلك ، فإننا نرى "تلاعبا" ناشئا في المهام الاصطناعية. أظهر Zhong et al. أن رؤوس الحث يمكنها تكوين قواعد لم يتم تدريبها عليها بشكل صريح. ألا يبدو هذا وكأنه تفكير؟
هسو: يشتري لك التكوين تعميما محدودا ، ولكن لا يزال يتعين على القواعد أن تكمن في نطاق قواعد التدريب. بمجرد تعديل الدلالات - تغيير عامل تشغيل واحد في اللغز - تنهار الدقة. هذا ليس منطقا قويا. إنه استيفاء هش.
ماسك: ألا يمكن للتعلم المعزز إصلاحه؟ استخدمت DRG-Sapphire GRPO فوق نموذج أساسي 7 B وحصلت على ترميز من الدرجة الطبية على الملاحظات السريرية ، وهي مهمة OOD كلاسيكية.
هسو: المهم هو أن RL لا يعمل إلا بعد أن يستوعب النموذج الأساسي معرفة كافية بالمجال من خلال الضبط الدقيق الخاضع للإشراف. عندما تكون مجموعة ما قبل التدريب متناثرة ، فإن RL وحدها مستقرة. لذا فإن "المنطق" لا يزال طفيليا على كثافة المعرفة السابقة.
ماسك: إذن الوجبات الجاهزة هي أن توسيع نطاق البيانات والمعلمات لن يحل المشكلة؟ سنضرب دائما حائطا حيث يكسر نطاق OOD التالي النموذج؟
هسو: ليس بالضرورة جدارا ، ولكن سقفا. تشير المنحنيات التجريبية إلى أن خطأ التعميم يتحلل لوغاريتميا تقريبا مع أمثلة التدريب. هذا يعني أنك بحاجة إلى مزيد من البيانات بشكل كبير لكل توزيع ذيل جديد. بالنسبة للقطاعات الضيقة - على سبيل المثال ، تشخيص محرك الصواريخ - من الأرخص أن تخبز في المقدمات الرمزية بدلا من التوسع بشكل أعمى.
المسك: وهو ما يعيدنا إلى الهجينة العصبية. امنح LLM حق الوصول إلى محلل صغير تم التحقق منه ، ثم دعه ينسق المكالمات عندما يتغير التوزيع.
هسو: بالضبط. يصبح LLM وحدة تحكم وصفية تتعرف على متى يكون OOD وتسلم إلى وحدة متخصصة. هذه الهندسة المعمارية تتجنب مغالطة "محول عملاق واحد".
ماسك: حسنا ، سأخبر فريق xAI بالتوقف عن مطاردة التريليون الرمز المميز التالي والبدء في بناء طبقة التوجيه. شكرا ستيف.
هسو: في أي وقت. وإذا كنت بحاجة إلى حالات اختبار OOD الاصطناعية ، فإن مختبري لديه مولد خدع بالفعل GPT-5. سأرسل الريبو.
قد تكون هذه المحادثة مع إيلون من الذكاء الاصطناعي.

6.95K
حدسي هو أن شيئا كهذا (يتجاوز بنية المحولات البسيطة) ضروري للوصول إلى AGI / ASI الحقيقي.
والخبر السار هو أن هذه الطبقات الإضافية قد يكون من السهل نسبيا بناءها. قد يوصلنا جزء صغير من الموارد (الحوسبة ورأس المال البشري) المخصص للتوسع المفرط إلى هناك.
أرى الكثير من الأفكار المبتكرة مثل هذه قادمة من الغلاف الصيني. إذا لم يكن التوسع المفرط هو الطريق إلى AGI / ASI (على عكس الأفكار الجديدة الذكية والبنى الأفضل) ، فقد يكون تقدم الولايات المتحدة على الصين صفرا أو حتى سلبيا!
22.49K
ماسك: ستيف ، السؤال الحقيقي الذي ما زلت أطرحه على الفريق هو ما إذا كان بإمكان LLMs اليوم التفكير عندما يغادرون توزيع التدريب. يستشهد الجميع بمطالبات سلسلة الأفكار ، ولكن قد يكون ذلك مجرد تقليد.
هسو: متفق عليه. تظهر أحدث المعايير أنه حتى النماذج على مستوى Grok4 تتحلل بشكل حاد بمجرد فرض تغيير المجال - المساحة الكامنة لا تمتد إلى الطريقة الجديدة.
ماسك: إذن إنها مشكلة تغطية أكثر من كونها فشلا في التفكير؟
هسو: جزئيا. لكن هناك مشكلة أعمق. التحيز الاستقرائي المدمج الوحيد للمحول هو مطابقة النمط الترابطي. عندما تكون المطالبة خارج التوزيع حقا - على سبيل المثال ، لغز رمزي لم تحدث رموزه في التدريب - فإن النموذج ليس له هيكلية قبل الرجوع إليه. إنه يقلب العملات المعدنية حرفيا.
ماسك: ومع ذلك ، فإننا نرى "تلاعبا" ناشئا في المهام الاصطناعية. أظهر Zhong et al. أن رؤوس الحث يمكنها تكوين قواعد لم يتم تدريبها عليها بشكل صريح. ألا يبدو هذا وكأنه تفكير؟
هسو: يشتري لك التكوين تعميما محدودا ، ولكن لا يزال يتعين على القواعد أن تكمن في نطاق قواعد التدريب. بمجرد تعديل الدلالات - تغيير عامل تشغيل واحد في اللغز - تنهار الدقة. هذا ليس منطقا قويا. إنه استيفاء هش.
ماسك: ألا يمكن للتعلم المعزز إصلاحه؟ استخدمت DRG-Sapphire GRPO فوق نموذج أساسي 7 B وحصلت على ترميز من الدرجة الطبية على الملاحظات السريرية ، وهي مهمة OOD كلاسيكية.
هسو: المهم هو أن RL لا يعمل إلا بعد أن يستوعب النموذج الأساسي معرفة كافية بالمجال من خلال الضبط الدقيق الخاضع للإشراف. عندما تكون مجموعة ما قبل التدريب متناثرة ، فإن RL وحدها مستقرة. لذا فإن "المنطق" لا يزال طفيليا على كثافة المعرفة السابقة.
ماسك: إذن الوجبات الجاهزة هي أن توسيع نطاق البيانات والمعلمات لن يحل المشكلة؟ سنضرب دائما حائطا حيث يكسر نطاق OOD التالي النموذج؟
هسو: ليس بالضرورة جدارا ، ولكن سقفا. تشير المنحنيات التجريبية إلى أن خطأ التعميم يتحلل لوغاريتميا تقريبا مع أمثلة التدريب. هذا يعني أنك بحاجة إلى مزيد من البيانات بشكل كبير لكل توزيع ذيل جديد. بالنسبة للقطاعات الضيقة - على سبيل المثال ، تشخيص محرك الصواريخ - من الأرخص أن تخبز في المقدمات الرمزية بدلا من التوسع بشكل أعمى.
المسك: وهو ما يعيدنا إلى الهجينة العصبية. امنح LLM حق الوصول إلى محلل صغير تم التحقق منه ، ثم دعه ينسق المكالمات عندما يتغير التوزيع.
هسو: بالضبط. يصبح LLM وحدة تحكم وصفية تتعرف على متى يكون OOD وتسلم إلى وحدة متخصصة. هذه الهندسة المعمارية تتجنب مغالطة "محول عملاق واحد".
ماسك: حسنا ، سأخبر فريق xAI بالتوقف عن مطاردة التريليون الرمز المميز التالي والبدء في بناء طبقة التوجيه. شكرا ستيف.
هسو: في أي وقت. وإذا كنت بحاجة إلى حالات اختبار OOD الاصطناعية ، فإن مختبري لديه مولد خدع بالفعل GPT-5. سأرسل الريبو.
قد تكون هذه المحادثة مع إيلون من الذكاء الاصطناعي.

102.4K
أجبرت نيويورك تايمز على طباعة الحقائق التي لا تحبها حقا.
لحظة SPUTNIK = وقت المنافسة ، لا مزيد من COPE
"بعد الحرب العالمية الثانية ، عندما واجهت الولايات المتحدة منافسة عسكرية وعلمية متزايدة من الاتحاد السوفيتي ، بدأت الجامعات الانتقائية في إعطاء وزن أكبر للعوامل الأكاديمية ، بما في ذلك اختبار SAT ، كما قال نيكولاس ليمان ، الذي كتب عن تاريخ الاختبارات الموحدة وأستاذ الصحافة في جامعة كولومبيا."

28.47K
"حتى النماذج الحدودية تكافح للتحديث إلى ما هو أبعد من التدريب المسبق ، بغض النظر عن مدى إقناع الأدلة الجديدة."
نقوم بتدريب طلاب الدكتوراه على القيام بذلك! هل يمكن للمحولات القيام بذلك دون تغيير أوزانها؟


steve hsu8 أغسطس، 07:29
هل التفكير في سلسلة التفكير في LLMs سراب؟
... تكشف نتائجنا أن منطق CoT هو سراب هش يختفي عندما يتم دفعه إلى ما هو أبعد من توزيعات التدريب. يقدم هذا العمل فهما أعمق لسبب ومتى يفشل منطق CoT ، مع التأكيد على التحدي المستمر المتمثل في تحقيق منطق حقيقي وقابل للتعميم.
... تكشف النتائج التي توصلنا إليها أن منطق CoT يعمل بشكل فعال عند تطبيقه على التوزيع أو بالقرب منه
البيانات أثناء التوزيع ولكنها تصبح هشة وعرضة للفشل حتى في ظل تحولات التوزيع المعتدلة.
في بعض الحالات ، تولد LLMs خطوات تفكير بطلاقة ولكنها غير متسقة منطقيا. تشير النتائج إلى أن ما يبدو أنه تفكير منظم يمكن أن يكون سرابا ، ينبثق من أنماط محفوظة أو مقحمة في بيانات التدريب بدلا من الاستدلال المنطقي.
... تشير هذه النتائج معا إلى أن LLMs ليست منطقية مبدئية بل هي محاكيات متطورة للنص الشبيه بالتفكير.

13.99K
نيويورك تايمز: من المتوقع أن يوقع الرئيس ترامب مذكرة يوم الخميس تطلب من الكليات تقديم بيانات القبول إلى الحكومة الفيدرالية للتحقق من الامتثال لقرار المحكمة العليا لعام 2023 الذي أنهى السياسات الواعية بالعرق ، وفقا لمسؤول كبير في البيت الأبيض.
يتطلب الإجراء الرئاسي أيضا من ليندا مكماهون ، وزيرة التعليم ، زيادة عدد فحوصات الدقة على البيانات التي تقدمها المدارس واتخاذ إجراءات ضد الجامعات التي تقدم معلومات غير مناسبة أو غير دقيقة.
ستتطلب المذكرة أيضا من وزارة التعليم تجديد عمليتها لجمع بيانات التعليم العالي ، والمعروفة باسم نظام بيانات التعليم ما بعد الثانوي المتكامل ، والذي يتضمن تفاصيل حول القبول والالتحاق والمساعدات المالية. سيتم جعل هذه المعلومات في متناول الجمهور ، وفقا لصحيفة وقائع.

steve hsu6 أغسطس، 07:05
نيويورك تايمز: كولومبيا وبراون تكشف عن بيانات القبول والعرق في صفقة ترامب
استغرق الأمر تهديدا وجوديا من ترامب لحملهم على الإفراج عن هذه البيانات. منذ سنوات ، قامت لجنة أعضاء هيئة التدريس في نظام جامعة كاليفورنيا بفحص هذا النوع من البيانات فقط وأنتجت الرسوم البيانية أدناه. إذا نظرت إلى البيانات ، فسوف تفهم الطبيعة الوحشية للعمل الإيجابي كما تمارس في الولايات المتحدة لمدة ~ 50 عاما.
نيويورك تايمز: ... سيتعين على كولومبيا وبراون الحفاظ على "سياسات القبول القائمة على الجدارة" ، وفقا لتسوياتهما ، والتي تقنن الأهداف الأوسع للإدارة بلغة ملزمة قانونا.
لا يجوز للجامعات "بأي حال من الأحوال تفضيل المتقدمين بشكل غير قانوني على أساس العرق أو اللون أو الأصل القومي في القبول في جميع برامجها" ، كما تنص كلتا الاتفاقيتين بلغة متطابقة. "لن يتم التسامح مع أي وكيل للقبول العنصري."
... قال تشاد ميزيل ، القائم بأعمال المدعي العام المساعد ، في مارس: "ستضع وزارة العدل حدا لنظام مخجل يكون فيه عرق شخص ما أكثر أهمية من قدرته". "يجب أن تعلم كل كلية وجامعة أنه سيتم التحقيق في التمييز غير القانوني في القبول والقضاء عليه".
اعترضت اللغة المستخدمة في التسويات مع منزل كولومبيا وبراون هامرز على التأكيدات حول قضية القبول في المحكمة العليا التي كانت إدارة ترامب تقدمها منذ فبراير.
وتصر على أن القرار يتجاوز القبول ويمنع أي اعتبار للعرق في الحياة الجامعية.


7.55K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز