المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
نموذج تدريب ضخم مفتوح المصدر مفتوح المصدر يفتح بواسطة @_xjdr
XJDR عالم مجنون، لذا استغرق الأمر مني عدة مرات لأفهمها حقا، وقد لا أزال لا أقدر النتيجة كاملة تماما.
عادة، إذا أردت تدريب نموذج أساسي جديد من الصفر، تحتاج إلى الكثير من بطاقات الرسوميات فقط لتبدأ تجربة تدريب جادة. إنه مكلف.
واحدة من أصعب الأنواع في التدريب هي تصميم DeepSeek لأسلوب Mixed of Experts. إنه قوي، لكن نظام التوجيه ونظام التدريب فيه دقيق جدا لدرجة أن الاختبارات الصغيرة غالبا ما تتعطل. لذا تحتاج إلى مجموعة كبيرة فقط لتتعلم أي شيء، وعندما تفشل الجولة لا يمكنك معرفة ما إذا كانت فكرتك خاطئة أو أن الإعداد تعطل فجأة يموت البحث ولا تتعلم شيئا
XJDR هو مصنع تدريب جاهز للتشغيل تم توصيله بالطريقة التي يفعلها الخبراء، وذلك خصيصا بحيث يمكن تدريب هذه الفئة من النماذج والبحث عليها على جهاز واحد دون حدوث عطل مستمر. التجارب الصغيرة تتصرف كتدريب حقيقي، لذا يمكنك الحصول على إجابة واضحة بنعم أو لا قبل أن تقضي وقتا من ثمانية أرقام وشهور.
في الواقع، يمكن للناس إجراء تجارب رخيصة وسريعة حيث يتم تغيير شيء واحد في كل مرة، مثل كيفية عمل مسارات النموذج بين المتخصصين، كيف يتعلم (وصفة التدريب)، البيانات التي تزودها به، وكيف تحصل على جودة أكبر لكل دولار. أنت في الأساس تختبر أفكارا جديدة لنماذج أساسية أفضل بنفس الطريقة التي تختبر بها منتجا من A/B، لكن يمكنك القيام بذلك خارج مختبر كبير.
التأثير الصافي هو تكرار أسرع وتوفير كبير في التكاليف، بالإضافة إلى أن المزيد من الفرق يمكنها بناء نماذج أساسية جديدة بشكل واقعي. وهذا قد يعني نموذج فئة DeepSeek أفضل، ونماذج متخصصة جديدة كليا، والكثير من المنافسة والبحث المفتوح لأن رسوم القبول تنخفض بشكل كبير وتحدث المزيد من الإنجازات في الأماكن العامة
تابعونا، فهو يكتب معظم المصادر المفتوحة!
مبروك @_xjdr. نحن سعداء جدا بدعمك وأن نكون جزءا صغيرا من قصتك
الأفضل
المُتصدِّرة
التطبيقات المفضلة
