تطلق DeepSeek طرازات R1 بأداء ينافس طرازات OpenAI o1

يناير 21, 2025

أعلنت شركة DeepSeek الصينية عن إطلاق طرازين جديدين للذكاء الاصطناعي، R1 و R1-Zero، مدعية أنهما يتطابقان مع أداء نماذج التفكير المنطقي o1 من OpenAI الرائدة، والتي تستغرق بعض الوقت للتفكير والتحليل والمقارنة والتقييم قبل إنشاء الإجابات.

بالإضافة إلى ذلك، طرحت الشركة الصينية 6 نماذج أصغر مفتوحة المصدر، بعضها ينافس أداء النموذج OpenAI-o1-mini.

النموذج DeepSeek-R1-Zero مبتكر في التعلم، حيث يطور مهاراته في الاستدلال باستخدام التعلم المعزز (التعلم المعزز) دون الاعتماد على الأمثلة البشرية. اعتمد النموذج على نظام مكافآت مبسط وقواعد واضحة لفحص دقة الردود، بما في ذلك التحقق من صحة الحلول للمسائل الرياضية وبرامج التعليمات.

طورت DeepSeek خوارزمية جديدة تقيم مجموعات الإجابات بدلاً من تقييم كل إجابة على حدة، وقد مكنت هذه التقنية النموذج من تحسين أدائه بكفاءة.

واجه النموذج، بإمكاناته الواعدة، مشكلتين رئيسيتين، وهما صعوبة قراءة الإجابات وخلط اللغات. لمواجهة ذلك، أطلقت DeepSeek نموذج R1، الذي يبدأ بالتدريب الأولي على البيانات الصغيرة، ثم يخضع لجولات متعددة من التعلم المحسن لتحسين الأداء.

أظهرت الاختبارات أن نموذج DeepSeek-R1 كان قريبًا من أداء نموذج OpenAI-o1-1217 عبر العديد من معايير الإثبات التي تم من خلالها اختبار نماذج الذكاء الاصطناعي.

طورت الشركة 6 نماذج صغيرة تتراوح من 1,5 إلى 70 مليار معلمة، باستخدام 800 ألف مثال تدريبي تم إنشاؤه بواسطة نموذج R1 الأكبر، وأظهرت النماذج الصغيرة (النماذج المقطرة)، مثل R1-Distill-Llama-70B R1-Distill-Qwen-32B، قدرات إثباتية قوية، متفوقة على العديد من النماذج الأكبر.

تتوفر نماذج DeepSeek-R1 المرخصة من معهد ماساتشوستس للتكنولوجيا، مما يسمح باستخدامها وتكييفها وتطويرها مجانًا. يمكن الوصول إلى هذه الطرز عبر منصات GitHub و HuggingFace، أو من خلال واجهة برمجة تطبيقات خاصة بالشركة بأسعار أرخص بكثير من طرازات OpenAI.

يأتي ذلك بعد أن أطلقت الشركة الصينية طرازها DeepSeek-V3، أحد أقوى طرازات المصادر المفتوحة في العالم، والذي يطابق طرازات أخرى مثل GTP-4o.