DeepSeek.. هل يعيد النموذج الصيني تشكيل مشهد الذكاء الاصطناعي العالمي ؟
أثار نموذج R1، الذي طورته شركة DeepSeek الصينية الناشئة، ضجة كبيرة في وادي السيليكون خلال الأيام القليلة الماضية، مع قدرات متطورة وتكلفة تطوير منخفضة، مما أثار الحديث عن انقلاب وشيك في الذكاء الاصطناعي.
من وجهة نظر بعض الخبراء، يشير صعود DeepSeek إلى أن الولايات المتحدة فقدت تفوقها في الذكاء الاصطناعي، بينما يرى بعض الخبراء، بما في ذلك المديرون التنفيذيون في الشركات التي تبني بعضًا من أقوى نماذج الذكاء الاصطناعي في العالم، أن هذا نوع مختلف من التحول التكنولوجي قيد التنفيذ.
ولكن ما هو التحول الذي يتحدث عنه الخبراء في مجال الذكاء الاصطناعي، وما هو التأثير المتوقع (DeepSeek) في الصناعة ؟
أولا ؛ ما هو تحول تطوير الذكاء الاصطناعي:
جاء إطلاق نموذج DeepSeek في وقت يشهد فيه قطاع الذكاء الاصطناعي تحولًا ملحوظًا في تطوير النماذج، بدلاً من التركيز على بناء نماذج كبيرة تتطلب موارد حوسبة ضخمة، تتجه الشركات الآن نحو تطوير قدرات الذكاء الاصطناعي المتقدمة، وخاصة القدرة على التفكير والاستنتاج.
لقد فتح هذا التحول الباب أمام الشركات الناشئة المبتكرة مثل DeepSeek الصينية - التي لم تتلق استثمارات خارجية بمليارات الدولارات - لتحقيق إنجازات كبيرة بميزانيات محدودة.
يقول علي قدسي، الرئيس التنفيذي لشركة Data ricks، المتخصصة في بناء واستضافة نماذج الذكاء الاصطناعي المخصصة: «إنه تحول نموذجي نحو الاستنتاج، وسيكون ذلك أكثر ديمقراطية».
تلاحظ القدس أن التركيز على تطوير القدرة على التفكير والاستنتاج، بدلاً من مجرد زيادة حجم النموذج، يمنح الشركات الناشئة فرصة للمنافسة والتفوق، حتى لو لم يكن لديها موارد مالية كبيرة.
يؤكد نيك فروست، المؤسس المشارك لشركة Cohere الناشئة، التي تعمل في بناء نماذج الذكاء الاصطناعي المتطورة، أنه من الواضح منذ فترة طويلة أن الابتكار وتطوير القدرات المتقدمة مثل التفكير - بدلاً من مجرد ضخ كميات غير محدودة من قوة الحوسبة لحل المشكلات - هو السبيل لتحقيق الاختراقات التكنولوجية التالية، لذا فإن ما نشهده الآن هو لحظة فاصلة عندما يكون الجميع واضحًا ما كان واضحًا لفترة طويلة. "
والثانية ؛ ما هو تأثير DeepSeek على صناعة الذكاء الاصطناعي ؟
في الأيام الأخيرة، توافد الآلاف من المطورين وعشاق الذكاء الاصطناعي على DeepSeek وتطبيقها الرسمي لتجربة أحدث طرازات الشركة، ومشاركة أمثلة على قدراتها المتطورة عبر منصات التواصل الاجتماعي، مما أحدث ضجة كبيرة في مجتمع التكنولوجيا.
تراجعت أسهم شركات التكنولوجيا الأمريكية، بما في ذلك شركة صناعة الرقائق Infidia، ردًا على ذلك يوم الاثنين الماضي، حيث بدأ المستثمرون في التساؤل عن المبالغ الضخمة التي تذهب إلى تطوير الذكاء الاصطناعي.
تم تطوير نماذج DeepSeek في مختبر أبحاث صغير نسبيًا في الصين، انطلاقًا من أحد أفضل صناديق التحوط الكمية أداءً في البلاد. في ورقة بحثية نُشرت على الإنترنت في ديسمبر الماضي، زعمت الشركة أن طرازها اللغوي الكبير السابق (DeepSeek-V3) لم يكلف سوى 5.6 مليون دولار، وهو جزء بسيط من المبلغ الذي يحتاجه منافسوها لمشاريع مماثلة.
ذكرت OpenAI سابقًا أن بعض طرازاتها تكلف أكثر من 100 مليون دولار، ومن المحتمل أن تكلف الطرز الحديثة من OpenAI وكذلك Google و Meta و Anthropic أكثر من ذلك بكثير.
أثار أداء وكفاءة نماذج DeepSeek العديد من الأسئلة حول مستقبل الاستثمارات الضخمة في الذكاء الاصطناعي، وأظهر أن الابتكار ليس بالضرورة مرتبطًا بحجم الإنفاق، وقد دفع الشركات الكبرى إلى إعادة تقييم استراتيجياتها، والبحث عن طرق لتقليل التكاليف وزيادة الكفاءة.
قال مهندس في ميتا، طلب عدم الكشف عن هويته: "لأنه غير مخول بالتحدث علنًا - في بيان لـ Wired:" من المحتمل أن تحاول ميتا دراسة تقنيات DeepSeek لإيجاد طرق لتقليل إنفاقها على الذكاء الاصطناعي. "
وقال متحدث باسم ميتا في بيان: "نعتقد أن نماذج المصادر المفتوحة تقود تحولًا كبيرًا في الصناعة، وهذا سيجلب فوائد الذكاء الاصطناعي للجميع بسرعة أكبر، ونريد أن تظل الولايات المتحدة الرائدة في مجال الذكاء الاصطناعي المفتوح المصدر، ليس الصين، ولهذا السبب تقوم ميتا بتطوير الذكاء الاصطناعي مفتوح المصدر من خلال نماذج Our Llama، الذي تم تنزيله أكثر من 800 مليون مرة ".
ومع ذلك ؛ لا يزال السعر الحقيقي لتطوير نماذج DeepSeek الجديدة غير معروف بدقة، لأن الرقم المذكور في الورقة قد لا يعكس التكلفة الإجمالية.
قال أوميش بادفال، العضو المنتدب لشركة Thomvest Ventures، وهي شركة استثمارية للذكاء الاصطناعي: «لا أعتقد أن تكلفة تطوير طرازات DeepSeek تبلغ 6 ملايين دولار، ولكن حتى لو كانت 60 مليون دولار، فهذا تحول كبير في اللعبة، وسيضغط على ربحية الشركات التي تركز على تطوير الذكاء الاصطناعي الموجه نحو المستهلك».
قال علي قدسي، الرئيس التنفيذي لشركة Data Ricks: «بعد فترة وجيزة من كشف DeepSeek عن تفاصيل أحدث طرازها، بدأ العملاء في التساؤل عما إذا كان بإمكانهم استخدام هذا النموذج، بالإضافة إلى التقنيات التي طورتها DeepSeek، لتقليل التكاليف في مؤسساتهم».
وأشار إلى أن تقنية Distillation، وهي تقنية يستخدمها مهندسو DeepSeek، والتي تتضمن استخدام مخرجات نموذج لغوي كبير لتدريب نموذج آخر، هي تقنية فعالة من حيث التكلفة وسهلة التطبيق نسبيًا.
والثالث ؛ لماذا هناك مخاوف من الاعتماد على عارضة أزياء صينية ؟
تعتقد بادفال أن نماذج مثل DeepSeek ستفيد في النهاية الشركات التي تسعى إلى تقليل نفقات الذكاء الاصطناعي الخاصة بها، لكنها شددت على أن العديد من الشركات قد تكون لديها مخاوف بشأن الاعتماد على نموذج صيني للتعامل مع البيانات الحساسة.
أعلنت شركة Perplexity، وهي شركة رائدة في مجال الذكاء الاصطناعي، عن استخدامها لطراز DeepSeek R1، لكنها أكدت أن النموذج يتم استضافته بشكل مستقل تمامًا عن الصين لتبديد هذه المخاوف.
كما أشاد أمجد مسعد، الرئيس التنفيذي لشركة Replit، وهي شركة ناشئة توفر أدوات برمجة باستخدام الذكاء الاصطناعي، بأحدث نماذج DeepSeek في حديثه مع مجلة WIRED، موضحًا أنه يفضل نموذج Sonnet من Anthropic في العديد من مهام هندسة الكمبيوتر، ولكنه معجب بشكل خاص بقدرة نموذج DEEepSEEek R1 لتحويل تعليمات النصوص. كما أشار إلى أنهم يدرسون إمكانية استخدامه على وجه التحديد في مجال التفكير المنطقي.
والرابع ؛ كيف طورت DeepSeek نماذجها ؟
أحدث إصدارين من DeepSeek، DeepSeek R1 و DeepSeek R1-Zero، لديهما القدرة على التقاط الأنظمة الأكثر تطورًا من OpenAI و Google، وتعتمد جميع هذه الأنظمة على تقسيم المشكلات إلى أجزاء لمعالجتها بشكل فعال، وهي عملية تتطلب قدرًا كبيرًا من التدريب الإضافي لضمان وصول المعلومات الاستخبارية الصحيحة.
توضح ورقة بحثية نشرها باحثو DeepSeek الأسبوع الماضي بالتفصيل نهج الشركة في إنشاء طرازات R1، والتي تدعي أنها تعمل بشكل جيد في بعض المعايير، وتطابق نموذج التفكير الثوري لـ OpenAI المعروف باسم o1، والتكتيكات التي تستخدمها DeepSeek تتضمن طريقة أكثر آلية لتعلم كيفية حل المشكلات بشكل صحيح، بالإضافة إلى استراتيجية لنقل المهارات.
أحد أكثر الموضوعات تخمينًا حول DeepSeek هو الرقائق التي استخدمتها، وهذا السؤال جدير بالملاحظة بشكل خاص ؛ لأن الحكومة الأمريكية فرضت سلسلة من ضوابط التصدير والقيود التجارية الأخرى على مدى السنوات القليلة الماضية، بهدف الحد من قدرة الصين على الحصول على الرقائق المتطورة اللازمة لبناء أو تصنيع ذكاء اصطناعي متقدم.
في ورقة بحثية نُشرت في أغسطس 2024، أشارت DeepSeek إلى أنها تمكنت من الوصول إلى مجموعة من 10000 شريحة (Nvidia A100)، والتي تم وضعها تحت القيود الأمريكية التي تم الإعلان عنها في أكتوبر 2022. في ورقة منفصلة نُشرت في يونيو 2024، ذكرت DeepSeek أن نموذجًا سابقًا أنشأته يسمى DeepSeek-V2 تم تطويره باستخدام مجموعات من الرقائق (Nvidia H800)، وهي شريحة أقل قدرة طورتها Infidia خصيصًا للصين للامتثال لضوابط التصدير الأمريكية.
يقدر مصدر الذكاء الاصطناعي، الذي يدرب نماذج لغوية كبيرة، أن DeepSeek استخدمت على الأرجح حوالي 50000 جزء من Infidia لبناء تقنيتها.
رفضت Infidia التعليق مباشرة على أي من رقاقاتها التي ربما اعتمدت عليها DeepSeek، وقال متحدث باسم الشركة في بيان: «نماذج DeepSeek هي تقدم ممتاز في الذكاء الاصطناعي»، مضيفًا أن نهج الشركة في التفكير يتطلب أعدادًا كبيرة من وحدات معالجة الرسومات من Infidia وشبكات عالية الأداء.
ومع ذلك، تُظهر نماذج DeepSeek، بغض النظر عن كيفية بنائها، أن تبني نهج أكثر انفتاحًا لتطوير الذكاء الاصطناعي أصبح أكثر انتشارًا.
توقع كليم ديلانج، الرئيس التنفيذي لشركة HuggingFace، في ديسمبر الماضي أن تتولى شركة صينية زمام المبادرة في مجال الذكاء الاصطناعي بسبب سرعة الابتكار في النماذج مفتوحة المصدر، التي تتبناها الصين إلى حد كبير. الآن يؤكد أنها سارت أسرع مما كان يعتقد.
والخامس ؛ ما هو مستقبل الذكاء الاصطناعي ؟
يعد ظهور DeepSeek علامة فارقة في تطوير الذكاء الاصطناعي، ويشير إلى أن المنافسة في هذا المجال ستشهد تحولًا كبيرًا خلال الفترة المقبلة. مع دخول لاعبين جدد ومبتكرين، قد نرى ثورة في طريقة تطوير الذكاء الاصطناعي واستخدامه، مما سيؤدي إلى تغييرات جذرية في مختلف الصناعات.