ما سر تقاطر الباحثين على نموذج الذكاء الاصطناعي ذائع الصيت «ديبسيك»؟
12 February 2025
نشرت بتاريخ 12 فبراير 2025
يختبر الباحثون مدى كفاءة النموذج المفتوح في إجراء مهام علمية، في موضوعات تنوعت ما بين الرياضيات وعلم الأعصاب الإدراكي.
Mladen Antonov/AFP via Getty
يتقاطر العلماء على «ديبسيك-آر1» DeepSeek-R1، أحد نماذج "التفكير المنطقي" التي تعمل بالذكاء الاصطناعي، وتتميز بالكفاءة وانخفاض التكلفة، والذي تسبَّب في هبوط حاد في سوق الأسهم الأمريكية بعد أن أصدرته شركة صينية في شهر يناير الماضي.
تشير الاختبارات المتكررة إلى أن قدرة «ديبسيك-آر1» على حل المسائل الرياضية والعلمية تضاهي قدرات نموذج «أوه 1» o1، الذي أصدرته شركة «أوبن إيه أي» OpenAI، التي تتخذ من سان فرانسيسكو في كاليفورنيا مقرًا لها، في شهر سبتمبر الماضي، والذي تعد نماذج التفكير المنطقي الخاصة به رائدة في المجال.
ورغم أن «آر1» ما زال عاجزًا عن تنفيذ الكثير من المهام التي قد ينتظرها الباحثون منه، فإنه يمنح العلماء حول العالم الفرصة لتدريب نماذج تفكير منطقي مصممة حسب الحاجة لحل إشكاليات في تخصصاتهم.
تقول اختصاصية أبحاث الذكاء الاصطناعي في جامعة ولاية أوهايو بمدينة كولومبوس، هوان صن: "بالنظر إلى أدائه الرائع وتكلفته المنخفضة، نعتقد أن «ديبسيك-آر1» سوف يشجع مزيدًا من العلماء على تجربة النماذج اللغوية الكبيرة واستخدامها في أداء مهامّهم البحثية اليومية، دون القلق بشأن التكلفة". وتابعت قائلة: "يكاد لا يوجد زميل أو شريك عمل في مجال الذكاء الاصطناعي إلا ويتحدث عنه".
وفي نظر الباحثين، انخفاض تكلفة «آر1» وانفتاحه كفيلان بأن يغيِّرا قواعد اللعبة؛ إذ يمكن لهم التواصل والتفاعل مع النموذج عبر واجهته البرمجية (API) مقابل جزء بسيط من تكلفة النماذج المنافِسة المشمولة بحقوق الملكية، أو مجانًا باستخدام روبوت الدردشة الخاص به عبر الإنترنت، «ديبثينك» DeepThink. كما يمكنهم تنزيل النموذج على الخوادم الخاصة بهم وتشغيله وتطويره مجانًا - وهو ما لا تسمح به النماذج المغلقة المنافِسة، مثل «أوه1».
يقول الباحث المتخصص في الذكاء الاصطناعي في جامعة كولومبيا البريطانية في مدينة فانكوفر الكندية، كونج لو، إنه منذ إطلاق «آر1» في العشرين من يناير الماضي، و"الكثير من الباحثين" بدأوا يتقصَّون سبل تدريب نماذج التفكير المنطقي الخاصة بهم، قياسًا إلى «آر1» وبإلهام منه. هذا ما أثبتته البيانات الآتية من «هاجنج فيس» Hugging Face، وهو مستودع للوصول المفتوح إلى موارد الذكاء الاصطناعي، ويستضيف شفرة «ديبسيك-آر1». ففي الأسبوع الذي تلا إطلاقه، سجل الموقع أكثر من ثلاثة ملايين عملية تنزيل لنسخ مختلفة من «آر1»، تشمل تلك التي طورها منه مستخدمون مستقلون.
تقول صن إن الاختبارات الأولية لقدرات «آر1» التي تركز على المهام العلمية المعتمدة اعتمادًا كبيرًا على البيانات - والمأخوذة من أوراق بحثية حقيقية في مجالات مثل المعلوماتية الحيوية، والكيمياء الحاسوبية، وعلم الأعصاب الإدراكي- أثبتت أن أداءه يضاهي أداء النموذج «أوه1». فقد تحدى فريقها نموذجي الذكاء الاصطناعي لإتمام 20 مهمة ضمن سلسلة من المسائل التي صمموها بعناية، وأطلقوا عليها اسم «ساينس إيجنت بنش» ScienceAgentBench. وتشمل المسائل مهام على غرار تحليل البيانات وتصميمها بصريًا. وقد تمكن كلا النموذجين من حل نحو ثلث المهام بشكل صحيح. تشير صن إلى أن تكلفة تشغيل «آر1» باستخدام الواجهة البرمجية أقل بـ13 مرة من تكلفة «أوه1»، لكنه أبطأ في "التفكير" مقارنة بـ«أوه1».
كما أظهر «آر1» نتائج واعدة في الرياضيات. أراد اختصاصي الرياضيات وعلم الحاسوب في جامعة أكسفورد في بريطانيا، فريدير سايمون، أن يختبر قدرة كلا النموذجين على إنشاء برهان في مجال التحليل الوظيفي المجرد، ووجد أن حجة «آر1» كانت أكثر إيجابية من «أوه1». لكنه يقول إنه نظرًا لأن مثل تلك النماذج ترتكب أخطاء، فإن الاستفادة منها تتطلب من الباحثين أن يكونوا مسلحين مسبقًا بمهارات مثل تمييز البرهان الخاطئ من الصحيح.
ويرجع كثير من الحماس تجاه «آر1» إلى إتاحته في صورة نظام "مفتوح الأوزان" (open-weights)، أي أن العلاقات المكتسبة بين أجزاء خوارزمياته المختلفة متاحة للاستفادة منها وتطويرها. يمكن للباحثين الذي ينزِّلون «آر1»، أو إحدى نسخه الأصغر "المنقحة بالتقطير المعرفي" التي أطلقها «ديبسيك» أيضًا، تحسين أدائه في مجالهم من خلال تدريب إضافي، فيما يُعرف بالضبط والتهذيب. تقول صن إنه متى أُتيحَتْ للباحثين مجموعة البيانات المناسبة، يمكنهم تدريب النموذج لتحسين أدائه للمهام التشفيرية ذات الصلة بالعملية العلمية على وجه الخصوص.
تعد القدرة على تنزيل واستخدام «آر1» على نظام محلي ميزة إضافية من حيث الخصوصية، حسب قول صن، التي توضح أن هذا يسمح للعلماء بالتحكم في بياناتهم ونتائجهم. وتستطرد قائلة: "هذا أمر بالغ الأهمية بشكل خاص للمجالات التي تتعامل مع بيانات حساسة وخاصة، مثل الأبحاث الطبية".
أحدث «ديبسيك» تداعيات في مجال أبحاث الذكاء الاصطناعي أيضًا، حيث استحدث أساليب لتحسين نماذج أخرى لا حصر لها، حسب قول جاك كلارك، المؤسس المشارك في شركة الذكاء الاصطناعي «أنثروبك» Anthropic التي تتخذ من سان فرانسيسكو مقرًا لها، والتي يطلق على نموذجها «كلود» Claude.
أنشأ «ديبسيك» نماذجه المنقحة بالتقطير المعرفي بتعليم القدرات التي يتمتع بها في "التفكير المنطقي" لنماذج لغوية كبيرة أخرى، مثل نموذج «لاما» Llama التابع لشركة «ميتا» Meta. تكشف المسودة البحثية لـ«ديبسيك»، المنشورة1 على خادم «آركايف» arXiv في الثاني والعشرين من يناير المنصرم، أنه نفذ هذا من خلال تدريب هذه النماذج اللغوية الكبيرة على 800 ألف مثال منسَّق قدَّمه لحلول "متسلسلة فكريًّا"، خطوة بخطوة، استحدثها «ديبسيك-آر1».
كتب كلارك في نشرته «إمبورت إيه آي» Import AI قائلًا: "الآن هناك نموذج مفتوح الوزن هائم في فضاء الإنترنت يمكنك استخدامه لتحسين أي نموذج أساسي قوي بما يكفي ليصير ذكاءًا اصطناعيًّا قادرًا على التفكير المنطقي. لقد أحرزت قدرات الذكاء الاصطناعي حول العالم تقدمًا للأمام لا رجعة فيه".
كما يلجأ الباحثون إلى تطبيق التعلم التعزيزي - وهو تقنية التجربة والخطأ والمكافأة المستخدمة في تطوير «ديبسيك-آر1» - لكن مع تهذيبها لتناسب مهمتهم الخاصة، حسب قول لو، الذي ساهم العام الماضي في إنشاء «إيه آي ساينتست» AI Scientist، ذلك النموذج الذي يمكنه أداء مجموعة كاملة من المهام البحثية في مجال تعلم الآلة، بدايةً من استعراض الأدبيات العلمية ووضع فرضية، وحتى كتابة ورقة بحثية كاملة. ويتابع قائلًا إنه بتحديد "إشارة المكافأة" المناسبة، يمكن للباحثين تدريب النموذج لتحقيق أي هدف.
لكن «ديبسيك» أبعد ما يكون عن الكمال. فروبوت الدردشة «ديبثينك» يفشل في إتمام مهام بسيطة نسبيًا معروفة بتعثر نماذج لغوية كبيرة فيها، بما في ذلك «أوه1»؛ مثل عد الولايات الأمريكية التي تحتوي أسماؤها على حرف W. وعن هذا يقول لو: "قد يُخيَّل للناس أنه قادر على صنع معجزات، وهو أمر مبالغ فيه، لكنه الأفضل في مجاله".
وعلى غرار نماذج صينية أخرى، لاحظ الباحثون أن «ديبسيك-آر1» يرفض الإجابة عن الأسئلة الحساسة سياسيًا (مثل أحداث ميدان السلام السماوي في بكين)، على أنه من غير الواضح ما إذا كان هذا مدمجًا في صلب النموذج أم أنه مُطبَّق على مستوى واجهته البينية. يقول اختصاصي علم الحاسوب في جامعة ولاية أريزونا في مدينة تيمبي الأمريكية، سوباراو كامبهامباتي: "مما رأيت، يبدو أن الرقابة إضافة خرقاء وليست في صميم النموذج".
* هذه ترجمة المقال الإنجليزي المنشور في دورية Nature بتاريخ 29 يناير 2025.
doi:10.1038/nmiddleeast.2025.16
1. DeepSeek-AI et al. Preprint at arXiv https://doi.org/10.48550/arXiv.2501.12948 (2025).
تواصل معنا: