حقق باحثو الذكاء الاصطناعي في جامعتي ستانفورد وواشنطن إنجازًا لافتًا بتطوير نموذج استدلال ذكاء اصطناعي مقابل أقل من 50 دولارًا فقط في رصيد الحوسبة السحابية، وفقًا لورقة بحثية نُشرت يوم الجمعة الماضي.
النموذج، المعروف باسم s1، أثبت كفاءة لافتة في اختبارات الرياضيات والترميز، حيث أظهر أداءً مماثلًا لنماذج متقدمة مثل o1 من OpenAI وR1 من DeepSeek.
ويتوفر النموذج مع البيانات والرمز المستخدم لتدريبه على منصة GitHub، مما يجعله متاحًا للباحثين والمطورين حول العالم.
اعتمد فريق البحث في تطوير s1 على نموذج جاهز، وقاموا بتحسينه عبر تقنية التقطير، وهي عملية تتيح لنموذج ذكاء اصطناعي اكتساب قدرات استدلالية من نموذج أكثر تطورًا عبر التدريب على إجاباته.
وأوضح الباحثون أن s1 مستمد من نموذج التفكير المنطقي Gemini 2.0 Flash Thinking Experimental التابع لشركة Google، وهي نفس الطريقة التي استخدمها باحثو جامعة بيركلي الشهر الماضي لإنشاء نموذج تفكير منطقي بتكلفة بلغت 450 دولارًا.
ورغم أن هذه الخطوة تفتح آفاقًا جديدة أمام الباحثين المستقلين والشركات الناشئة، إلا أنها تثير في الوقت ذاته تساؤلات حول إمكانية استنساخ نماذج ذكاء اصطناعي متقدمة بكلفة منخفضة، مما قد يؤثر على كبرى الشركات التقنية.
ويبدو أن هذا القلق مبرر، حيث سبق أن اتهمت OpenAI شركة DeepSeek بجمع بيانات بشكل غير قانوني من واجهة برمجة التطبيقات الخاصة بها لاستخدامها في تطوير نماذجها.
وأشار الفريق البحثي إلى أن نهجهم يركز على تحقيق أداء قوي بأبسط الوسائل، مع تعزيز قدرة النموذج على “التفكير المطوّل” قبل تقديم الإجابة، وهو ما يتشابه مع استراتيجيات متبعة في نماذج أخرى مثل o1 من OpenAI.
كما بيّنت الدراسة أن s1 يمكن تدريبه باستخدام بيانات محدودة عبر تقنية الضبط الدقيق الخاضع للإشراف (SFT)، والتي تعد أقل تكلفة مقارنة بأساليب التعلم التعزيزي واسعة النطاق التي استخدمتها DeepSeek.
ويعتمد s1 على نموذج ذكاء اصطناعي صغير مفتوح المصدر طوره مختبر Qwen التابع لشركة Alibaba، وتم تدريبه باستخدام ألف سؤال فقط، مصحوبة بإجاباتها وطرق التفكير وراءها، مستمدة من Gemini 2.0 Flash Thinking Experimental.
وقد استغرق تدريب النموذج أقل من 30 دقيقة على 16 وحدة معالجة رسومية من نوع Nvidia H100، وهي موارد يمكن تأجيرها اليوم بحوالي 20 دولارًا فقط، وفقًا لأحد الباحثين في الفريق.
ومن بين الابتكارات التي عززت دقة النموذج، استخدام كلمة “انتظر” أثناء عملية التفكير، مما أدى إلى تحسين جودة الإجابات، وفقًا لما ذكرته الورقة البحثية.
ويأتي هذا الإنجاز في وقت تستعد فيه شركات التكنولوجيا الكبرى مثل Meta وGoogle وMicrosoft لاستثمار مئات المليارات من الدولارات في تطوير البنية التحتية للذكاء الاصطناعي خلال عام 2025، مما يطرح تساؤلات حول مستقبل تطوير نماذج الذكاء الاصطناعي، وما إذا كانت تقنيات مثل “التقطير” ستحدّ من احتكار الشركات الكبرى لهذا المجال، أم أنها مجرد خطوة نحو تحسين النماذج الحالية دون إحداث قفزة نوعية في الذكاء الاصطناعي.
اترك تعليقاً