
الكشف عن التكلفة الحقيقية لتدريب ديب سيك
بين الرقائق الأميركية والابتكار الصيني: صراع يتجاوز التقنية
كشفت شركة ديب سيك الصينية عن مفاجأة جديدة في سباق الذكاء الاصطناعي، إذ أعلنت أن تدريب نموذجها الأخير R1 كلّفها نحو 294 ألف دولار فقط، وهو رقم يختلف جذرياً عن التكاليف الضخمة التي يتحدث عنها منافسوها في الولايات المتحدة. تضاف إلى ذلك، فإن ديب سيك قد ساهمت بشكل كبير في هذه الإنجازات.
جاء الإعلان الجديد عبر ورقة بحثية محكّمة نشرتها مجلة Nature، يعيد إشعال النقاش حول موقع بكين في المنافسة العالمية على تطوير تقنيات الذكاء الاصطناعي.
هذا النجاح يعكس الابتكار المستمر لشركة ديب سيك ويؤكد قدرتها على المنافسة في الساحة العالمية.
كيف أربكت ديب سيكالأسواق؟
في يناير الماضي، أثارت DeepSeek زوبعة في الأسواق بعدما طرحت أنظمة ذكاء اصطناعي منخفضة التكلفة، ما دفع المستثمرين العالميين إلى التخلص من أسهم التكنولوجيا خوفاً من تهديد هيمنة الشركات الكبرى مثل Nvidia. ومنذ ذلك الوقت، تراجع ظهور الشركة ومؤسسها ليانغ وينفِنغ في العلن، باستثناء بعض التحديثات المحدودة لمنتجاتها.

الأرقام وراء النموذج R1
وفقاً للمقال في “Nature”، فإن تدريب نموذج R1 الموجَّه نحو الاستدلال، استغرق 80 ساعة فقط على عنقود يضم 512 شريحة من نوع Nvidia H800، وبكلفة إجمالية بلغت 294 ألف دولار. هذه الأرقام تبدو متواضعة إذا ما قورنت بتصريحات سام ألتمان، الرئيس التنفيذي لشركة OpenAI، الذي قال العام الماضي إن تدريب النماذج الأساسية لديهم كلّف “أكثر بكثير” من 100 مليون دولار.
شرائح محلية.. أم محظورة؟
يثير إعلان DeepSeek تساؤلات حول نوعية الشرائح المستخدمة. فـ Nvidia H800 صُممت خصيصاً للصين بعد أن منعت الولايات المتحدة تصدير الشرائح الأكثر تقدماً H100 وA100 إليها.
لكن تقارير أميركية أشارت إلى أن DeepSeek ربما حصلت على “كميات كبيرة” من شرائح H100 رغم القيود. وفيما أكدت Nvidia أن الشركة الصينية استخدمت شرائح H800 المتاحة قانونياً، اعترفت DeepSeek في وثيقة مرافقة لمقال “نيتشر” بأنها تملك بالفعل بعض شرائح A100 واستخدمتها في المراحل التحضيرية لتطوير R1.
تقنية “التقطير” المثيرة للجدل
واحدة من أكثر النقاط إثارة للجدل هي اعتماد DeepSeek على ما يُعرف بـ التقطير (Model Distillation)، وهي تقنية تسمح للنموذج الجديد بالتعلّم من نموذج آخر، مما يخفض التكاليف بشكل كبير.
وفي يناير، اتهمتها شخصيات بارزة في الولايات المتحدة بأنها “قطّرت” نماذج OpenAI داخل نماذجها الخاصة. الشركة ردّت بأنها ترى التقطير وسيلة لرفع الأداء مع تقليل الكلفة واستهلاك الطاقة، ما يفتح المجال أمام وصول أوسع إلى تقنيات الذكاء الاصطناعي.
وفي بحثها الأخير، أقرت ديب سيك أن بيانات تدريب نموذج V3 اعتمدت على صفحات ويب تحوي “عدداً كبيراً من إجابات صادرة عن نماذج OpenAI”، لكنها شددت أن ذلك لم يكن مقصوداً بل جاء عرضاً.
إلى أين يتجه السباق؟
بكلفة لا تتجاوز 300 ألف دولار لتدريب نموذج متقدم، تُظهر DeepSeek أن الصين لا تزال قادرة على مفاجأة العالم في سباق الذكاء الاصطناعي. لكن الجدل حول اعتمادها على شرائح محظورة أو تقنيات التقطير يضعها في مواجهة مع الولايات المتحدة، ويزيد من حدة التوتر في هذا القطاع الاستراتيجي.
