فيديوأدوات وموارد

تعلم بناء نموذج ذكاء اصطناعي خطوة بخطوة للمبتدئين

المادة التدريبية من جامعة ستانفورد قابلة للتحميل والفيديو قابل للترجمة للعربية

مقدمة

ضمن مساق “التعلم الآلي” (CS229) في جامعة ستانفورد، قدّم طالب الدكتوراه في علوم الحاسوب يان دوبوا محاضرة حافلة بالمعلومات تناولت كيفية بناء نموذج ذكاء اصطناعي مثل ChatGPT.

ركّز دوبوا على كشف التفاصيل الخفية في تطوير هذه النماذج، بدءًا من التدريب الأساسي (Pretraining) باستخدام كميات هائلة من البيانات من الإنترنت، وصولًا إلى التدريب اللاحق (Post-training) عبر التعلم المعزز بالتغذية الراجعة البشرية (RLHF)، مما يجعل الذكاء الاصطناعي أكثر قدرة على التفاعل مع المستخدم.

تعد معرفة بناء نموذج ذكاء اصطناعي من المواضيع الأكثر أهمية اليوم، حيث تجمع بين النظريات الأكاديمية والتطبيقات العملية، مما يُساعد الباحثين والمطورين على سد الفجوة بين البحث العلمي والتطبيقات الفعلية.

انقر هنا لمشاهدة المحاضرة على يوتيوب


الركائز الأساسية في كيفية بناء نموذج ذكاء اصطناعي

وفقًا لما جاء في المحاضرة، فإن كيفية بناء نموذج ذكاء اصطناعي تعتمد على خمسة مكونات رئيسية، وهي:

  1. البنية (Architecture): يعتمد تصميم النموذج على بنية Transformer، وهو الأساس الذي تقوم عليه نماذج متقدمة مثل ChatGPT وGPT-4.
  2. خوارزمية التدريب / دالة الخسارة (Training Algorithm/Loss): تعتمد النماذج الحديثة على خسارة الإنتروبيا المتقاطعة (Cross-Entropy Loss) لتحسين قدرتها على التنبؤ.
  3. البيانات (Data): جمع وتنظيم البيانات من أهم الخطوات، حيث تؤثر جودة البيانات بشكل مباشر على أداء النموذج.
  4. التقييم (Evaluation): يتم اختبار النموذج عبر مقاييس معيارية مثل MMLU، مما يساعد في تقييم دقة وموثوقية النموذج.
  5. الأنظمة (Systems): تلعب البنية التحتية الحاسوبية مثل وحدات المعالجة الرسومية (GPUs) دورًا أساسيًا في تدريب النماذج الضخمة.
    شريحة من محاضرة يان دوبوا حول العوامل الأساسية في تدريب نماذج اللغة العملاقة.
    شريحة من محاضرة توضح العوامل الخمسة الحاسمة في تدريب نماذج الذكاء الاصطناعي: البنية، الخوارزميات، البيانات، التقييم، والأنظمة.

التدريب المسبق مقابل التدريب اللاحق

تميّزت المحاضرة بشرح دقيق حول الفرق بين التدريب المسبق (Pretraining)، حيث يتم تغذية النموذج بكم هائل من البيانات، والتدريب اللاحق (Post-training) الذي يشمل التعلم المعزز بالتغذية الراجعة البشرية (RLHF).

أوضح دوبوا أن هذه المرحلة تجعل النموذج أكثر ذكاءً وتكيفًا مع احتياجات المستخدمين، مما يجعل كيفية بناء النموذج عملية دقيقة تتطلب مراحل متعددة لضمان تقديم تجربة تفاعلية مثالية.

 

بينما يهتم الباحثون بتطوير خوارزميات جديدة، فإن الصناعة تركز على شيء أكثر حسمًا: كيف يمكن للنموذج أن يعمل بشكل فعّال وموثوق على نطاق واسع.


التحديات 

أحد أبرز التحديات التي تواجه الباحثين عند التفكير في كيفية بناء نموذج ذكاء اصطناعي هو جمع البيانات وتنقيتها. ليس كل ما يُنشر على الإنترنت صالحًا للتدريب، فهناك الكثير من المحتويات المكررة وغير المفيدة. كما أن بعض الشركات تعتمد على بيانات محمية بحقوق النشر، مما يفتح المجال لنقاشات قانونية وأخلاقية حول البيانات المستخدمة.

كما أوضح دوبوا أن النماذج قد تحقق نتائج ممتازة في الاختبارات، لكنها قد تفشل في التعامل مع الأسئلة الحقيقية، مما يؤكد أن كيفية البناء الناجح يتطلب معايير تقييم دقيقة تتجاوز الاختبارات التقليدية.


التوجهات المستقبلية

اختتم دوبوا محاضرته بنظرة مستقبلية، مشيرًا إلى أن الاتجاه السائد في كيفية بناء نموذج ذكاء اصطناعي يركز على تحسين الأداء مع تقليل استهلاك الموارد. التقنيات مثل Mixture of Experts (MoE) قد تكون الحل الأمثل لتحقيق ذكاء اصطناعي أكثر كفاءة وأقل تكلفة.

في النهاية، أكد الباحث أن نجاح كيفية البناء لا يعتمد فقط على الخوارزميات، بل على جودة البيانات، وإدارة الأنظمة، وتحسين استراتيجيات التقييم.

تحميل المحاضرة أو تصفحها مباشرة

مقالات ذات صلة

Back to top button