النماذج اللغوية الكبيرةأخبار الذكاء الاصطناعي

BAGEL AI أول نموذج مفتوح المصدر لتعديل الصور

في وقتٍ تتسارع فيه خطوات الذكاء الاصطناعي نحو محاكاة قدرات الإنسان، ظهر اسم جديد يلفت الأنظار: BAGEL AI ، النموذج الموحد مفتوح المصدر من شركة “بايت دانس”.

يعد BAGEL AI نقلة نوعية في عالم النماذج التوليدية، إذ يجمع بين فهم النصوص والصور والفيديوهات داخل عقل واحد قادر على التفكير والإبداع متعدد الوسائط. ما يميّزه ليس فقط قدراته المدهشة، بل كونه متاحًا للجميع يمكن لأي مستخدم أو مطور تجربته بحرية، مما يفتح الباب أمام حقبة جديدة من الذكاء الاصطناعي الشامل الذي يرى ويفكر ويتفاعل مثل الإنسان.

ما هو BAGEL AI؟

تخيل أن هناك ذكاءً اصطناعيًا واحدًا يمكنه أن:

  • يقرأ نصوصك،
  • ينظر إلى صورك،
  • يفهم ما في الفيديو،
  • ويتحدث معك عنها كلها في آن واحد!

هذا هو BAGEL AI، أول نموذج مفتوح المصدر من شركة ByteDance (الشركة المالكة لتطبيق TikTok)، يجمع بين كل أنواع الفهم البشري تقريبًا داخل نموذج واحد. فهو ليس مجرد شات مثل ChatGPT للنصوص فقط، بل يمكنه أن يرى ويتحدث ويفهم الصور والفيديوهات والمستندات في الوقت نفسه.

فكرة BAGEL AI ببساطة

إذا كان ChatGPT مثل “مساعد لغوي ذكي” يفهم النصوص فقط، فإن BAGEL AI مثل “مساعد ذكي شامل” يرى ويسمع ويفكر. يعني ذلك أنه يمكن للمستخدم أن يقول له مثلاً: “انظر إلى هذه الصورة، هل يمكنك أن تصف لي ما يحدث؟”. أو “أنشئ لي فيديو قصير بنفس نمط هذا المقطع، لكن بجو أكثر مرحاً.” أو “حرر هذه الصورة واجعل الخلفية أكثر إشراقاً.” أو حتى “لخّص لي ما يقوله هذا الفيديو في 5 نقاط.”

وسينفّذ كل ذلك من داخل نفس النموذج دون الحاجة لاستخدام أدوات منفصلة لكل مهمة.

ما الذي يميّزه عن النماذج الأخرى؟

المقارنةالنماذج التقليدية (مثل ChatGPT أو Midjourney)BAGEL AI
نوع الإدخالنص فقط أو صورة فقطنصوص + صور + فيديو + مزيج منهم
الفهميفهم نصوصًايفهم ما يراه ويسمعه ويقرأه
التوليديولّد نصوصًا أو صورًا حسب النموذجيولّد ويعدّل نصوصًا وصورًا وفيديوهات في نفس الجلسة
نوع الاستخدامتخصصي (كل أداة لمهمة واحدة)موحد (أداة واحدة لكل شيء)
الترخيصمغلق المصدر غالبًامفتوح المصدر (مجاني وقابل للتخصيص)

كيف يستخدمه المستخدم العادي؟

رغم أن BAGEL AI صُمم للأبحاث والتطوير، إلا أن استخدامه أصبح أسهل بفضل كونه مفتوح المصدر. إليك ما يمكن أن يفعله المستخدم العادي به:

  1. تحليل الصور والفيديوهات:
    يمكنك رفع صورة أو مقطع فيديو وسؤاله:
    “ماذا يحدث هنا؟ من في الصورة؟ ما المشاعر الظاهرة؟”
  2. إنشاء محتوى بصري:
    “أنشئ صورة لطفل يركب دراجة في شارع قديم.”
    أو
    “حوّل هذه الصورة إلى مشهد ليلي.”
  3. التفاعل مع المستندات أو العروض:
    ارفع عرض PowerPoint أو ملف PDF، واطلب منه تلخيصه أو تحويله إلى فيديو تفاعلي.
  4. المساعدة في التعليم:
    الطالب يمكنه أن يطلب من BAGEL AI مثلاً:
    “اشرح لي هذا المخطط الفيزيائي.”
    فيقوم بتحليل الصورة وشرح العلاقة بين عناصرها.
  5. تحرير الفيديوهات:
    بفضل دمج فهم المشاهد والتوليد، يمكن للمستخدم أن يقول:
    “احذف الجزء الذي يظهر فيه الشخص الثاني من الفيديو.”
    وسيتولّى BAGEL AI هذه العملية.

لماذا يُعدّ خطوة مهمة؟

لأنّه يمثّل جيلًا جديدًا من الذكاء الاصطناعي جيل لا يفرّق بين النص والصورة والفيديو، بل يفهمها كلها كجزء من “قصة واحدة”. ولأن النموذج مفتوح المصدر، فالمطورون في العالم يمكنهم استخدامه مجاناً لبناء:

  • أدوات تحرير ذكية،
  • مساعدين افتراضيين أكثر وعيًا،
  • تطبيقات تعليمية،
  • أنظمة مراقبة وتحليل،
  • وحتى روبوتات تفهم بيئتها المرئية.

مثال عملي للتوضيح

تخيل تطبيقًا يعمل بذكاء BAGEL AI، يمكنك أن تقول له:“التقط صورة للغرفة وأخبرني ما الذي يمكن تحسينه في ديكور الأثاث.”

سيحلّل الصورة، ويقترح مثلاً: “حاول تغيير إضاءة الزاوية اليسرى، أو استخدم لوحة جدارية بلون أفتح.”

ثم يمكنك أن تقول: “أنشئ لي صورة تُظهر النتيجة بعد التعديل.” وسيفعل ذلك فورًا.

الخلاصة

BAGEL AI هو أول نموذج مفتوح المصدر يمكنه أن يرى، يقرأ، ويفكر في آنٍ واحد.

يهدف إلى جعل الذكاء الاصطناعي أكثر طبيعية في التعامل مع العالم الحقيقي، كما يفعل الإنسان.

فبدلاً من الانتقال بين أدوات مختلفة لكل نوع من المحتوى، BAGEL يجعل كل ذلك ممكنًا داخل عقل واحد موحّد.

أولاً: ما الذي ستفعله؟

أنت لن تحتاج إلى كتابة أكواد معقّدة، فقط سنُعدّ بيئة بسيطة لتشغيل BAGEL AI محليًا (على جهازك) أو على خدمة سحابية (لو كان جهازك ضعيفًا).

الهدف: أن تتمكن من التحدث مع النموذج، رفع صورة أو فيديو، والحصول على إجابة أو توليد.

إليك دليلًا بسيطًا ومباشرًا للمستخدم العادي لتجربة نموذج BAGEL AI على جهازك، سواء كنت تريد فقط تجربته للتسلية أو لاستخدامه في مشروع عملي صغير.سأشرح الخطوات خطوة بخطوة 

المتطلبات الأساسية

قبل البدء، تأكد من توفر الآتي:

العنصر

المطلوب

💻 نظام التشغيل

Windows / macOS / Linux

🧩 موارد الجهاز

يفضّل GPU (كرت شاشة) بسعة 12GB أو أكثر لكن يمكن تشغيل نسخة خفيفة على CPU

🐍 لغة البرمجة

Python 3.10 أو أحدث

📦 أداة التثبيت

pip (موجودة ضمن Python)

🌐 اتصال بالإنترنت

لتحميل النموذج من GitHub أو Hugging Face

الخطوة 1: تثبيت الأساسيات

افتح Terminal (أو PowerShell) ثم اكتب الأوامر التالية بالترتيب:

mkdir bagel-demo
cd bagel-demo

# إنشاء بيئة عمل مستقلة
python -m venv venv
source venv/bin/activate  # على macOS/Linux
# أو على ويندوز
# venv\Scripts\activate

# تحديث pip
pip install --upgrade pip

الخطوة 2: تنزيل BAGEL AI

# تنزيل النموذج من GitHub الرسمي
git clone https://github.com/ByteDance-Seed/Bagel.git
cd Bagel

# تثبيت المكتبات المطلوبة
pip install -r requirements.txt


الخطوة 3: تنزيل النموذج المدرب (Weights)

لأن حجم BAGEL AI كبير، الفريق وفّره على منصة Hugging Face.

يمكنك تحميله تلقائيًا بالأمر التالي:

python scripts/download_weights.py --model bagel-7b

سيُحمّل الملف داخل مجلد weights/ ويبلغ حجمه بضعة غيغابايت.

هناك نسخ مختلفة:

  • bagel-7b (الأخفّ)
  • bagel-14b (الأكبر والأقوى)

الخطوة 4: تجربة التفاعل النصي البصري

بعد التثبيت، شغّل النموذج التجريبي عبر الأمر:

python app/demo_chat.py

ستظهر لك واجهة بسيطة في المتصفح المحلي (عادة على العنوان):

http://127.0.0.1:7860

سترى مربع حوار مثل واجهة ChatGPT يمكنك أن:

  • تكتب نصًا (مثل: “صف لي هذه الصورة”)
  • أو ترفع صورة من جهازك ليحللها BAGEL AI

أمثلة عملية يمكنك تجربتها:

فهم الصور

ارفع صورة وسأله:

“ماذا ترى في هذه الصورة؟ وما نوع المشهد؟”

تحليل المشاعر

“صف لي مشاعر الأشخاص في الصورة.”

تعديل بصري

“حوّل الخلفية إلى مشهد غروب.”

“اجعل الألوان أكثر دفئاً.”

تحليل فيديو قصير

“استخرج أهم الأحداث في هذا المقطع.”

(سيقوم بتحليل الإطارات واستخراج الملخص الزمني.)

بديل لمن لا يملك حاسوب قوي

يمكنك تشغيل BAGEL بسهولة على الخدمات السحابية المجانية مثل:

  • Google Colab
  • RunPod
  • Hugging Face Spaces

وكلها تتيح تشغيل النموذج دون الحاجة إلى جهاز قوي.

على سبيل المثال في Colab:

  1. افتح Google Colab
  2. انسخ كود التشغيل من صفحة المشروع في GitHub (ملف colab_demo.ipynb)
  3. شغّل الخلايا خطوة بخطوة، وستظهر لك نفس الواجهة.

ملاحظات للمستخدم:

  • BAGEL AI لا يحتاج معرفة عميقة بالبرمجة يكفيك تشغيل الأوامر السابقة فقط.
  • يُفضّل تشغيل النسخة الأخفّ bagel-7b لأنها مناسبة للحواسيب المتوسطة.
  • الواجهة تشبه ChatGPT لكن بإمكانية رفع الصور والفيديوهات مباشرة.

مقالات ذات صلة

زر الذهاب إلى الأعلى