أداة Whisper من OpenAI تعاني من “الهلوسات”
OpenAI Whisper: التحديات والدقة في النسخ الصوتي المعتمد على AI
هل يمكن للذكاء الاصطناعي أن يكون بديلًا موثوقًا للبشر في تحليل النصوص وتوليدها؟ سؤال يطرح نفسه بقوة مع انتشار أدوات الترجمة والنصوص التلقائية.
من بين هذه الأدوات تبرز أداة Whisper، التي طورتها شركة OpenAI بوصفها واحدة من الأدوات الرائدة في مجال النسخ الصوتي المعتمد على الذكاء الاصطناعي. ومع الترويج لها بأنها تتمتع بدقة “تضاهي البشر”، يتساءل الخبراء اليوم عن مدى إمكانية الاعتماد عليها في السياقات الحساسة.
هلوسات الذكاء الاصطناعي
رغم أن أداة Whisper أظهرت كفاءة عالية في بعض التطبيقات، إلا أنها تعاني من مشكلة خطيرة تُعرف في الصناعة باسم “الهلوسات” التي تتسبب في اختراع فقرات أو جمل بأكملها، مما يشكل خطرًا في حالات معينة، خصوصًا عندما تتضمن هذه الهلوسات تعليقات عنصرية، أو اقتراحات عنيفة، أو حتى معلومات طبية غير دقيقة.
وأشارت تقارير عديدة من مهندسين وباحثين أكاديميين إلى أن تلك الأخطاء ليست نادرة. فعلى سبيل المثال، أوضح باحث من جامعة ميشيغان أنه في دراسة تتعلق باجتماعات عامة، وجد أن 8 من كل 10 نسخ تم تحليلها تحتوي على هلوسات.
وفي تجربة أخرى، اكتشف مهندس تعلم آلي أخطاء مشابهة في نصف الساعات التي فحصها، فيما أشار مطور آخر إلى وقوع المشكلة في ما يقارب 26,000 تسجيل صوتي.
هل يمكن الاعتماد على Whisper؟
تكمن خطورة هذه الهلوسات في أن بعض المؤسسات بدأت باستخدام Whisper في بيئات حساسة، مثل المجال الطبي. إذ تسعى بعض المراكز الطبية لاستخدام الأداة في نسخ استشارات المرضى مع الأطباء، رغم التحذيرات الصادرة عن OpenAI بعدم استخدامها في “القطاعات عالية المخاطر”، لأن أي خطأ في النسخ يمكن أن يؤدي إلى سوء تشخيص أو إرشادات خاطئة، مما قد يهدد حياة المرضى.
ما وراء الأرقام
حتى مع التسجيلات الصوتية الواضحة والقصيرة، أثبتت الدراسات أن Whisper لا يزال يرتكب أخطاء. ففي دراسة حديثة حللت 13,000 تسجيل صوتي قصير، تم اكتشاف 187 حالة هلوسة. وإذا أخذنا هذه النسبة في الاعتبار على نطاق أوسع، فإننا قد نتحدث عن عشرات الآلاف من الأخطاء في ملايين التسجيلات، وهو ما يمثل تحديًا كبيرًا.
توخي الحذر في الاستخدام
في حين أن أدوات النسخ والتوليد التلقائي للنصوص مثل Whisper تقدم إمكانات هائلة لتسريع العمل وتقليل التكاليف، إلا أن استخداماتها في مجالات حساسة تحتاج إلى مراقبة حثيثة وتقويم مستمر. ينصح الخبراء بعدم الاعتماد الكامل على هذه الأدوات دون مراجعة بشرية دقيقة، خاصة في البيئات الطبية أو القانونية.
بين الابتكار والرقابة
تعكس ظاهرة الهلوسة في أدوات الذكاء الاصطناعي مثل Whisper وChatGPT تحديًا معقدًا في توظيف التكنولوجيا المتقدمة بطرق آمنة وموثوقة. في حين تتيح هذه الأدوات إمكانيات هائلة لتسريع العمل وتبسيط المهام، إلا أن الأخطاء الفادحة التي قد تنتج عن الهلوسات تهدد سلامة المستخدمين وتثير تساؤلات أخلاقية ومهنية.