نظم ذكاء اصطناعي... لجميع اللغات والثقافات
✨ AI Summary
🔊 جاري الاستماع
if (isMobileDevice()) { document.write(""); }); }); } لطالما رغب المبرمج المصري عاصم صبري في نموذج ذكاء اصطناعي يُمثل ثقافته. لكن المشكلة تكمن في عدم عثوره على نموذج مثل هذا. ويقول صبري: «صناعة الذكاء الاصطناعي في مصر... غير موجودة». لذا قام ببناء نموذجه الخاص: «حورس»، نسبةً إلى إله السماء المصري القديم. «حورس» على منصة «Hugging Face» «حورس» للذكاء الاصطناعي يقول صبري إن الهدف كان التوقف عن «الاعتماد على نماذج أخرى، مثل النماذج الأميركية أو الصينية»، والتوجه بدلاً من ذلك عن شكل النموذج الذي يُركز بشكل أكبر على الثقافة المصرية. ولجعل «حورس» يعمل، قام بتدريبه باستخدام وحدات معالجة الرسومات من «غوغل كولاب» Google Colab ومزودي خدمات سحابية آخرين، إلى جانب مجموعات بيانات مفتوحة المصدر. وقد حقق النموذج، الذي تم إصداره في أوائل أبريل (نيسان) الحالي، أكثر من 800 عملية تنزيل في أسبوعه الأول على منصة «Hugging Face». انحصار لغوي ويُعدّ صبري واحداً من بين عدد متزايد من المطورين الذين يسعون لتصحيح خللٍ مزمن في مجال الذكاء الاصطناعي. فالنماذج تتقن الإنجليزية، وإلى حدٍّ أقل، الصينية، لكنها أقل كفاءةً بكثير في معظم اللغات الأخرى. واللغات التي تُصنّف على أنها لغات أقلية، هي في الواقع لغات الأغلبية العالمية. ومع ذلك، وبفضل طريقة تدريب النماذج (على كميات هائلة من البيانات المُستخرجة من الإنترنت)، بالإضافة إلى اقتصاديات صناعة التكنولوجيا، تبقى الإنجليزية هي اللغة المهيمنة. فجوة اللغات في عام 2023، نشرت الباحثة علياء بهاتيا، بالتعاون مع زميل لها في مركز الديمقراطية والتكنولوجيا، دراسةً تُشير إلى أن اللغات غير القياسية «ضاعت في الترجمة» بسبب تأثيرات التنعيم والحوافز التجارية التي تُشكّل شركات التكنولوجيا الكبرى. ففي خضمّ التهافت على الاستفادة من الذكاء الاصطناعي، أعطت الشركات الأولوية لدعم اللغة الإنجليزية، ويعود ذلك جزئياً إلى محدودية بيانات التدريب، ولم تبذل جهداً يُذكر لسدّ هذه الفجوة. لسنوات، عزّزت الاعتبارات الاقتصادية هذه المشكلة. فتدريب نماذج الذكاء الاصطناعي مُكلف، ولا تملك الشركات حافزاً يُذكر لتطوير نماذج تدعم مجموعات لغوية أصغر حجماً دون عائد واضح. نماذج محلية وقد بدأ هذا الوض...





