m

فئة :

2019 Dec 14

اللّغة العربيّة والذكاء الاصطناعيّ

بمناسبة اليوم العالميّ للُّغة العربيّة

لابدّ من بناء بيت خبرة يجمع المتخصصين من أهل الحاسب واللغة العربيّة

شدّد الدكتور عبدالرّحمن العصيميّ على ضرورة حوسبة اللّغة العربيّة من قِبل المهتمّين بها لاستخدامها في كلّ التطبيقات لمواكبة تطورات الحوسبة، مستعرضًا النّمذجة وأنماطها: اللّغوية والتوزيعيّة، وطريقة استقبال الحاسب الآلي للمعلومات وآلية التقويم والاحتفاظ بالنموذج الأفضل وضبط القواعد، وأهميتها للحدّ من الرسائل المزعجة ورسائل الاحتيال الإلكترونيّ، جاء ذلك في محاضرة ألقاها في مجلس حمد الجاسر بعنوان: “اللّغة العربيّة والذكاء الاصطناعيّ” أدارها د.عبدالعزيز الخراشيّ؛ ضحى السبت 17 ربيع الآخر 1441هـ الواقع في 14 كانون الأوّل (ديسمبر) 2019م.

وقال: إن اللّغة العربيّة والذكاء الاصطناعيّ علمٌ بينيّ يسمّى اللغويّات الحاسوبيّة، أو معالجة اللغويّات الطبيعيّة، ويهتم في التخصّصات اللّغوية والتطبيقيّة والذّخائر والمدونات اللّغويّة، واستعرض العديد من الأمثلة لتوضيح الحاسب الآلي والذكاء الاصطناعيّ منها كشف البريد الإلكتروني المزعج، وقال: إنّ البريد الإلكتروني منصّة تواصل من أقدم المنصّات الإلكترونية، واختُرعت قبل المواقع الإلكترونية في 1970م، ومع كثرة مستخدميه أصبحت بعض الجهات تستخدم البريد الإلكتروني المزعج لإعلانات غير مرغوب بها، أو رسائل تصيّد، وبدأت في الانتشار منذ عام 1990م وأصبح الحاسب الآلي مطالبًا بتنقية هذه الرسائل المزعجة حتى اُضطرّ المبرمجون على عمل أنظمة تحدّد البريد المزعج من غيره.

وذكر أن خوارزميّات الحاسب الآلي تطوّرت في آخر عقدين؛ حيث أصبح الحاسب ذكيًّا وقادرًا على اتّخاذ القرار من تلقاء نفسه، مشيرًا إلى أن الآلة الذكيّة تستمر في تطوير مهمّة ما، بناءً على خبرة ما، باعتبار مؤشر أداء معين، فهي تأخذ البيانات وتبني النموذج وتقوّمه وتطوّره، وتعيد الكرّة حتى تستقر على أفضل طريقة للنموذج، مستعرضًا بعض الأمثلة من الرسائل.

وتطرّق إلى التطبيقات التي نستخدمها في حياتنا اليوميّة كتطبيقات الهواتف والحاسب ولوحة المفاتيح الذكيّة في الهواتف النقّالة، وكيفيّة معرفة الحاسب أو النقّال للكلمة التالية من خلال فهمه للسيّاق السّابق.

وتحدّث عن تطوّر آليّات البحث وكيف يرتّبها حسب التاريخ والباحث واهتماماته، واستخدام الأسواق التجاريّة للذكاء الاصطناعيّ في التسويق وكيف أصبح الهاتف والحاسب قادرين على فهم لغة الإنسان، يصحّح بشكل تلقائيّ حتى أصبح قادرًا على إعطائك الصفة المناسبة للاسم، وتحليل النصوص وتستفيد من هذا الشركات التجارية حتى تقيس مشاعر الناس تجاه منتج معيّن. وقال: إن التّرجمة الآليّة في تطوّر كبير ولابد من النّظر إلى الذكاء الاصطناعيّ كخطر محتمل لشغل حيز وظائف البشر.

وركّز على النّمذجة وطريقة استقبال الحاسب الآلي للمعلومات وآليّة التقويم والاحتفاظ بالنموذج الأفضل وضبط القواعد، مشيرًا إلى أنّ نمذجة اللّغات مهمّة صعبة؛ فقد يعجز الحاسب من إيجاد الأنماط؛ لأنها ليست مطّرِدة؛ حيث يعاني الحاسب من غموض في فهم اللّغات، ودلالات العبارات، واللغة العربيّة تحديدًا تعاني من غموضٍ أعلى لعدّة أسباب أبرزها: النقص الكبير في الشّكل الكتابيّ من التشكيل والهمزات والمسافات، وكثرة الالتصاق في الكلمات النحويّة والخصائص الاشتقاقيّة، والتفرّد في الصرف المبني على الأوزان، وحرّية ترتيب الكلمات في التّقديم والتّأخير، تجعلنا مطالبين بإعطاء الحاسب الآلي بيانات أكثر.

وقال: إن هناك نمطين مشهورين لنمذجة اللّغة: الطريقة اللّغوية، والطريقة التوزيعيّة، فالطريقة اللّغوية مشهورة عند أهل اللّغة وتمر عبر مستويات التّحليل: الكتابيّ والصرفيّ والنحويّ والدلاليّ والخطابيّ، مستعرضًا أمثلة على ذلك التحليل وآلية إدخال البيانات. وعن النمذجة بالطريقة التوزيعيّة (مضامين الكلمة) قال: إن هذه الطريقة حديثة وذكيّة حتى أحدثت ثورة في عمق معالجات اللغويّات الطبيعيّة، وهي آليّة تعلم معنى الكلمة من الكلمات المصاحبة وللتنبّؤ بالكلمات التاليّة، وتشرح كيفية قياس الأداء وتطابق الكلمة المتنبّأ بها مع الكلمة المنزوعة، وقياس التقارب بين الكلمات الممكنة لسياق معين، والتناظر اللفظيّ.

وأضاف: إن هذه التطبيقات تحتاج إلى بنية أساسيّة وهي ما تسمّى بنمذجة اللّغة وهي لازمة من أجل هذه التطبيقات ليفهم الحاسب اللّغة ويتمكّن من إنتاجها؛ فهي خوارزمية تهدف إلى أن يكون لعناصر اللغة تمثيلٌ معينٌ وعادةً ما يكون تمثيلاً رقميًّا يتسطيع الحاسب استيعابه.

واختتم محاضرته بمجموعة من التوصيات؛ حيث طالب ببناء بيت خبرة يضمّ المتخصّصين من أهل الحاسب واللغة العربية؛ ليتمكّنوا من تطوير الأداء بشكل أفضل، كما ذكر أنّ نماذج اللغة بأشكالها تطوّرت بشكل مذهل في الآونة الأخيرة والمجال خصب ولكن مازال فيه كثير من الفجوات البحثيّة؛ وأن الشركات العالميّة حريصة جدًا على تطوير منتجاتها (الترجمة الآلية مثلاً، برامج لوحة المفاتيح) وإتاحتها بالمجان يعني أنك المنتج المستهدف والبيانات التي تتيحها لهم، وقال: إنّ كثيرًا من النماذج الحاليّة ليست مهيّأة للعمل بها على الحاسب الآلي، القواميس، المعاجم مثلاً. وذكر أن تطبيقات اللغة ينقصها كثير من البيانات الموسومة، منوهّا إلى ضرورة اهتمام المعاهد وكليات اللغات بها في تطوير البيانات وإتاحتها للباحثين.

ثم فُتح المجال للمداخلات التي أثرت الموضوع وتفضّل بالردّ على تعليقات الحضور واستفساراتهم.

جدير بالذكر يختتم مركز حمد الجاسر الثقافيّ برنامجه الثقافيّ للشطر الأول من هذا العام بمحاضرةٍ يقدّمها عالم فيزياء الفلك القلبيّة استشاري أوّل تشوّهات القلب الخلقيّة والقسطرة الكهربائيّة الأستاذ الدكتور عبدالله بن عبدالرحمن آل عبدالقادر؛ ضحى السبت القادم 24 ربيع الآخر 1441هـ الواقع في 21 كانون الأوّل (ديسمبر) 2019م.