مجلة العلوم والتكنولوجيا
Volume 2, Numéro 1, Pages 11-32

مقاربة جديدة لقياس التشابه الدلالي للجمل العربية

الكاتب : عقبة كزار . سامية زواوي . خالد رزاق .

الملخص

إن قياس التشابه الدلالي له أهمية كبيرة في مجال معالجة اللغة الطبيعية. حيث يسمح بحساب التشابه بين المصطلحات المختلفة من أجل إجراء التقريبات. تستخدم العديد من عمليات البحث الأخيرة تقنيات الويب والدلالات اللغوية لإيجاد درجة التشابه بين مصطلحين من خلال مطابقة المعنى والعلاقات بينهما. لكن معظم مقاييس التشابه الموجودة حاليا تعاني من تدهور دقة الحساب بسبب الاختلاف في البنية النحوية والدلالية للجملتين المراد مقارنتهما. نقدم في هذه الورقة مقاربة جديدة لقياس التشابه الدلالي بين الجمل العربية. لقد درسنا بعض الطرق الموجودة لقياس التشابه، ثم طبقنا عملية توسع جديدة، تعتمد على المعلومات الدلالية المستخرجة من الأنطولوجيا العربية (Arabic Ontology). لقد تم التأكد من آداء النهج المقترح من خلال حساب ارتباط بيرسون (Pearson correlation) بين القيم المحسوبة والأحكام البشرية. وقمنا بتقييمه على مجموعات البيانات المرجعية لـ SemEval-2017 و STS للجمل العربية. وبناءً على نتائجنا التجريبية المتحصل عليها، فإن عملية التوسع باستخدام الأنطولوجيا العربية، أعطت تحسنًا كبيرًا من حيث دقة التشابه مقارنة بالطرق الموجودة في نفس المجال.

الكلمات المفتاحية

أنطولوجيا بالعربية، الجمل العربية، الأحكام البشرية، التشابه الدلالي.