نهج قياس التشابه الدلالي للنص القصير على أساس الشبكة الدلالية

Naamah Hussien Hameed
Adel M. Alimi
Ahmed T. Sadiq


يلعب تقدير التشابه الدلالي بين النصوص القصيرة دورًا بارزًا بشكل متزايد في العديد من المجالات المتعلقة بتعدين النص وتطبيقات معالجة اللغة الطبيعية ، خاصة مع الزيادة الكبيرة في حجم البيانات النصية التي يتم إنتاجها يوميًا. الأساليب التقليدية لحساب درجة التشابه بين نصين بناءً على الكلمات التي يتشاركانها لا تعمل بشكل جيد مع النصوص القصيرة. لأن نصين متشابهين يمكن كتابتهما بعبارات مختلفة من خلال استخدام المرادفات. نتيجة لذلك ، يجب مقارنة الجمل الموجزة من حيث المعنى الدلالي. في هذا البحث ، يتم تقديم طريقة قياس التشابه الدلالي بين النصوص والتي تجمع بين المعلومات الدلالية القائمة على المعرفة والنصوص لبناء شبكة دلالية تمثل العلاقة بين النصوص المقارنة وتستخلص درجة التشابه بينها. يمثل تمثيل النص كشبكة دلالية أفضل تمثيل معرفي يقترب من فهم العقل البشري للنصوص ، حيث تعكس الشبكة الدلالية المعرفة الدلالية والنحوية والهيكلية للجملة. تمثيل الشبكة هو تمثيل مرئي لأشياء المعرفة وصفاتها وعلاقتها. تم استخدام قاعدة بيانات WordNet المعجمية كمصدر قائم على المعرفة بينما تم استخدام متجهات تضمين الكلمات المدربة مسبقًا من GloVe كمصدر مستند إلى النصوص. تم اختبار الطريقة المقترحة باستخدام ثلاث مجموعات بيانات مختلفة ، مجموعات بيانات SICK و DSCS و MOHLER.  تم الحصول على نتائج جيدة بصيغة RMSE و MAE.

نهج قياس التشابه الدلالي للنص القصير على أساس الشبكة الدلالية. Baghdad Sci.J [انترنت]. 5 ديسمبر، 2022 [وثق 31 يناير، 2025];19(6(Suppl.):1581. موجود في: https://bsj.uobaghdad.edu.iq/index.php/BSJ/article/view/7255

