مجلة إشكالات في اللغة و الأدب
Volume 10, Numéro 2, Pages 102-116
2021-06-02

التعامل الآلي مع المدوّنات اللّغوية التراثية بين خصائص لغة البرمجة وأخطاء الرقمنة

الكاتب : حجبار رادية .

الملخص

إنّ الهدف من رقمنة مدوّنات اللّغة العربية هو التعامل معها آليا؛ وذلك من خلال استرجاع المفردات والمعلومات والتنقيب في البيانات. وسنبيّن في بحثنا هذا، كيفية التعامل مع المدوّنات اللّغوية التراثية الرّقمية آليا، والتي اخترنا منها معجم لسان العرب لابن منظور، كتاب الجامع لمفردات الأدوية والأغذية لابن بيطار، ومعجم الإبل للأصمعي. ولكن كيف يتم توصيف المفردات الواردة في هذه المدوّنات التراثية للحاسوب؟ وهل تسمح لنا لغة البرمجة باسترجاع كل المفردات مهما كان شكلها أو بنيتها؟ وماهي اللوغاريتمات المناسبة للاسترجاع الآلي في حال كانت رقمنة المدوّنات غير مضبوطة؟ ولأجل الإجابة عن هذه الإشكالات، أنشأنا خوارزميات تتضمن توصيفا دقيقا للمفردة، من حيث حروفها وحركاتها، وكذا للّواصق التّي يحتمل أن تلتصق بها؛ لتتحقّق القراءة لجميع المفردات والتراكيب المراد استرجاعها آليا من قاعدة البيانات. وننتهي من خلال الاسترجاع الآلي لبعض الصيغ والمفردات، من نماذج من المدوّنات اللّغوية التراثية إلى وجوب إعادة النظر في رقمنة هذه المدوّنات؛ لأجل التعامل معها بلغات البرمجة دون إشكالات. The aim of digitizing Arabic language blogs is to deal with them automatically, as well as to accomplish the historical Arabic lexicon project, by retrieving vocabulary , information and data mining. In this research, we will show how to deal with the digital heritage linguistic blogs automatically, from which we chose the dictionary of « IBIL » of « Asma’i « , the book of «the collection of the vocabulary of medicines and food» for Ibn Baytar, and the dictionary of the « Arabic tongue » by Ibn Mandhour. But how are these vocabulary words described in the heritage blogs of the computer described ? Does the programming language allow us to retrieve all vocabulary, regardless of shape or structure ? What are the appropriate logarithms for automatic retrieval if the digitization of blogs is not accurate and innacurate ? In order to answer these problems, we have created algorithms and instructions that include an accurate description of the individual, in terms of its letters and movements, as well as the stickers that are likely to stick to them, so that the reading of all the vocabulary and structures to be retrieved automatically from the database is achieved. We conclude, through the automatic retrieval of some formulas and vocabulary, from examples of heritage linguistic codes to the need to review the digitization of these codes in order to deal with them in programming languages without problems.

الكلمات المفتاحية

مدوّنة لغوية رقمية، لغة برمجة، استرجاع آلي. ; : digital linguistic blogs , programming language, automatic retrieval,