Revue de l'Information Scientifique et Technique
Volume 17, Numéro 2, Pages 64-72
2007-06-19

Traitement Des Mots Inconnus Par Les Systèmes D’étiquetage Morpho-syntaxiques Des Text Arabes Basés Sur Le Modèle De Markov Cachées

Auteurs : El Jihad Abdelhamid . Yousfi Abdellah . Aouragh Lhoussin .

Résumé

L’étiquetage morpho-syntaxique des textes est un outil très important pour diverses applications dans le traitement du langage naturel, à savoir l’analyse morphologique et syntaxique des textes, et l’indexation et la recherche d’information, et la « vocalisation » des textes arabe et le modèle probabiliste des langues (modèle n-classe). Ces systèmes, qui sont basés sur des lexiques de taille limitée, sont incapables de traiter les mots inconnus.

Mots clés

Modèle de Markov caché, Étiquetage morpho-syntaxique, Textes Arabes, mots inconnus, Formes des mots