Revue de l'Information Scientifique et Technique
Volume 13, Numéro 1, Pages 79-94
2003-05-09

La Segmentation Des Documents Techniques En Amont De L'indexation : Définition D'un Modèle

Auteurs : Ouerfelli Tarek .

Résumé

Notre travail s’oriente vers l’indexation des documents techniques. Cette opération exige un prétraitement du document consistant à le segmenter en unités fines, qui serviront par la suite comme base pour l’indexation. Dans cet article, nous avançons les résultats d’une étude faite sur cinq manuels techniques visant à définir un modèle de segmentation des documents techniques en Unités Documentaires (UD). La finalité de ce modèle est de pouvoir réaliser un traitement automatique, de ce fait il repose sur les critères de surface repérables dans un processus automatique. Ce modèle se veut dynamique avec la prise en compte des différents médias qui existent dans les documents techniques (texte, figure, tableau, ....).

Mots clés

Document technique,Indexation,Segmentation,Unité documentaire