Revue d'économie et de statistique appliquée
Volume 9, Numéro 2, Pages 56-75
2012-12-31
Auteurs : Lounici, Nora . Zakane Ahmed .
La fouille de données est un domaine de recherche de prédilection, à l’origine de nombreuses publications. L’extraction de règles d’association utiles à partir de données volumineuses constitue une des tâches innovantes qui a fait découvrir au monde industriel le domaine du Data Mining. Nous proposons d’abord une présentation synthétique du processus d’ECD et la place qu’occupe le Data Mining dans un tel processus. Nous expliquons, ensuite, brièvement, la démarche globale que nous proposons. Nous nous intéresserons tout particulièrement au problème du nombre de règles d’association prohibitives générées par les algorithmes de type Apriori. Les techniques employées posent deux problèmes majeurs : l’un algorithmique pour la génération de règles, et l’autre qualitatif pour l’évaluation et la validation des règles. Notre proposition s’appuie, en partie, sur l’évaluation objective de l’intérêt des règles à l’aide de mesures de qualité. Afin de classer les règles d’association par intérêt décroissant, une des solutions consiste à utiliser différentes mesures de qualité. Néanmoins, ces mesures renvoient à des résultats différents et parfois conflictuels. Notre approche consiste dans un premier temps à sélectionner un sous-ensemble de mesures complémentaires à partir d’une liste de 25 mesures. Le but est d’effectuer un classement des règles d’association, par intérêt sur la base d’un sous-ensemble de mesures établies. Cette approche est illustrée sur un exemple.
Fouille de données (Data Mining), ECD, Règles d’association, post-traitement, mesures de qualité.
Chelghoum Nadjim
.
Zeitouni Karine
.
pages 114-130.
Bouarioua Rabia
.
Si Mohand Mounir
.
pages 18-33.
Attou Rachid
.
pages 593-608.
Abid A.
.
Zouhri A.
.
Sennoune M.
.
pages 165-171.
Lounici Mosbah Nora
.
pages 141-169.