Revue d'économie et de statistique appliquée
Volume 9, Numéro 2, Pages 56-75
2012-12-31

Une Contribution Au Post-traitement Des Regles D’association Dans Un Contexte De Data Mining

Auteurs : Lounici, Nora . Zakane Ahmed .

Résumé

La fouille de données est un domaine de recherche de prédilection, à l’origine de nombreuses publications. L’extraction de règles d’association utiles à partir de données volumineuses constitue une des tâches innovantes qui a fait découvrir au monde industriel le domaine du Data Mining. Nous proposons d’abord une présentation synthétique du processus d’ECD et la place qu’occupe le Data Mining dans un tel processus. Nous expliquons, ensuite, brièvement, la démarche globale que nous proposons. Nous nous intéresserons tout particulièrement au problème du nombre de règles d’association prohibitives générées par les algorithmes de type Apriori. Les techniques employées posent deux problèmes majeurs : l’un algorithmique pour la génération de règles, et l’autre qualitatif pour l’évaluation et la validation des règles. Notre proposition s’appuie, en partie, sur l’évaluation objective de l’intérêt des règles à l’aide de mesures de qualité. Afin de classer les règles d’association par intérêt décroissant, une des solutions consiste à utiliser différentes mesures de qualité. Néanmoins, ces mesures renvoient à des résultats différents et parfois conflictuels. Notre approche consiste dans un premier temps à sélectionner un sous-ensemble de mesures complémentaires à partir d’une liste de 25 mesures. Le but est d’effectuer un classement des règles d’association, par intérêt sur la base d’un sous-ensemble de mesures établies. Cette approche est illustrée sur un exemple.

Mots clés

Fouille de données (Data Mining), ECD, Règles d’association, post-traitement, mesures de qualité.