DSpace
 

Dspace de universite Djillali Liabes de SBA >
Thèse de Doctorat en Sciences >
Informatique >

Please use this identifier to cite or link to this item: http://hdl.handle.net/123456789/3166

Titre: Hybridation des métaheuristiques dans le processus d’extraction de connaissances à partir de données.
Auteur(s): Alaoui, Abdiya
Encadreur: ELBERRICHI, Zakaria
Mots-clés: ECD (extraction de connaissances à partir de données)
prétraitement de données
sélection d’attributs
Issue Date: 21-Jan-2021
Résumé: الملخص (بالعربية) : اكتشاف نماذج واضحة وفعالة من البيانات هو هدفنا مع التحدي الذي هو العمل مع كمية كبيرة من البيانات واستخدام خوارزميات قوية لاستخراج المعرفة الأساسية. يعد التصنيف الخاضع للإشراف من بين المهام التي تمت دراستها على نطاق واسع في استخراج البيانات. تولد هذه العملية نموذجًا عن طريق تحليل الحالات المصنفة ثم يتم استغلال هذا النموذج للتنبؤ بفئات الحالات غير المسماة. يعتمد أداء النموذج الذي تم إنشاؤه على المصنف وجودة البيانات. أهداف اختيار البيانات هي تقليل حجم البيانات والقضاء على الضوضاء من أجل تحسين جودة البيانات. يوفر اختيار البيانات دقة عالية، ووقتًا أقل للتعلم، ونماذج تنبؤية أقل تعقيدًا، وتفسير البيانات المفهومة. يُعتبر التصنيف الخاضع للإشراف واختيار البيانات من مشكلات التحسين التي يصعب حلها والتي توجد لها حلول عن طريق علم الاكتشاف المتعدد. تهجين علم الاكتشاف المتعدد مع الخوارزميات الأخرى (علم الاكتشاف المتعدد، تقنية استخراج البيانات والتعلم الآلي، ...) يسمح لتطوير مرحلة ما قبل المعالجة وبعد ذلك لبناء نموذج تعليمي فعال وقوي الذي هو مساهمة هذه الأطروحة. الكلمات الرئيسية: استخراج المعرفة من البيانات، المعالجة المسبقة للبيانات ، استخراج البيانات، التصنيف، علم الاكتشاف المتعدد، التهجين، مشاكل التحسين الصعبة ---------------------------------------------- Résumé (en Français) : Notre objectif est de découvrir des modèles intelligibles et efficaces à partir de données. Le challenge est de travailler avec une grande masse de données et d’utiliser des algorithmes puissants permettant d’extraire des connaissances indispensables. La classification supervisée fait partie des tâches largement étudiées dans la fouille de données. Ce processus génère un modèle en analysant des instances étiquetées. Ensuite, ce modèle sera exploité pour prédire les classes des instances, non étiquetées. Les performances du modèle généré dépendent des classifieurs et de la qualité des données. Pour cela un bon prétraitement des données, et spécialement la sélection d’attributs, permet d’obtenir une précision élevée, une durée d’apprentissage inférieure, une complexité moindre des modèles prédictifs et une interprétation compréhensible des données. La classification supervisée et le prétraitement des données sont considérés comme des problèmes d’optimisation NP-difficile qui peuvent être résolus par les métaheuristiques. Hybridation de métaheuristiques avec d’autres algorithmes (métaheuristiques, technique de fouille de données et l’apprentissage automatique,. . .) permet de développer la phase de prétraitement et la tâche de la classification supervisée par la suite de construire un modèle d’apprentissage efficient et puissant qui est la contribution de cette thèse. Les mots clés : ECD (extraction de connaissances à partir de données), prétraitement de données, sélection d’attributs, Fouille de données, classification supervisée, Métaheuristiques, Hybridation, problèmes d’optimisation difficile. ---------------------------------------------- Abstract (en Anglais) : Our goal is to discover intelligible and efficient models from data. The challenge is to work with a large amount of data and to use powerful algorithms to extract essential knowledge. Supervised classification is among the widely studied tasks in data mining. This process generates a model by analyzing labeled instances. Then, this model will be exploited to predict the classes of unlabeled instances. The performance of the generated model depends on the classifier and the quality of data. The main idea of the data selection is the reduction of the data size and the elimination of the noise, which improves the quality of the data. Feature selection provides high accuracy, lower learning time, less complexity of predictive models, and understandable data interpretation. The supervise classification and the pre-processing of the data are considered to be NP-hard optimization problems that can be solved by meta-heuristics. Hybridization of Metaheuristics with other Algorithms (Metaheuristics, data mining technique and machine learning, ...) allows to develop the preprocessing phase and afterwards to build an efficient and powerful learning model that is the contribution of this thesis. Keywords : KDD (knowledge discovery in databases), data preprocessing, Feature selection, data mining, classification, metaheuristics, hybridization, difficult optimization problems.
Description: Doctorat en sciences
URI: http://hdl.handle.net/123456789/3166
Appears in Collections:Informatique
Informatique

Files in This Item:

File Description SizeFormat
DS_INF_Alaoui_Abdiya.pdf3,51 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Ce site utilise la plate-forme Dspace version 3.2-Copyright ©2014.