DSpace
 

Dspace de universite Djillali Liabes de SBA >
Thèse de Doctorat en Sciences >
Informatique >

Veuillez utiliser cette adresse pour citer ce document : http://hdl.handle.net/123456789/3105

Titre: Apprentissage automatique pour une classification des images basée sur les descripteurs
Auteur(s): GAFOUR, Yacine
Encadreur: BERRABAH, Djamel
Mots-clés: Apprentissage automatique
descripteurs
classification des images
reconnaissance faciale
Date de publication: 16-déc-2020
Résumé: الملخص (بالعربية) : أدى التطور السريع للأجهزة الرقمية (الهواتف المحمولة والكاميرات وما إلى ذلك) إلى زيادة هائلة في بيانات الوسائط المتعددة عالية الجودة (الصور ومقاطع الفيديو) التي يتعين إدارتها. لابد من تفسير الكم الهائل من هذه البيانات واسترجاعها من قبل الشركات الكبيرة. في الواقع، يحتاجون إلى طرق فعالة لاستغلال محتوى هذه البيانات وتحويلها إلى معرفة قيمة من أجل الحصول على فهم مرئي سريع للصور ومقاطع الفيديو. نحدد في هذه الرسالة عدة أهداف مثيرة للاهتمام وهذا لفهم المحتوى المرئي للصور لغرض أداء مهام تصنيف الصور والتعرف على محتوياتها. في هذا السياق نقترح نماذجنا وأساليبنا مخصصة لهذه المهام باستخدام التعلم الآلي وبناءً على الواصفات التي تمثل محتوى الصورة. يتم الحصول على هذه الواصفات من خلال عملية استخراج الميزات من الصورة. في هذا السياق ، نقدم المنهجين التاليين. في النهج الأول نقترح نموذجًا جديدًا لتحسين أداء واصف A-KAZE لتصنيف الصور. أولاً أنشأنا اتصالا بين واصف A-KAZE ونموذج حقيبة الميزات (BoF). بعد ذلك نعتمد مطابقة الهرم المكاني (SPM) من خلال استغلال واصف A-KAZE لتعزيز متانته من خلال تقديم المعلومات المكانية. نقدم في النهج الثاني نموذجًا جديدًا للتعرف على الوجه. استعملنا في هذا النهج مجموعة جديدة من المتغيرات لوصف LBP التي اقترحناها والتي أطلقنا عليها اسم النمط الثنائي المحلي على شكل خلايا النحل (Ho-LBP). إن استغلال الصور باستخدام مجموعة من المتغيرات للموصف Ho-LBP يساعد المصنف على التعلم بشكل أفضل. بالإضافة إلى ذلك يتم الجمع بين هذه المتغيرات لتحسين أداء التعرف على الوجه. الكلمات الرئيسية: التعلم الآلي ، الواصفات ، تصنيف الصور ، التعرف على الوجه ---------------------------------------------- Résumé (en Français) : Le développement rapide des appareils numériques (téléphones portables, cameras etc.) a mené à une augmentation explosive des données multimédia (images et vidéos) de haute qualité à gérer. L’énorme quantité de ces données doit être interprétées et récupérées par les grandes entreprises. En effet, elles ont besoin de méthodes efficaces pour exploiter le contenu de ces données et le transformer en connaissances précieuses afin d’avoir une compréhension visuelle rapide des images et des vidéos. Dans cette thèse, nous définissons plusieurs buts qui sont intéressants pour comprendre le contenu visuel des images afin de réaliser les tâches de la classification d’images et la reconnaissance d’objets. Par conséquent, nous proposons des modèles et des approches dédiées à ces taches en utilisant l’apprentissage automatique et en se basant sur des descripteurs représentatifs du contenu de l'image. Ces descripteurs sont obtenus par le processus d'extraction de caractéristiques à partir de l'image. Dans ce contexte, nous présentons les deux approches suivantes. Dans la première approche, nous proposons un nouveau modèle pour améliorer les performances du descripteur A-KAZE pour la classification des images. Nous établissons d'abord la connexion entre le descripteur A-KAZE et le modèle Bag of features (BoF). Ensuite, nous adoptons le Spatial Pyramid Matching (SPM) pour introduire des informations spatiales durant l’exploitation du descripteur A-KAZE afin de renforcer sa robustesse. Nous présentons dans la seconde approche un nouveau modèle pour la reconnaissance faciale. Cette approche est basée sur un nouvel ensemble de variantes du descripteur LBP que nous avons proposé et que nous avons appelé Honeycomb-Local Binary Pattern (Ho-LBP). En effet, la présentation des images en utilisant un ensemble de variantes du descripteur Ho-LBP aide le classificateur à mieux apprendre. De plus, ces variantes sont combinées pour améliorer les performances du processus de la reconnaissance faciale. Les mots clés : Apprentissage automatique, descripteurs, classification des images, reconnaissance faciale. ---------------------------------------------- Abstract (en Anglais) : The rapid development of digital devices (cell phones, cameras, etc.) has led to an explosive increase in high quality multimedia data (images and videos) to be managed. The enormous amount of this data must be interpreted and retrieved by large companies. Indeed, they need efficient methods to exploit the content of this data and transform it into valuable knowledge in order to have a rapid visual understanding of images and videos. In this thesis, we define several goals that are interesting for understanding the visual content of images in order to perform the tasks of image classification and object recognition. Therefore, we propose models and approaches dedicated to these tasks using machine learning and based on descriptors representative of the content of the image. These descriptors are obtained by the process of extracting the characteristics of the image. In this context, we present the following two approaches. In the first approach, we propose a new model to improve the performance of the A-KAZE descriptor for image classification. We first establish the connection between the A-KAZE descriptor and the Bag of features (BoF) model. Then, we adopt the Spatial Pyramid Matching (SPM) to introduce spatial information during the exploitation of the A-KAZE descriptor in order to reinforce its robustness. We present in the second approach a new model for facial recognition. This approach is based on a new set of variants of the LBP descriptor that we have proposed and named Honeycomb-Local Binary Pattern (Ho-LBP). Indeed, presenting the images using a set of variants of the Ho-LBP descriptor helps the classifier to learn better. In addition, these variants are combined to improve the performance of the facial recognition process. Keywords: Machine learning, descriptors, image classification, facial recognition.
Description: Doctorat en sciences
URI/URL: http://hdl.handle.net/123456789/3105
Collection(s) :Informatique

Fichier(s) constituant ce document :

Fichier Description TailleFormat
DS_Inf_GAFOUR_Yacine.pdf2,71 MBAdobe PDFVoir/Ouvrir
View Statistics

Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.

 

Ce site utilise la plate-forme Dspace version 3.2-Copyright ©2014.