DSpace
 

Dspace de universite Djillali Liabes de SBA >
Thèse de Doctorat en Sciences >
Informatique >

Veuillez utiliser cette adresse pour citer ce document : http://hdl.handle.net/123456789/2795

Titre: Détection du Texte Arabe en Utilisant les Méthodes Statistiques et dApprentissage Automatique
Auteur(s): OULLADJI, Latefa
Encadreur: BATOUCHE, Mohamed
Mots-clés: Détection de texte arabe
théorie de la Gestalt
réseau de neurones
adaboost
machine à vecteurs de support
Date de publication: 10-oct-2018
Résumé: الاكتشاف و التعرف الآلي للمنطقة النصية في الصور الطبيعية يعتبر أساسي بسبب وجود الدائم للمعلومات النصية في الحياة اليومية للإنسان. هذا المجال يعرف تطورا ملحوظا في العديد من التطبيقات الذكية خاصة مع اللغة الانجليزية حيث تم تطوير العديد من الأنظمة التي اتبثت كفاءتها. أما بالنسبة للغة العربية فهي تمثل تحدي حقيقي بسبب طبيعتها المتداخلة في الكتابة ومفرداتها الغنية. في عملنا هذا تم استلهام الخطوة الأولى من عمل لويس[١٧] لاكتشاف المناطق المتشابهة والممكن تواجد النص فيها وفي الخطوة الثانية تم استخدام ثلاث مصنفات وهي الشبكات العصبية الاصطناعية والخورزميات الخطية وادبست. هذه المصنفات تم استعمالها لتصنيف المناطق النصية من الغير نصية في الصور الطبيعة. لتحسين اداء النظام تم دمج مخرجات النتائج الثلاث الخاصة بالمصنفات و تجميعها في واحد وذلك استنادا الى اعلى نسبة من المخرجات . تم تقييم نتائج التطبيقات باستخدام قاعدة بيانات خاصة بنا حيث اثبتث طريقة التجميع فعاليته. -------------------------------------- Résumé (Français) : La détection et la reconnaissance automatique des zones de texte dans des images naturelles est indispensables en raison de l'omniprésence de l'information textuelle dans la vie quotidienne des êtres humains. Ce domaine a contourné un développement de nombreuses applications spécialement avec la langue anglaise où de nombreux systèmes ont été mis en œuvre et ont prouvé leur efficacité. La langue arabe représente un véritable défi pour sa nature cursive et son riche vocabulaire. La première étape de notre travail a été inspirée du travail de Gomez et Karatzas [17] sur la détection multiscript en utilisant la théorie de Gestalt. Pour la deuxième étape, nous avons implémenté trois classifieurs: Neural Network, Support Vector Machine et Adaboost. Ces classifieurs ont été déployés pour classer les régions groupées par la premier étape en texte ou non-texte. Pour améliorer les performances des systèmes, une méthode d'ensemble basée sur le vote de la majorité a été appliquée sur les résultats des trois classifieurs. Les expériences ont été menées en utilisant notre propre base de données d'images où les résultats empiriques illustrent que la méthode proposée est efficace. . --------------------------------------- Résumé (Anglais) : The automatic detection and recognition of zone text in natural images remain indispensable due to the omnipresent of text information in daily human life. This domain contoured a development of many applications specially with English language where many systems were implemented and proved their efficiency. Arabic language represents a real challenge for its cursive nature and rich vocabulary. The first step of our work was inspired from Gomez and Karatzas [17] on multiscript detection using Gestalt theory. For the second step, we implemented three classifiers namely Neural Network, Support Vector machine and Adaboost. These classifiers were deployed to classify the group regions in images as text or non-text. To improve the system performance an ensemble method based on majority voting was applied where the outputs of the three classifiers were fused. Experiments were conducted using own image database and ground-truth and the empirical results illustrate that the proposed method is efficient.
Description: Doctorat en sciences
URI/URL: http://hdl.handle.net/123456789/2795
Collection(s) :Informatique

Fichier(s) constituant ce document :

Fichier Description TailleFormat
DS_Inf_OULLADJI_Latefa.pdf11,38 MBAdobe PDFVoir/Ouvrir
View Statistics

Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.

 

Ce site utilise la plate-forme Dspace version 3.2-Copyright ©2014.