Dspace de universite Djillali Liabes de SBA >
Thèse de Doctorat en Sciences >
Informatique >
Veuillez utiliser cette adresse pour citer ce document :
http://hdl.handle.net/123456789/2795
|
Titre: | Détection du Texte Arabe en Utilisant les Méthodes Statistiques et dApprentissage Automatique |
Auteur(s): | OULLADJI, Latefa Encadreur: BATOUCHE, Mohamed |
Mots-clés: | Détection de texte arabe théorie de la Gestalt réseau de neurones adaboost machine à vecteurs de support |
Date de publication: | 10-oct-2018 |
Résumé: | الاكتشاف و التعرف الآلي للمنطقة النصية في الصور الطبيعية يعتبر أساسي بسبب وجود الدائم للمعلومات النصية في الحياة اليومية للإنسان. هذا المجال يعرف تطورا ملحوظا في العديد من التطبيقات الذكية خاصة مع اللغة الانجليزية حيث تم تطوير العديد من الأنظمة التي اتبثت كفاءتها. أما بالنسبة للغة العربية فهي تمثل تحدي حقيقي بسبب طبيعتها المتداخلة في الكتابة ومفرداتها الغنية. في عملنا هذا تم استلهام الخطوة الأولى من عمل لويس[١٧] لاكتشاف المناطق المتشابهة والممكن تواجد النص فيها وفي الخطوة الثانية تم استخدام ثلاث مصنفات وهي الشبكات العصبية الاصطناعية والخورزميات الخطية وادبست. هذه المصنفات تم استعمالها لتصنيف المناطق النصية من الغير نصية في الصور الطبيعة. لتحسين اداء النظام تم دمج مخرجات النتائج الثلاث الخاصة بالمصنفات و تجميعها في واحد وذلك استنادا الى اعلى نسبة من المخرجات . تم تقييم نتائج التطبيقات باستخدام قاعدة بيانات خاصة بنا حيث اثبتث طريقة
التجميع فعاليته.
--------------------------------------
Résumé (Français) :
La détection et la reconnaissance automatique des zones de texte dans des images naturelles est indispensables en raison de l'omniprésence de l'information textuelle dans la vie quotidienne des êtres humains. Ce domaine a contourné un développement de nombreuses applications spécialement avec la langue anglaise où de nombreux systèmes ont été mis en œuvre et ont prouvé leur efficacité. La langue arabe représente un véritable défi pour sa nature cursive et son riche vocabulaire. La première étape de notre travail a été inspirée du travail de Gomez et Karatzas [17] sur la détection multiscript en utilisant la théorie de Gestalt. Pour la deuxième étape, nous avons implémenté trois classifieurs: Neural Network, Support Vector Machine et Adaboost. Ces classifieurs ont été déployés pour classer les régions groupées par la premier étape en texte ou non-texte. Pour améliorer les performances des systèmes, une méthode d'ensemble basée sur le vote de la majorité a été appliquée sur les résultats des trois classifieurs. Les expériences ont été menées en utilisant notre propre base de données d'images où les résultats empiriques illustrent que la méthode proposée est efficace.
.
---------------------------------------
Résumé (Anglais) :
The automatic detection and recognition of zone text in natural images remain indispensable due to the omnipresent of text information in daily human life. This domain contoured a development of many applications specially with English language where many systems were implemented and proved their efficiency. Arabic language represents a real challenge for its cursive nature and rich vocabulary. The first step of our work was inspired from Gomez and Karatzas [17] on multiscript detection using Gestalt theory. For the second step, we implemented three classifiers namely Neural Network, Support Vector machine and Adaboost. These classifiers were deployed to classify the group regions in images as text or non-text. To improve the system performance an ensemble method based on majority voting was applied where the outputs of the three classifiers were fused. Experiments were conducted using own image database and ground-truth and the empirical results illustrate that the proposed method is efficient. |
Description: | Doctorat en sciences |
URI/URL: | http://hdl.handle.net/123456789/2795 |
Collection(s) : | Informatique
|
Fichier(s) constituant ce document :
|
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.
|