DSpace
 

Dspace de universite Djillali Liabes de SBA >
Thèse de Doctorat en Sciences >
Informatique >

Veuillez utiliser cette adresse pour citer ce document : http://hdl.handle.net/123456789/1123

Titre: Maintenance des applications orientées web par des ontologies de domaine : La rétro-ingénierie à base d’indexation sémantique
Auteur(s): DENNAI, Abdeslem
Encadreur: BENSLIMANE, Sidi Mohammed
Mots-clés: Ontologie de domaine
indexation sémantique
application web
document web
XML
HTML
rétro-ingénierie
distance sémantique et similarité sémantique
Date de publication: 21-avr-2015
Résumé: الملخص (بالعربية) : أصبحت تطبيقات شبكة الإنترنت أهم وسيلة اتصال بالنسبة للمؤسسات التجارية بجميع أنواعها. مع ذلك، فإن معظم هذه التطبيقات يتم تنفيذها في استعجال. لربح الوقت في إنتاج وتطوير هذه التطبيقات، غالبا ما يتم التضحية بمرحلة التصميم وإهمال إنجاز الوثائق المرفقة بها. بالإضافة إلى ذلك، وخلال عملية استغلالها، يتم تعديل هذه التطبيقات على حسب الاحتياجات’ كما تتعرض إلى التدهور والذي يؤثر على كل من المعلومات المحتواة و هيكلتها. الهدف من هذا العمل هو إقتراح هندسة عكسية لتطبيقات شبكة الإنترنت على أساس نهج الفهرسة الدلالي. وبالمثل، فإن هذا النهج يعتمد على أنطولوجيا المجالات مع استخدام TreeTagger والقاموس الدلالي WordNet. تتطلب العملية المقترحة أربع مراحل: (i). النمذجة: وهذه المرحلة تسمح بالحصول على مجموعة من المعطيات كلها معلومات غير مكررة، المستخرجة من صفحات HTML أو وثائق XML. (ii). الربط الدلالي: نتيجة المرحلة السابقة تعتبر عنصر مرشح لهذه المرحلة الحالية حيث يستغل الأنطولوجيا للتصديق على صحة هذه المعطيات من خلال تطبيق مفهوم المسافة الدلالي و باستعمال TreeTagger و WordNet. يتم إنشاء فهرس أولي في نهاية هذه المرحلة. (iii). إثراء: محتوى الفهرس يزيد بمعطيات أخرى من نفس الأنطولوجيا باستخدام أحد مقاييس التشابه الدلالي بين معطيات الأنطولوجيا )مقياس (Wu-Palmer. (iv). إعادة التصميم: الفهرس النهائي، نتيجة المرحلة السابقة، يتم تحويله إلى قاموس للبيانات بالحفاظ فقط على المعطيات الهامة و الغير مكررة واستكمالها بمعلومات أخرى مثل تعريف النوعية وتدقيق الشكل. عندها يمكن تصميم نظام أو تطبيق جديد. ----------------------------------------------Résumé : Les applications orientées web sont devenues les moyens de communication les plus importants pour les entreprises commerciales de toutes sortes. Cependant, la plupart de ces applications sont construites dans l’urgence. Pour écourter les délais de développement, la phase de conceptualisation est souvent sacrifiée et la documentation associée est négligée. En outre, en phase d’exploitation, ces applications sont modifiées au fil des besoins. Elles subissent diverses dégradations touchant aussi bien leur contenu informatif que leur structure de navigation. L’objectif de ce travail est de proposer un processus de rétro-ingénierie des applications orientées Web à base d’une approche d’indexation sémantique. Cette approche qui, elle même, est à la base d’une ontologie de domaine avec l’utilisation de l’étiqueteur TreeTagger et le dictionnaire sémantique WordNet. Le processus que nous allons proposer, passe par quatre phases : (i). Modélisation : Cette phase permet d’avoir un ensemble de concepts représentants des informations non redondantes, extraites à partir des pages HTML ou des documents XML, (ii). Attachement sémantique : Le résultat de la phase précédente représente un élément candidat pour cette phase courante où on exploite l’ontologie de domaine pour la validation de ces concepts par application de la distance sémantique et en utilisant l’étiqueteur TreeTagger et WordNet. Un index initial est généré à la fin de cette phase, (iii). Enrichissement : Le contenu de l’index s’accroit par d’autres concepts de cette même ontologie en utilisant l’une des mesures de similarité sémantique entre les concepts de l’ontologie (Mesure de Wu et Palmer), (iv). Re-conceptualisation : L’index final, résultat de la phase précédente, sera transformé en dictionnaire de données en gardant que les concepts importants non redondants et en les complétant par d’autres informations telles que la définition du typage et la précision du format. Ainsi, une nouvelle conception du système ou de l’application peut commencer. ---------------------------------------------- Abstract: Web-oriented applications have become the most important means of communication for business enterprises of all kinds. However, most of these applications are built in a hurry. To shorten development time, conceptualization phase is often sacrificed and associated documentation is neglected. In addition, during operation, these applications are modified over the needs. They undergo various degradations affecting both their information content navigation structure. The objective of this work is to propose a process of reverse engineering web-oriented applications based on semantic indexing approach. Similarly, this approach based on domain ontology with the use of TreeTagger and semantic dictionary WordNet. The process we are going to propose four phases: (i). Modeling: This phase allows to have a set of concepts representatives non-redundant information, extracted from HTML pages or XML documents, (ii). Attachment semantics: The result of the previous phase is a candidate element for this current phase where it exploits the domain ontology to validate these concepts by applying the semantic distance and by using TreeTagger with WordNet. An initial index is generated at the end of this phase, (iii). Enrichment: The contents of the index increases by other concepts of the same ontology using one of semantic similarity measures between ontology concepts (Wu and Palmer measure), (iv). Reconceptualization: The final index, as a result of the previous phase, will be transformed into data dictionary keeping the important and no redundant concepts and supplementing them with other information such as the definition of typing and accuracy of the format. So, a new system design or application can begin.
Description: Doctorat en sciences
URI/URL: http://hdl.handle.net/123456789/1123
Collection(s) :Informatique

Fichier(s) constituant ce document :

Fichier Description TailleFormat
DS_Inf_DENNAI_Abdeslem.pdf1,77 MBAdobe PDFVoir/Ouvrir
View Statistics

Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.

 

Ce site utilise la plate-forme Dspace version 3.2-Copyright ©2014.