DSpace
 

Dspace de universite Djillali Liabes de SBA >
Thèse de Doctorat en Sciences >
Informatique >

Please use this identifier to cite or link to this item: http://hdl.handle.net/123456789/2471

Titre: Contribution à la compression des images stéréoscopiques
Auteur(s): OUDDANE, Samira
ُEncadreur: FARAOUN, Kamel Mohamed
Mots-clés: Images stéréoscopiques
codage asymétrique
suppression binoculaire
BJND
système visuel humain
colorisation
transfert de couleur
pixels représentatifs
Issue Date: 11-Dec-2018
Résumé: الملخص (بالعربية) : تتمتع الصورة ثلاثية الأبعاد (3D)بالقدرة على تحسين تجربة المشاهد للوسائط المتعددة من خلال توفير إحساس إضافي بالعمق. يتم التقاط معظم المحتوى ثلاثي الأبعاد وإعداده بتنسيق مجسم. تتضمن الصور المجسمة ثلاثية الأبعاد (S-3D) التقاط صورتين من موقعين مختلفين قليلاً ، يتم توفير كل منهما لكل عين المشاهد وبالتالي ، فإن المحتوى المجسم سيتطلب ضعف كمية البيانات مقارنةً بالواحدة غير الأحادية. محتوى S-3D ، وتطوير تقنيات ضغط فعالة له أهمية قصوى. ولهذه الغاية ، تعرض هذه الأطروحة تقنيتين جديدتين لضغط الصور المجسَّمة. أولا ، استنادا إلى نظرية قمع ثنائي العينين ، في صورة مجسمة. خسائر جودة. ومع ذلك ، بشرط أن لا تتجاوز فجوة الجودة بين الصورتين حدًا معينًا. نقترح طريقة جديدة تحدد الحد الأقصى من الفجوة النوعية المسموح بها بين وجهات نظر مختلف أزواج الصور المجسمة. ويتم ذلك عن طريق نمذجة العلاقة بين الجودة غير المتماثلة وتشويه المقابلات بين البكسلات المقابلة. بعد ذلك ، يتم الجمع بين العلاقة المشتقة مع نموذج الفرق بين عيار فقط (BJND) للتحكم في عتبة الجودة بين وجهات النظر اليمنى واليسرى. يستخدم الأسلوب الثاني أسلوب التلوين لضغط الصور المجسمة. والفكرة الرئيسية هي استخدام طريقة تشفير قياسية ، بينما بالنسبة للعرض الآخر ، يتم اعتبار مكون النصوع فقط للضغط. يتم نقل المعلومات اللونية لهذه الصورة إلى وحدة فك الترميز لعدد قليل من وحدات البكسل التمثيلية (RPs) فقط. يتم تعريف هذه RPs باستخدام مفهوم أسلوب استخراج RP على أساس الهيكل العظمي. في جانب مفكك التشفير ، يتم إعادة بناء قيم اللون لكل وحدات البكسل المتبقية بواسطة طرق التلوين. وقد أظهرت النتائج التجريبية أن طرائق التشفير الخاصة بنا يمكنها تحقيق وفورات كبيرة في معدل البتات وتتفوق على طرق تشفير الصور المجسمة المستخدمة على نطاق واسع. Résumé (Français) : L’image 3D a la capacité d’améliorer l’expérience multimédia des spectateurs en fournissant une sensation de profondeur supplémentaire. La plupart du contenu 3D est capturé et préparé au format stéréoscopique. La 3D stéréoscopique (S-3D) consiste à capturer deux images à partir de deux positions légèrement différentes, chacune de ces images est fournie à chaque oeil du spectateur. Ainsi, le contenu stéréoscopique nécessitera deux fois plus de données que le contenu 2D monoscopique. Compte tenu de l’énorme quantité de données qu’implique la transmission des médias S-3D, le développement de techniques de compression efficaces est d’une importance primordiale. Par conséquent, cette thèse présente deux nouvelles techniques pour la compression des images stéréoscopiques. Premièrement, sur la base de la théorie de la suppression binoculaire, une image de la paire stéréo peut être codée avec un niveau de qualité inférieur à celui de l’autre image. Toutefois, à condition que l’écart de qualité entre les deux images ne dépasse pas un certain seuil. Nous proposons une nouvelle méthode qui sélectionne automatiquement l’écart de qualité maximal tolérable entre les deux images. Cela a été réalisé en modélisant la relation entre la qualité des deux vues et leur distorsion inter-vues et, également, grâce à l’inclusion du modèle inspiré du système visuel humain. La seconde technique utilise une méthode de colorisation pour la compression d’images stéréo. L’idée principale est de compresser une vue de la paire stéréo en utilisant une méthode de codage standard, alors que pour l’autre vue seule la composante de luminance est considérée pour la compression. L’information de chrominance de cette dernière vue est presque totalement ignorée, à l’exception de quelques pixels représentatifs (PRs). Ces PRs sont définis à l’aide d’une nouvelle méthode d’extraction basée sur la squelettisation. Au niveau du décodeur, les valeurs de chrominance des pixels restants sont restaurées en utilisant une méthode de colorisation. Les résultats expérimentaux ont montré que les méthodes de codage proposées permettent des gains de débit considérables et surpassent les méthodes de codage d’images stéréoscopiques de l’état de l’art. Abstract (Anglais) : 3D image has the capability to enhance the multimedia experience of viewers by providing an added sensation of depth. Stereoscopic 3D (S-3D) consists of capturing two images from two slightly different positions and provides each of them to each viewer’s eye. Thus, stereoscopic content will require twice the amount of data compared to monoscopic one. In view of the huge amount of data involved by media transmission and consumption of such S-3D content, the development of efficient compression techniques is of paramount importance. To this end, this thesis presents two novel techniques to compress stereoscopic images. First, based on the binocular suppression theory, in order to reduce the required bitrate for stereoscopic images delivery, one image of the stereo pair can be encoded at high quality level, while the other image is encoded at a slightly lower quality, without noticeable visual quality losses. However, with the condition that the quality gap between both images does not exceed a certain threshold. We propose a novel method that selects automatically the maximum tolerable quality gap between views of different stereo image pairs. This has been achieved by modeling the relationship between the asymmetric quality and the interview distortion between corresponding pixels. Then, the derived relationship is combined with Binocular Just Noticeable Difference (BJND) model to control the quality threshold between the left and right views. The second technique employs colorization method for stereo image compression. The main idea is to compress one view of the stereo pair using a standard coding method, while for the other view, only the luminance component is considered for compression. The chromatic information of this latter view are transmitted to the decoder for a few representative pixels (RPs) only. These RPs are defined using a novel proposed RP extraction method based on skeletonization. At decoder side, color values of all the remaining pixels are reconstructed by colorization methods. Experimental results showed that our coding methods can achieve considerable bit-rate saving and outperforms the widely used stereoscopic images coding approaches.
Description: Doctorat en sciences
URI: http://hdl.handle.net/123456789/2471
Appears in Collections:Informatique

Files in This Item:

File Description SizeFormat
D_Inf_OUDDANE_Samira.pdf21,37 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Ce site utilise la plate-forme Dspace version 3.2-Copyright ©2014.