Home

Version PDF - Stéphane Albin

image

Contents

1. 4 Segmentation du champ visuel 4 Le syst me visuel humain 44444 64 24 a VR A pa she sua mue 8 Coupe transversale de l oell 2 2 9 Sch ma d une section de r tine 2 10 R partition spatiale des photo r cepteurs dans la r tine 11 R ponse d un b tonnet en fonction de l intensit de son stimulus 14 CSF mesur e par Watanabe et al 15 CSF mesur e par Campbell et al 15 Aberration chromatique se amp 0 0 3 808 e end NI es BE a we 16 Le ph nom ne de masquage 000 0 0 0 17 Fonction psychom trique 44 son cs D be Ru ed d 84 dau 18 Diagramme d utilisation d un mod le de vision 20 Le mod le de Sarnoff 4 Ar Sa DE e SE ee 21 Le modele de DA eo sao DAMES E e MERS MR Res 24 Fonction de sensibilit au contraste en deux dimensions 25 Cortex Transform filtre fr quentiel 26 Cortex Transform composante radiale du filtre fr quentiel 26 Cortex Transform orientations oT Cortes Trans FOP ict s ates ao E de 1 es sia at E rl eee a et o 27 Le mod le de Watson a a 29 Convergence du sondage d une image 32 Image de distances M thode adaptative 33 Condition de Subdivision 3 e 4 amp dos Beet amp
2. FIG 1 2 Distribution des poids dans le champ visuel Pixel central Focus i E Objets de la sc ne A fond FIG 1 3 Segmentation du champ visuel 1 3 L espace colorim trique LLAB Ces derni res ann es de nombreux travaux sur la couleur ont abouti des propositions Les espaces LLAB d fini par Luo dans 16 RLAB 8 et Hunt94 14 13 en sont des exemples Se basant sur l apparence des couleurs ils permettent de calculer les diff rences entre couleurs Gilles Rougeron a choisi d utiliser le premier Le d tail des calculs peut tre trouv dans 28 La premi re tape est constitu e d un recalage sur une source lumineuse de type D6500 partir d une source quelconque connaissant ses composantes X YZ Des transformations ma tricielles permettent d obtenir les composantes du pixel sous l clairage d une source D6500 La seconde tape est inspir e de l espace CIE Lab 1976 Ainsi des valeurs de clart Lz opposition rouge vert Az opposition jaune bleu Bz chromaticit Cr angle de teinte hz et teinte Hz peuvent tre calcul es sur la zone de focus La valeur m diane de chaque canal est alors affect e au pixel central Les trois canaux utilis s sont Li Cr et Ay La conversion LAB repose sur des valeurs fixes Cependant ce n est pas le cas ici Les constantes d pendent de la clart Li au pixel courant Cela nous emp che d exploiter toute forme de coh rence
3. Reste alors fixer e Il semble logique de prendre la moiti de l cart maximal entre deux couleurs imperceptibles que nous avons fix 5 soit e 2 5 Nous avons impl ment les deux m thodes sur plusieurs sc nes Le tableau 4 3 montre les temps de calcul et le nombre de subdivisions La figure 4 3 quant elle montre les images produites Si la deuxi me condition semble permettre de meilleurs temps de calcul nous pr f rons quand m me la premi re qui poss de l avantage de segmenter le domaine en trois classes Or comme nous le verrons au chapitre 5 les diff rences de couleurs peuvent tre mperceptibles visibles mais acceptables ou inacceptables I faut pr ciser que nous essayons d am liorer des temps de calculs d j tr s bas Il est donc normal que dans certains cas les temps obtenus soient sup rieurs ceux avec la m thode globale Dans l optique future o un mod le de vision ainsi qu un espace colorim trique performant seraient utilis s nous pensons que notre approche donnera de bien meilleurs r sultats Nous avons aussi effectu quelques tests avec l espace LLAB en utilisant la premi re condi tion de subdivision Les temps obtenues tableau 4 4 sont l tr s encourageants 4 3 Une pseudo distance 35 M thode Nombre de zones subdivis es M thode globale Image 1 Premi re condition 4929 512 x 512 Deuxi me condition 440 M thode globale gt Image 2 Prem
4. distance p dp 4 1 N Jo p tant la position dans l image Lorsque N est gal a T on a donc M M Le but est alors de d terminer le nombre de pixels N tel que M soit suffisamment proche de la valeur id ale M Pour cela nous avons effectu plusieurs tests suivant le nombre d chantillons tir s La figure 4 1 montre l cart en pourcentage suivant le nombre d indi vidus et cela pour deux tailles d images 200 x 200 et 512 x 512 D autre part ces tests ont t effectu s sur cinq s ries de tirages al atoires Nous montrons donc deux courbes repr sentant l erreur maximale et l erreur moyenne Les courbes obtenues montrent que quelle que soit la taille de l image nous avons besoin de 2000 individus pour obtenir une erreur inf rieure 2 et 5000 individus pour se ramener moins de 1 Nous pouvons remarquer que cela est en accord avec la th orie des sondages ou le nombre de personnes interrog es ne d pend pas de la population totale pour peu que celle ci soit suffisamment grande Bien s r faire une moyenne de cinq s ries n est pas suffisant pour tirer des conclusions Il faudrait de plus utiliser des images beaucoup plus vari es Nous pouvons cependant consid rer que ces r sultats donnent une bonne indication du nombre d chantillons ti rer 4 1 2 Temps de calcul Le tableau 4 2 montre quelques exemples M thode globale Temps de calcul 200 x 200 200 x 200 400 x 400 400 x 400 912 x 51
5. est un liquide salin et alcalin sous pression qui maintient ainsi la rigidit du globe oculaire l iris un diaphragme vertical perc en son centre par la pupille Il permet en ajustant la taille et la forme de celle ci de r guler la quantit de lumi re atteignant la r tine le cristallin une lentille transparente plac e derri re l iris La perte de transparence des cellules cristallines entra nant leur mort s appelle la cataracte le corps vitr qui constitue les 4 5 du volume de l il Compos d un liquide albumineux sous forme de gel e il est parfaitement transparent Son indice de r fraction varie suivant la longueur d onde d environ 1 345 pour 400nm 1 330 pour 700nm Ce ph nom ne s appelle l aberration chromatique et il diminue l acuit visuelle Le lecteur trouvera de plus amples explications dans 1 et 29 2 2 La r tine 10 2 2 La r tine C est la membrane la plus interne de l il un prolongement du nerf optique Elle re oit les signaux lumineux et assure leur transmission au cerveau par l interm diaire du nerf optique La r tine possede plusieurs zones ou l acuit visuelle varie La fovea est la zone d acuit maximale D cal e de 4 degr s par rapport a l axe optique elle contient en son centre la foveola o les cellules photo r ceptrices sont moins nombreuses La r gion p riph rique de la fovea est color e en jaune ce qui accro t l acuit visuelle et compen
6. f Pa T FT a tf rt gt E i feed F F H H E 1 A i H P 4 f A e LATE L 4 ds no da ea ie ae FE he normalized sensitivity ag Ha FIG 3 4 Fonction de sensibilit au contraste en deux dimensions Fr quences spatiales Le contraste en fonction d une plage de fr quence et d une orientation est calcul gr ce une transformation nomm e Cortex Transform d finie par Watson dans 33 Elle se compose de deux filtres l un fr quentiel dom filter l autre angulaire fan filter Dom filter r af 3 9 Molu v Gee x II Mp u v Mo 2 u 25v 3 10 Un premier filtre correspondant une plage 0 k est d abord calcul La composante radiale est non lin aire Ensuite il suffit de faire la diff rence avec son suivant pour obtenir la sensibilit sur une plage k k 1 cf figure 3 6 dlu v Mplu v Ma U v 3 11 3 2 Le mod le de Daly Visual Difference Predictor 26 Oo FIG 3 5 Cortex Transform filtre fr quentiel 1 0 F 5 z g mm 1 0 4 r r 0 D a 75 1 009 SPATIAL FREQUENCY FIG 3 6 Cortex Transform composante radiale du filtre fr quentiel Fan filter Soit N le nombre de filtres L cart angulaire de chaque filtre est donc de 04 D e Le filtre f peut alors se calculer suivant la formule suivante fan 0 E 1 cos PA pour 0 0 f lt
7. A AN AA Le sie 39 Points effectivement calcul s 37 SEE OISICINC UGS A i na cece eee ds 39 Piece IMACUDICO Lv mt dao oA ee gee e Pee Sat eB Be es 41 COM DOM 2 35 32 rb s LASA A A e a e 42 MO AER 43 LOTO aea aa a de Bet Re de AA AAN Se eo 44 111 TABLE DES FIGURES iv 0 6 9 7 6 1 6 2 6 3 Calcul de distance projection gaussienne 51 Calcul de distance quantification couleur en 8 niveaux 52 Choix des rectangles ted 405546 64 6625 44 6346542242445 54 Diff rences suivant la r partition des erreurs 59 Segmentation de l image de distances 56 Liste des tableaux 1 1 3 1 4 1 4 2 4 3 4 4 4 5 5 1 5 2 5 3 5 4 0 9 5 6 9 7 5 8 5 9 5 10 5 11 5 12 5 13 Cornell Box R sultats des tests 5 Prise en compte des orientations avec les ondelettes de Haar 23 M thode globale temps de calcul 30 Sondage de l image Temps de calcul 31 Temps de calcul selon la condition de subdivision 39 Temps de calcul en DAB sa Sum ae LL Sr ee Re Lie 36 Transitivit caract ristiques des images 36 Caract ristiques de la pi ce meubl e 40 Caract ristiques des images photographiques 40 R sultats de la premi re exp rien
8. Calcul 1 lt 2 lt 13 7 lt 4 lt 5 lt 6 lt 8 lt 9 TAB 5 9 Ordonnancement des images de la pi ce Pi ce meubl e Si la distance donne des r sultats en corr lation avec les tests pour les images proches il n en est pas de m me pour les images plus loign es Les images 4 et 6 sont tr s distinctes de la r f rence pour les observateurs cela a cause des forts changements de contraste autour du tableau pour la 4 et au niveau de l ombre pour la 6 Cependant notre mod le ne prend pas en compte la sensibilit au contraste Au contraire les images 8 et 9 qui ont une g om trie d cal e provoque une erreur importante Or l il n est pas sensible a la position exacte des objets Les solutions vues au chapitre 3 sont donc indispensables pour avoir une meilleure pr cision Cornell Box Test 1 8 lt 7 lt 41 4 351F lt 12 61 lt 9 lt 3 Calcul 8 lt 1 4 5 7 lt 6 lt 2 lt 9 lt 3 TAB 5 10 Ordonnancement des images de la C ornell Box Pour les images calcul es selon le mod le spectral les r sultats sont bons tableau 5 10 Nous obtenons quasiment le m me ordre que celui donn par les observateurs Images photographiques Quelle que soit la sc ne les ordres sur les distances calcul es sont les m mes Idem pour les ordres donn s par les observateurs Nous remarquons que les images 5 et 9 correspon dant respectivement une pixelisation et un bruit al atoire sont class es parmi les
9. In First International Conference on Image Processing volume 2 pages 982 986 Austin November 1994 A Watanabe T Mori S Nagata and K Hiwatashi Spatial sine wave responses of the human visual system Vision Research 8 9 1245 1263 Sept 1968 A Watson The cortex transform Rapid computation of simulated neural images Computer Vision Graphics and Image Processing 39 311 327 1987 A Watson and J Solomon Model of visual contrast gain control and pattern masking J Opt Soc Am A 14 9 2379 2391 September 1997 G Weistheimer The eye as an optical instrument In K Boff L Kauffman and J Thomas editors Handbook of Perception and Human Performance NY 1986 J Wiley and sons Bibliographie 60 36 J Zaninetti and B P roche A vector model for global illumination in ray tracing Proceedings of WSCG 98 3 448 455 february 1998 Manuel d utilisation Notre programme doit connaitre certains param tres Il fonctionne de la sorte distis 1 lt image1 gt 2 lt image2 gt o sortie p s t v a lt image1 gt et lt image2 gt repr sentent les deux images comparer Celles ci doivent tre au format LUM si l option s est sp cifi e au format PPM sinon lt sortie gt repr sente le nom du fichier de distance auquel sera rajout l extension dist p permet d afficher les r sultats sur l cran En outre le programme ne renvoie pas de code d erreur mais la valeur de la dista
10. perceptibles mais peu g nantes et enfin inacceptables Ainsi pour une zone donn e si une proportion suffisante de pixels appartient la m me classe nous consid rons cette zone comme homog ne I est donc inutile de la subdiviser Nous fixons arbitrairement le taux d homog n it 95 Dans l image de distances la moyenne calcul e est affect e tous les pixels de la zone consid r e Le seuil d partageant les deux premi res classes est fix 5 Cette valeur a t d termin e d apr s les tests effectu s par des observateurs neutres cf 5 3 1 Le second seuil est fix arbitrairement a 12 Nous obtenons ainsi une image de distances segment e en trois composantes Les zones non diff renciables prennent la valeur 0 tandis que les zones aux diff rences inacceptables re oivent le niveau de gris maximum soit 255 Dans les zones interm diaires nous effectuons une interpolation lin aire tendant ainsi l inter valle 5 12 1 254 La deuxi me approche est tir e de 18 Nous voulons conna tre les zones o la distance est peu pres constante Il n y a donc pas besoin de subdiviser ces zones l Ainsi nous consid rons une zone comme constante lorsque les valeurs calcul es sont toutes proches de la moyenne Comme pr c demment nous nous donnons une tol rance de 5 Soit X l ensemble des pixels calcul s Card x E X x x e x elh Si X lt 0 95 gt subdivision
11. s quelques secondes notre vision se r tablit C est galement le cas dans la situation inverse Plusieurs modes permettent cela La r gulation de la quantit de lumi re atteignant la r tine L iris est capable de modifier la forme et la taille de la pupille Une pupille large laissera passer beaucoup de lumi re mode nocturne et inversement Ce ph nom ne tr s rapide n est cependant que temporaire Il permet aux autres dispositifs plus lents de se mettre en place La r gulation peut se faire aussi par des mouvements r tiniens En effet en vision nocturne les b tonnets sont allong s et les c nes contract s L effet inverse se produit en vision diurne Toutefois ce m canisme est l heure actuelle peut connu Le pigment visuel Compos de rhodopsine il a pour charge d absorber les photons et d exciter les cellules visuelles Cette mol cule poss de de plus la propri t de blanchir avec l intensit lumineuse Son pouvoir absorbant est alors r duit Il faut 7 minutes aux pigments visuels des c nes pour se r g n rer et 40 minutes pour ceux contenus dans les b tonnets C est pour cette raison que nous sommes moins g n s par une lumi re forte soudaine que par l entr e dans un tunnel tr s sombre par exemple pour les b tonnets La substance contenue dans les c nes d pend de leur type mais produit un effet similaire 2 4 Les ph nom nes importants de la vision 13 Le trait
12. 1 1 R ponse orient e Il s agit maintenant de tenir compte de l orientation dans l image Pour cela Lubin calcule le contraste local donn plus haut suivant quatre directions 0 45 90 et 135 degr s Il semble que cela soit un bon compromis entre pr cision et temps de calcul 3 1 Le mod le de Sarnoff un algorithme s quentiel 22 Pour chaque direction on a un couple d op rateurs la d riv e seconde d une gaussienne orient e d abord et sa transform e de Hilbert ensuite La r ponse nerg tique en fonction d une certaine fr quence et d une orientation est alors obtenue par la formule suivante exo E on 9 Ayo 2 3 5 o o est l op rateur orient et h sa transform e de Hilbert L int r t d avoir un couple de filtres est d tre moins sensible la position exacte des zones forts gradients En effet la d tection de ces zones par l oeil n est pas au pixel pres Transduceur C est l op ration correspondant au ph nom ne dit de transduction visuelle cf 2 4 4 De plus on peut interpr ter cela comme le seuil du contraste n cessaire la d tection Etalement Le r sultat fonction du nombre de cycles est sensible jusqu a un cycle par degr Or dans la fovea la sensibilit maximale est a cing cycles par degr La solution propos e consiste convoluer avec un disque de diam tre 5 Distance A ce stade de l algorithme on a quatre pyramides de sept niveaux chacu
13. 1974 G Meyer and M Bolin A frequency based ray tracer In Computer Graphics Annual Conference Series pages 409 418 ACM Siggraph 1995 G Meyer and M Bolin A perceptually based adaptative sampling algorithm In Com puter Graphics Annual Conference Series ACM Siggraph 1998 para tre K Mullen The contrast sensitivity of human colour vision to red green and blue yellow chromatic gratings J Physiology 359 381 400 1985 L Neumann K Matkovic and W Purgathofer Perception based color image difference Technical report Insitut fur Computergraphik Vienna Austria December 1997 K Ngan K Rao and H Singh Cosine transform coding incorporating human visual system model presented at SPIE fiber 86 1986 M Orchard and C Bouman Color quantization of images Transactions on Signal Processing 39 12 2677 2690 December 1991 Padgham and Saunders 1975 A Poirson and B Wandell A pattern color separable pathways predict sensivity to simple colored patterns Vision Research 36 4 515 526 1996 G Rougeron Probl mes li s la couleur en synth se d images PhD thesis Ecole Nationale Sup rieure des Mines de Saint Etienne 1998 H Saraux B Biais and C Rossazza Opthalmologie Masson Paris 1988 P Teo and D Heeger Perceptual image distorsion In Human Vision Visual Processing and Digital Display volume 2179 pages 127 139 SPIE 1994 P Teo and D Heeger Perceptual image distorsion
14. 43 9 2 Les images Lenna 4 FIG 9 2 Les images FIG 5 5 Poivrons 44 5 3 R sultats 45 5 3 R sultats 5 3 1 Premi re exp rience Nous demandons de comparer une image toujours par rapport la r f rence Celles ci sont la num ro 2 pour la pi ce la 8 pour la C ornell Box et la 1 pour Lenna et les poivrons NB Le choix des images tant al atoire certaines n ont jamais t affich es Au contraire d autres l ont t plus souvent Les tableaux 5 3 5 6 montrent les r ponses donn es par les observateurs en pourcentage En gras se trouvent les images dont une r ponse a t choisie plus de 50 avec les distances l image de r f rence correspondantes Nous consid rons que les images dont les r ponses sont partag es ne sont pas pertinentes pour notre tude Pi ce meubl e Semblables TAB 5 3 R sultats de la premi re exp rience sur la pi ce Nous pouvons noter que les images 3 et 7 sont vues semblables la r f rence Cela est logique puisque l absence d une chaise ou le changement de texture n affecte qu une petite partie de la surface Les distances calcul es sont faibles ce qui est correct En ce qui concerne l image 11 les observateurs la voient comme distincte de la num ro 2 Le changement de m thode de rendu et l angle de roulis g n re bien une image diff rente L encore la valeur calcul e semble en corr lation avec les observation
15. 6 3 12a 2 00 0 pourl0 6 f gt bo 3 12b avec 0 f l orientation du sommet du filtre f soit Oef f 1 0o 90 La figure 3 7 repr sente la projection sur un plan du filtre angulaire ainsi calcul Le filtre final n est alors que la composition de ces deux op rateurs figure 3 8 Cortex 1 p 0 Domj p e Fan 0 3 13 Daly choisit N 6 3 2 Le mod le de Daly Visual Difference Predictor 27 der FIG 3 7 Cortex Transform orientations peje FIG 3 8 Cortex Transform 3 3 D autres approches 28 Fonction de masquage Daly d finit l information de masquage comme le produit de la fonction CSF par l op rateur Cortex appliqu l image m p 0 cs f p 0 x cortex p 0 3 14 L auteur introduit ensuite d autres notions que nous ne d taillerons pas Il s agit de la modification du masquage suivant la phase et de l effet d apprentissage Fonction psychom trique Le caract re al atoire est enfin mod lis par la fonction psychom trique 8 P c 1 e te 3 15 3 3 D autres approches 3 3 1 Distance perceptuelle base d ondelettes Gaddipatti et al ont d fini une distance perceptuelle entre images 10 Elle repose sur la combinaison d une transformation en ondelettes celles de Daubechies en l occurence avec la fonction CSF en deux dimensions Soit W m x le r sultat de la transformation en ondelettes au niveau m au pixel 7 Il faut d abord tab
16. PA D o re AT PRECISION 4 24 4 dri RS RSS MER ES OE Ver der e Gh Sete r 442 Temps de cCalctl 0 434 lar R 4a 2 BS woe ha ee ESO 4 2 Reconstruction de l image de distances 4 2 1 Nombre d echantilons ss E SUN TAN SAN E Be eS 122 VMOUCl CONMUIOME 24 ES Beale ae E ds O eee 4 3 Une pseudo distance 2h LE lt lt 9 MR Se EEO SNA RES RNA ad Ss 5 Exp rimentation A AA Deon WC SmI ae A A O RRA Seo INESIS ains ai a ae ee one daa ee e 5 3 1 Premi re exp rience aa a a 5 3 2 Deuxi me exp rience a a a 5 3 3 Troisi me exp rience 0 0u0 0 DS CONCIUSIONS Hits AAA A et ee ar a re 6 Perspectives 6 1 Un modele de vision dd A e AE Pode Sea Ad Re OLL Systeme OPLQUE s i s soros A e A Ge 6 1 2 Fr quences et orientations 6 1 3 Fonction psychom trique 6 2 La dispersion des erreurs 6 3 Un trac de rayons incr mental Conclusion Bibliographie Manuel d utilisation 11 19 19 22 23 24 24 24 28 28 28 29 30 30 30 31 33 33 34 39 38 38 39 45 45 47 49 50 53 93 93 93 94 54 09 57 60 61 Table des figures 1 1 1 2 1 3 21 2 2 2 3 2 4 2 9 2 6 Det 2 8 2 9 2 10 3 1 3 2 3 3 3 4 3 9 3 6 3 7 3 8 3 9 4 1 4 2 4 3 4 4 o 1 9 2 9 3 9 4 0 9 Champs visuels associ s chaque pixel 3 Distribution des poids dans le champ visuel
17. et donc oblige recommencer tous les calculs pour chaque pixel Pour une image de dimension 512 par 512 la taille moyenne du masque est de 7 67 soit 57 7 pixels Pour chaque image on a donc 512 x 512 x 7 6 1 51 x 10 conversions LLAB 1 4 Calcul de distance 5 1 4 Calcul de distance Soit Zp la zone de focus segment e affect e au pixel p La conversion de l espace XYZ vers LLAB peut se formaliser de la fa on suivante LLAB p mediane F p On note F p la fonction calculant les valeurs LLAB en un seul pixel p de la zone de focus L cart couleur est ensuite calcul pour tous les pixels des images J et Io Vp distance p LLAB p LLAB pr 1 5 R sultats Des tests ont t effectu s sur la scene standard nomm e Cornell Box Trois algorithmes de rendu diff rents ont t utilis s Trac de rayons avec terme ambiant Trac de rayons avec la m thode d interpolation vectorielle de la composante indirecte 36 VEI m thode de Monte Carlo avec 256 chantillons par h misph re Monte Carlo Ambiant 14h 5 mn 13 s Distance moyenne TAB 1 1 Cornell Box R sultats des tests Sur une station Silicon Graphics Indigo 2 quip e d un microprocesseur R10000 cadenc 250 Mhz le temps de calcul est d environ 32 minutes 1 6 LLAB est il bien appropri Apr s avoir discut de l int r t d LLAB nous voquerons quelques espaces fr quemment utilis
18. images En effet pouvoir quantifier l cart s parant deux images est tr s utile Imaginons par exemple un algorithme de trac de rayons incr mental Un tel outil nous permettrait de conna tre les diff rences entre deux images calcul es successivement Ainsi nous pourrions savoir lorsqu il n est plus utile de raffiner certaines zones La synth se d images tant un domaine tr s co teux en ressources les calculs inutiles sont bannir Ce travail n en est pas ses d buts Les premi res pierres ont t pos es par Gilles Rougeron dans sa th se 28 C est dans la continuit que les r sultats pr sent s ici s inscrivent Ce rapport se d coupe en plusieurs parties Dans le chapitre 1 nous tudierons le mod le de d part de Gilles Rougeron Dans les chapitres 2 et 3 nous aborderons le syst me visuel humain et les solutions existantes pour le mod liser Les chapitres 4 et 5 seront consacr s aux solutions que nous proposons pour am liorer les r sultats et aux tests effectu s Enfin dans le chapitre 6 nous voquerons quelques id es pour le futur Chapitre 1 Travaux pr liminaires La d finition d une distance entre images est un probl me fondamental Si en traitement et analyse d images des travaux ont t effectu s peu de r sultats en revanche sont connus pour la synth se d images Or le probl me est tout aussi crucial De plus quel que soit le domaine d application cette
19. progression de l algorithme suivant les zones d coup es Niveau 1 Niveau 4 Niveau 9 FIG 4 2 Image de distances M thode adaptative 4 2 1 Nombre d chantillons Une fois d finie la m thode de d coupage il nous faut connaitre le nombre d l ments qu il va falloir tirer dans une zone Nous avons choisi de d terminer ce nombre selon la taille de la zone analyser Lorsque le domaine contient un nombre important de pixels nous avons vu en 4 1 que 2000 individus tait un bon choix Ainsi nous adoptons la r gle suivante Pour T la taille de la zone Si T gt 10000 on prend N 2000 si 1000 lt T lt 10000 on prend N 500 si T lt 1000 on prend N 4 Il peut y avoir des zones de deux pixels sur deux voire m me un seul pixel Pour les petites surfaces nous sommes donc oblig s d avoir un nombre d chantillons proportionnel leur taille La moyenne en est bon exemple 4 2 Reconstruction de l image de distances 34 4 2 2 Quelle condition La descente dans l arbre c est dire le raffinement du calcul est sujette un test Deux approches sont possibles La premiere solution consiste a r pertorier les diff rentes zones de l image en classes d quivalence D apres les tests que nous avons effectu s cf chapitre 5 il semble que les observateurs discernent les dift rences entre deux images selon trois classes Elles correspondent aux diff rences non perceptibles
20. s parmi lesquels LAB qui nous semble tre la meilleure solution 1 6 LLAB est il bien appropri 6 Si les r sultats avec LLAB sont qualitativement encourageants il n est videmment pas envisageable d utiliser cela dans un algorithme de trac de rayons Les temps de calcul sont beaucoup trop importants du fait de l emploi de LLAB Il convient donc de se demander si cet espace couleur est bien utile Nous pouvons d j remarquer que l auteur ne l exploite pas dans les conditions strictes ou il a t d fini En effet Luo dans 16 impose que la cible soit uniforme et le fond achromatique Cette seconde condition n est pas remplie Il nous est alors difficile de garantir la validit de LLAB Ensuite Gilles Rougeron impose notre sens beaucoup trop de contraintes Les scenes que nous souhaitons synth tiser comportent souvent plusieurs sources lumineuses de plus diff rentes Ceci est encore en contradiction avec la d finition de LLAB Enfin les textures ne peuvent pas tre prises en compte Avec un champ d application r duit des temps de calcul prohibitifs nous estimons que cet espace colorim trique n est pas utilisable a 1 heure actuelle 1 6 1 Les espaces basiques Nous ne nous tendrons pas sur la description de ces espaces Citons les plus r pandus RVB et XYZ Ces espaces ne sont pas uniformes On ne peut donc garantir la v racit des distances calcul es C est pour cela que la Commission Internatio
21. voie de recherche n en est qu ses d buts Nous allons maintenant pr senter les solutions propos es par Gilles Rougeron dans 28 sur lesquelles nous nous sommes appuy s 1 1 Cadre d tude La particularit de la distance pr sent e est d tre sp cifique la synth se d images L au teur a choisi d utiliser tous les avantages que procure la synth se d images savoir la parfaite connaissance de la g om trie de la sc ne la possibilit de travailler avec des grandeurs physiques D autre part il faut noter que l espace colorim trique LLAB d crit en 1 3 est utilis La m thode suppose plusieurs hypoth ses 1 Le point de vue doit tre identique pour les deux images 2 les objets de la sc ne ne doivent pas comporter de textures 3 la sc ne ne doit contenir qu un seul type de source lumineuse Ces restrictions r duisent beaucoup le champ d application de la distance Nous verrons plus loin que nous pouvons nous en passer 1 2 Champs visuels L auteur propose de prendre en compte l acuit visuelle de l observateur Ainsi chaque pixel on associe deux masques repr sentant les champs visuels de 2 et 20 Cela correspond la zone fov ale et la zone d arri re fond La figure 1 2 tir e de 28 repr sente les masques associ s chaque pixel calcul s l aide des formules 1 1 aussi appel e zone de focus 1 2 Champs visuels 3 Pixel ce
22. 2 912 x 512 TAB 4 2 Sondage de l image Temps de calcul Le gain de temps est bien s r meilleur pour les images de grande taille Nous pouvons m me noter que faire un sondage avec 5000 individus sur de petites images est plus long Le sur co t est d aux calculs statistiques toujours la Cornell Box 4 1 chantillonnage 32 moyenne maximum 100 1000 10000 Images 200 x 200 moyenne maximum 1000 10000 100000 Images 512 x 512 Fic 4 1 Convergence du sondage d une image 4 2 Reconstruction de l image de distances 33 4 2 Reconstruction de l image de distances Il est possible de calculer une valeur unique partir d une carte de distances Inverse ment il serait tr s utile de pouvoir conna tre les zones o la diff rence est importante resp insignifiante sans pour autant tre oblig s de calculer tous les pixels Pour cela nous avons d fini une m thode adaptative permettant de reconstruire une carte de distances en un temps meilleur L algorithme est bas sur un d coupage de l image en arbre quaternaire quad tree Nous avons un processus r cursif en deux tapes 1 Le calcul de l erreur par Monte Carlo sur la zone concern e d abord 2 le d coupage de cette zone lorsqu une condition n est pas remplie ensuite Apr s un certain nombre de subdivisions on obtient donc une image plus ou moins raffin e La figure 4 2 illustre la
23. ECOLE NATIONALE SUP RIEURE DES MINES DE SAINT ETIENNE RAPPORT DE STAGE DE DEA Distance entre images St phane ALBIN Saint Etienne Septembre 1998 Remerciements Tout d abord je tiens remercier Bernard P roche mon maitre de stage et responsable du LISSE pour m avoir fait d couvrir le monde de la recherche Sa patience et sa disponi bilit n ont Jamais failli malgr mes nombreuses questions saugrenues Je le remercie aussi chaleureusement de m avoir associ l criture d un article bien que ma participation soit infinit simale Je remercie Gilles Rougeron pour son aide pr cieuse et sa comp tence en mati re de couleur Il a de plus le grand m rite d avoir jet les bases d une distance entre images Je remercie Laurent Carraro pour son concours d s que je butais sur un probl me math matique Je remercie Alain Tr meau et Ken Knoblauch de VIIV Saint Etienne l un pour m avoir accept comme co auteur d une publication l autre pour m avoir fait entrevoir les m andres de la th orie de la d tection Je remercie tous ceux qui ont bien voulu consacrer de leur temps en p riode estivale pour se pr ter mes tests Je remercie Jacques pour ses discussions toujours engag es sa disponibilit malgr une fin de th se imminente Je remercie Marc pour sa culture sans limites et la qualit du syst me qu il maintient Je remercie toute l quipe SIMA DE et plus particuli rement Marie Line que ferions nous sans
24. En dehors de la fovea la densit d cro t suivant l excentricit 120 1 0 4e d 3 2 Malheureusement Lubin ne donne pas de justification pour le choix des densit s R ponse de l il aux bandes passantes de contraste Les intensit s sont converties en contraste local Lubin propose d utiliser pour cela une pyramide laplacienne On obtient 3 1 Le mod le de Sarnoff un algorithme s quentiel 21 Img 1 Img 2 Cx ce Optics Sampling stimuli bandpass trast o o i i MZ N transducer yy y distance Qnorm JND Probability Fic 3 2 Le mod le de Sarnoff ainsi 7 niveaux de fr quences allant de 0 5 a 32 cycles par degr La localit est obtenue en divisant par la valeur de la gaussienne situ e deux niveaux plus bas dans la pyramide Le contraste local 1 peut se formuler ainsi aa HE G X Gari 2 cae A ed ES 3 3 I Z x Grra 2 avec Z un point de l image 1 x l intensit lumineuse apr s l op ration chantillonnage et Gi un noyau gaussien tel que 1 27 17 Ca op P o 3 4 270 y Ce type de calcul est assez lourd L utilisation d une transformation en ondelettes permet un gain en temps significatif pour une pr cision similaire cf 3
25. ISCC Baltimore tats Unis Sur un plan personnel ce stage m a permis de d couvrir le monde de la recherche scienti fique auquel j esp re appartenir dans les ann es venir sya Bibliographie 1 M A Ali and M A Klyne La vision chez les vert br s D carie Masson Qu bec 2 edition 1986 C R Bader P R MacLeish and E A Schwartz A voltage clamp study of the light response in solidary rods of the tiger salamander J Physiology 296 1 1979 R Balasubramanian J Allebach and C Bouman Color image quantization with use of a fast binary splitting technique J Opt Soc Am A 11 11 2777 2786 November 1994 P G Barten Evaluation of the effect of noise on subjective image quality In Human Vision Visual Processing and Digital Display volume 1453 pages 2 15 SPIE 1991 P G Barten Physical model for the contrast sensivity of the human eye In Human Vision Visual Processing and Digital Display volume 1666 pages 57 72 SPIE 1992 F W Campbell and J G Robson Application of fourier analysis to the visibility of gratings J Physiology 197 551 566 1968 S Daly The visual difference predictor an algorithm for the assessment of image fidelity In A B Watson editor Digital Images and Human Vision pages 179 206 Cambridge 1993 MIT Press M Fairchild Refinement of the rlab color space Color Research and Applications 21 338 346 1996 D Gabor Theory of communication Jou
26. Les b tonnets eux ne sont sensibles que pour des longueurs d ondes inf rieures 495nm Ces photo r cepteurs fonctionnent selon trois modes photopique le jour seuls les c nes sont actifs scotopique la nuit ce sont les b tonnets qui fonctionnent m sopique o tous les photo r cepteurs sont actifs De plus leur r partition n est pas gale dans la r tine Ainsi les c nes ne sont pratiquement pr sents que dans la fovea avec une densit maximale de 150000 mm Celle ci d croit de mani re concentrique A 40 degr s de l axe visuel on considere la densit des c nes comme trop faible pour avoir une influence sur la vision Les batonnets eux ne sont pas pr sents dans la foveola et tres peu dans la fovea Leur densit maximale est d environ 160000 mm 20 degr s La vision la p riph rie de la r tine est donc monochromatique et ne sert qu a la d tection des mouvements La figure 2 4 illustre cela foveola RE Nombre en milliers par mm 140 80 A SN E A D ees ore 20 NE 0 0 10 20 50 degr s i Distance 0 5 10 15 20 mm FIG 2 4 R partition spatiale des photo r cepteurs dans la r tine 2 3 Transmission de l information au cerveau Les deux nerfs optiques se rejoignent au niveau du chiasma 1l y a alors s paration sul vant le champ observ L information gauche est envoy e vers l h misphere droit et inver sement Les reliefs peuvent ainsi tre d tect s par co
27. SF f 0 31 0 69 e 921 2 2 Les orientations Il y a eu tr s peu d tudes men es sur le sujet Cependant il est facile de se rendre compte intuitivement de son influence Lorsque l on regarde une image nous sommes plus sensibles l aliassage sur des formes verticales ou horizontales qu obliques De la m me mani re dans la vie courante il est plus difficile d ajuster un objet avec pr cision s il est inclin a 45 2 4 7 L aberration chromatique Cette sensibilit fr quentielle diff re selon le type de cones Des tudes ont montr que les cones S ne d tectaient rien au del de 4 cycles par degr 22 27 Nous devons donc utiliser trois fonctions CSF diff rentes La figure 2 8 montre deux CSF achromatique et chromatique 2 4 Les ph nom nes importants de la vision 17 2 4 8 Le masquage La d tection d une texture n est pas seulement fonction de la fr quence spatiale locale La pr sence d autres textures dans la zone influe aussi Consid rons par exemple une image avec un fond textur orient horizontalement Un objet ayant la m me fr quence et la m me orientation sera difficilement d tectable Si au contraire cette objet est orient verticalement il sera mieux rep r Donc l objet devra avoir un poids plus important en terme d information significative figure 2 9 FIG 2 9 Le ph nom ne de masquage 2 4 9 La fonction psychom trique On d finit le seuil de d tec
28. ait que la r tine contient trois types de c nes aux sensibilit s Cette caract ristique se retrouve tr s rarement chez certains individus humains 2 4 Les ph nom nes importants de la vision 14 1 0 8 0 6 0 4 0 2 0 3 2 5 2 1 5 1 0 5 0 log FIG 2 5 R ponse d un b tonnet en fonction de l intensit de son stimulus spectrales diff rentes rouge vert bleu Certaines critiques furent mises En 1878 Hering a propos une approche alternative Selon lui l homme serait sensible aux diff rences de couleurs Ainsi les oppositions noir blanc rouge vert et bleu jaune d criraient la vision chromatique humaine Des tudes r centes cf Padgham amp Saunders 26 semblent attester que les deux th ories sont pr sentes Les c nes seraient bien sensibles au rouge vert et bleu comme indiqu par Young et Helmholtz Il y aurait de plus un ph nom ne chimique dans la r tine L information sur les oppositions de couleur serait aussi transmise au cerveau le jaune tant obtenu par combinaison du rouge et du vert 2 4 6 Le r le des fr quences et orientations De nombreuses tudes ont montr l importance de l organisation fr quentielle de l image dans sa compr hension Pour le cas des orientations la litt rature est moins abondante Fonction de sensibilit au contraste CSF Watanabe et al 32 ont effectu des mesures sur des sujets humains Le but tait de connaitre leur sens
29. btenir une solution la fois coh rente physiologiquement et peu co teuse 6 1 1 Syst me optique La quasi totalit des m thodes vues mod lisent l effet de la corn e et du cristallin par un filtre passe bas La fonction de Weistheimer 35 utilis e dans le mod le de Sarnoff cf 3 1 semble tre une bonne solution la fois rapide et pr cise Q p 0 95267259 0 048e7 2481412 6 1 6 1 2 Fr quences et orientations Le principal ph nom ne que notre mod le doit prendre en compte est la sensibilit en fonction des fr quences et des orientations spatiales de l image Nous reprenons l id e donn e par Purgathofer dans 23 Elle consiste poser des rectangles al atoirement dans l image La distance obtenue est la moyenne de toutes les moyennes des rectangles De plus leurs tailles ne sont pas choisies au hasard Elles d pendent de la fonction de sensibilit au contraste CSF On utilise la technique de Monte Carlo selon un chantillonnage d importance sur la C SF Ainsi il est possible de pond rer la moyenne obte nue suivant les zones aux fr quences les plus d tectables Purgathofer utilise la fonction de Mannos et Sakkrison Par contre le rapport entre la hauteur et la largeur est choisi al atoirement L nous pensons que la solution propos e par Daly 7 c est dire prendre une CSF en deux dimensions est meilleure Une fois choisie la taille du rectangle son orientation permet de connaitre la fr
30. ce sur la pi ce 45 R sultats de la premi re exp rience sur la Cornell Box A6 R sultats de la premi re exp rience sur Lenna 46 R sultats de la premi re exp rience sur les poivrons 47 Poids affecte aux images 0u0 0 0 0 0 47 Distances calcul es os to bei ee hoe te a a Be eA Ra 48 Ordonnancement des images de la piece 48 Ordonnancement des images de la Cornell Bor 48 Ordonnancement des images de Lenna 49 Ordonnancement des images des poivrons 49 Troine test sna e ra IN AN E DB B AA er Gr E AN E 50 Introduction La formation doctorale orchestr e par PIUP Vision de l Universit Jean Monnet de Saint Etienne et l cole Nationale Sup rieure des Mines de Saint Etienne suppose un stage d ini tiation la recherche Cet enseignement s effectue en collaboration avec l cole Sup rieure de Chimie Physique et lectronique CPE de Lyon L ole des Mines m a donc accueilli plus pr cis ment le stage s est d roul dans les lo caux du LISSE Laboratoire d Images de Synth se de Saint Etienne sous l gide de Bernard P roche rattach au centre SIMADE Sciences de l Information Math matiques Aide la D cision et Environnement de l cole D une dur e de six mois de mars ao t 1998 le but de ce stage tait de proposer une distance entre
31. dans 21 une volution pour traiter la couleur Mais ce n est pas sans difficult s Chaque tape repose sur des m canismes physiologiques permettant ainsi des r sultats plausibles La figure 3 2 repr sente l architecture du mod le Stimuli Tl s agit des images de d part en luminosit 19 3 1 Le mod le de Sarnoff un algorithme s quentiel 20 Image 1 Image 2 Calibration Calibration Affichage Affichage Modele de vision Modele de vision i re call Distance k aleur unique FIG 3 1 Diagramme d utilisation d un mod le de vision Syst me optique Le but de cette tape est de mod liser la corn e et le cristallin On veut prendre en compte l influence d un point lumineux sur la vision des ses voisins Ceci se fait par une fonction approximant le ph nom ne de cercle de confusion Cette fonction donn e par Weistheimer dans 35 est Q p 0 9520 251 0 048e 243197 3 1 avec Q p l intensit lumineuse en fonction de la distance p un point de puissance unitaire chantillonnage Apr s avoir obtenu l image d form e par le syst me optique il faut cal culer l image telle que la voit la r tine La m thode choisie est aussi une convolution mais par une gaussienne Le poids affect d pend de la r gion Pour la fovea la densit est de 120 pixels par degr
32. de l information au cerveau 11 2 4 Les ph nom nes importants de la vision 12 PEER ACCOMOMAUONS z Jz n EDEN A D ARS Aa Rae 12 2 4 2 L adaptation la lumi re 12 24 3 L acuit etlasensibilit ue ew a e a 13 244 La transduction visuelle 13 245 La viston des couleurs lt a MINES Re ie Ed Be 13 2 4 6 Le r le des fr quences et orientations 14 24 7 D aberration chromatique 4 5 4 4 4 od mea ae um Made 16 218 J masquage ra d Has we La des den eee da is 17 2 4 9 La fonction psychom trique 17 TABLE DES MATI RES 3 Les mod les de vision 3 1 Le mod le de Sarnoff un algorithme s quentiel HIA Amelor ACTIONS riue 9 4 e e ad ie da os ME oe gh a pers 3 2 Le mod le de Daly Visual Difference Predictor 3 2 1 Amplitude non lin aire 3 2 2 Fonction de sensibilit au contraste 3 2 3 M canismes de d tection 29 D autres approches me do Sek ad ere ae Bk we sd NAN 36286 3 3 1 Distance perceptuelle base d ondelettes 3 3 2 Un trac de rayons fr quentiel 33 9 TLemod le de WAlSO suis we we be B we Se ee RS MES But 4 Acc l ration des calculs sonder l image 4 1 chantillonnage a Wot DR Aa Geet EE D
33. donn e Le contraste en fonction d une bande de fr quence et d une orientation est calcul l aide d une seule transformation les ondelettes de Haar Pour une bande de fr quence trois types 3 2 Le mod le de Daly Visual Difference Predictor 23 de contrastes sont d tect s horizontalement verticalement et obliques Cette derni re classe regroupe aussi bien les orientations 45 qu 135 Le sch ma 3 1 illustre cette r partition TAB 3 1 Prise en compte des orientations avec les ondelettes de Haar 1 a1 5 5 all ale y 1 alr 1 9 ale 1y 1 87 q TE 1 dj_4 EE q cilz y qlz y 1 ale 1 y alz 1 y 11 9 X 1 df 1 EE q elz y cilz y 1 alx Ly alz 1 y 11 3 1 d 4 gt gt q cilz y qlz y 1 ale 1 y alz 1 y 11 La grosse diff rence avec le mod le de Sarnoff tient dans la gestion de la couleur Meyer et Bolin proposent de passer dans l espace AC C3 Cela permet de prendre en compte l aber ration chromatique Ainsi sur le canal achromatique la fonction CSF est celle donn e par Barten dans 4 et 5 Sur les canaux en opposition rouge vert et bleu jaune elle est construite partir des donn es fournies par Mullen 22 Ce sont les principales diff rences apport es par Meyer et Bolin L architecture du mod le reste la m me Ainsi une image de distances ou une valeur sont calcul es partir des images co
34. elle Dominique Gr gory Helymar Jean Claude Jean Michel Marion et Pierre mon compagnon de DEA pour leur bonne humeur et leur sourire inamovible Je remercie JeT Nad Seb et Toine pour leur compagnie lectronique Je remercie mon p re pour son soutien journalier Qu il sache que je ne l oublie pas Enfin je remercie Vanessa Ang lique St phanie Marc Philippe Thierry Alex et Gilles pour leur amiti de tous les jours sinc re et partag e Mots cl s Distance entre images Vision Psycho visuel Mod les de vision Arbre quaternaire Echantillonnage Monte Carlo R sum Ce document est le m moire d un stage de DEA Il pr sente l laboration d une distance entre images Outre les ph nom nes visuels auxquels nous sommes sensibles et la fa on de les mod liser nous tudions ici une m thode permettant l acc l ration des calculs de distance Notre solution repose sur la technique de l chantillonnage Nous montrons d abord qu un nombre r duit d individus suffit pour conna tre une valeur de distance tr s proche de la valeur id ale Ensuite nous proposons l utilisation d un arbre quaternaire pour reconstruire une carte de distances en un temps inf rieur la m thode globale o tous les pixels sont calcul s Enfin une proc dure de test aupr s d observateurs volontaires a t organis e Nous mon trons les r sultats et leur cor
35. elle ci nous semble tre 1 6 LLAB est il bien appropri la moins pire comparativement aux espaces pr sent s ci avant Chapitre 2 Le syst me visuel humain Cette description est tir e de 28 Le syst me visuel peut tre subdivis en trois sous ensembles repr sentant le cheminement de l information visuelle de l il vers le cerveau Le couple il r tine d abord officie comme capteur des signaux lumineux Ensuite le nerf optique le chiasma et le corps genouill lat ral permettent la transmission nerveuse de l image au cortex enfin o elle est d cod e figure 2 1 Chaque tape influe sur le signal transmis Des pr traitements sont effectu s mais aussi des pertes y sont occasionn es il gauche ceil droit r tine Gg Gd PS NDX s Gd AP genouill lat ral cortex occipital FIG 2 1 Le syst me visuel humain 2 1 L il 2 1 L il L il est compos de plusieurs l ments qui ont chacun une influence dans le cheminement de la lumi re et la compr hension du signal optique par le cerveau figure 2 2 C t Nasal C t Temporal com e nerf optique FIG 2 2 Coupe transversale de l il Parmi ces l ments les plus importants sont la corn e C est la couche externe convexe de l il Elle est compos e de quatre couches successives Sa courbure d pend des individus et varie aussi avec l ge l humeur aqueuse C
36. ement neural des informations Ce dernier ph nom ne est encore mal compris Cependant il semble que les neurones en contact avec les cellules r tiniennes jouent aussi un r le dans le contr le du gain 2 4 3 L acuit et la sensibilit L acuit est le pouvoir de r solution c est dire la facult de d celer de tr s petits objets Pour cela il faut que l image fournie par le syst me optique la corn e et le cristallin soit de bonne qualit Cela d pend aussi des caract ristiques physiologiques de chaque r tine Ainsi on compte 7 millions de c nes et 120 millions de b tonnets pour seulement un million de fibres dans le nerf optique L information est donc compress e avec pertes Les signaux re us par deux cellules proches seront combin s vers une seule fibre Plus la distance entre deux photo r cepteurs telle que deux fibres nerveuses soient sollicit es est r duite meilleure est l acuit visuelle Il faut noter aussi que cela d pend de l intensit lumineuse des sources observ es La sensibilit elle est l aptitude d tecter de faibles quantit s de lumi re Elle d pend de la longueur et de la surface des photo r cepteurs Ce sont donc les b tonnets qui offrent une meilleure sensibilit la lumi re C est pourquoi il est commun ment admis que la r gion p riph rique la fovea plus riche en b tonnets d tecte l information de luminance 2 4 4 La transduction visuelle La t
37. es la r f rence Pour Lenna nous avons choisi la quantification couleur vingt niveaux et la projection gaussienne Enfin pour les poivrons c tait la deuxi me quantification huit niveaux Quinze personnes ont particip l exp rience Outre le choix d une image de distances elles avaient la possibilit de ne pas r pondre si aucune image ne leur convenait ou de r pondre que l image de distances devait tre plus blanche ou plus noire Les cartes de distances ont t calcul es selon la m thode globale pour tous les pixels en LAB la plage de valeurs imperceptible inacceptable tant ramen e sur 0 255 Nous avons pris 12 comme cart minimum inacceptable entre deux couleurs et 2 3 3 5 4 5 et 7 pour l cart couleur maximal entre deux couleurs imperceptibles construisant ainsi cinq images de distances diff rentes Le tableau 5 13 montrent les r sultats La colonne Mode repr sente la r ponse la plus fr quente c est dire le num ro de l image de distances choisie 5 tant l image la plus noire Le signe repr sente la r ponse L image devrait tre plus noire La r ponse Aucune image ne correspond est indiqu e par le signe J La colonne Nombre indique le nombre d occurences du mode Enfin la derni re colonne donne le nombre d observateurs qui n ont pas pu r pondre Les r ponses les plus fr quentes sont 4 seuil 4 5 5 seuil 7 et Les observateurs trouvent u
38. es ont t sensibles a la d gradation des couleurs sur les poivrons du premier plan Or les carts couleurs les plus importants se situent sur la gauche au second plan cf figure 5 7 Il nous est cependant difficile de dire si l il humain effectue une segmentation spatiale de l image pour donner un poids plus important aux objets de premier plan Il se pourrait tout aussi bien que nous examinions avec plus de pr cision le centre de l image par rapport aux extr mit s Dans l incertitude des tests compl mentaires nous semblent donc utiles 5 3 4 Conclusion Ces exp riences nous ont apport deux enseignements importants Primo en ce qui con cerne l cart LAB maximal entre deux couleurs imperceptibles 5 semble tre une bonne va leur I nous reste alors a fixer le deuxi me seuil Secundo la prise en compte des ph nom nes visuels sont indispensables 5 3 R sultats FIG 5 6 Calcul de distance projection gaussienne ol 5 3 R sultats FIG 5 7 Calcul de distance quantification couleur en 8 niveaux 92 Chapitre 6 Perspectives 6 1 Un mod le de vision Nous avons vu lors des tests que la prise en compte de la perception visuelle humaine tait indispensable pour le calcul d une distance entre images correcte Le but de cette section n est pas de proposer un n i me mod le mais plut t de garder les avantages de chacune des m thodes cit es au chapitre 3 Nous devrions ainsi o
39. hibiteur est convolu par un filtre gaussien Il ne reste plus qu r unir les deux signaux pour obtenir le contraste relatif pour chaque image La distance finale est calcul e dans l espace L4 Chapitre 4 Acc l ration des calculs sonder l image La comparaison des images d finie par Gilles Rougeron prenait en compte tout le domaine chaque pixel tant calcul Les op rations tant tr s co teuses cela occasionne un temps de calcul important LLAB 28 mn LAB 2 2 S TAB 4 1 M thode globale temps de calcul Cependant nous pouvons nous demander s il est vraiment utile de calculer tous les pixels Lorsque l on effectue un sondage un panel de dix mille voire m me mille personnes permet d avoir un id e tr s pr cise de l opinion g n rale La m me technique ne pourrait elle pas tre utilis e dans ce cas pr cis Il serait en effet int ressant d obtenir un r sultat global quasi quivalent avec quelques milliers d chantillons au lieu de 250000 Cette technique a t d velopp e dans 23 Nous nous en inspirons NB Il convient de pr ciser que les temps donn s ci apr s correspondent un calcul dans l espace LAB 4 1 chantillonnage 4 1 1 Pr cision Pour cela nous utilisons la m thode de Monte Carlo 11 Soient deux images contenant T pixels de distance moyenne M et M d fini comme l cart 30 4 1 chantillonnage 31 moyen sur N pixels choisis au hasard 1 N M
40. i re condition 2291 512 x 512 Deuxi me condition 2782 M thode globale Image 3 Premi re condition 4092 400 x 400 Deuxi me condition 3757 TAB 4 3 Temps de calcul selon la condition de subdivision Premi re m thode Deuxi me m thode FIG 4 3 Condition de subdivision 4 3 Une pseudo distance La distance que nous calculons si elle n en est pas une au sens math matique comporte quand m me quelques similitudes avec la d finition th orique 1 R flexivit Il va de soi que la distance pixels pixels entre deux images identiques est nulle Notre distance est bien r flexive 2 Sym trie Nous calculons des carts entre pixels en valeur absolue L encore l ordre des images n a aucune influence sur le r sultat 3 Transitivit Nous sommes l heure actuelle incapables de prouver la transitivit ou non de notre solution Cependant nous avons effectu quelques tests sur une s rie d images de synth se o nous modifions progressivement la sc ne Nous voyons dans le tableau 4 5 les distances calcul es entre les diff rentes images 4 3 Une pseudo distance 36 Tous les pixels Sc ne 1 7mn 47 s M thode adaptative Sc ne 2 6 mn 10 s Sc ne 3 11 mn 17 s TAB 4 4 Temps de calcul en LLAB Distances avec l image n Differences avec la n 1 Seo on oe sans anti aliassage sans anti aliassage source ponctuelle sans anti aliassage source ponctuelle text
41. ibilit au contraste en fonction de la fr quence spatiale La figure 2 6 montre les r sultats On observe que les personnes test es sont plus particuli rement sensibles des fr quences spatiales comprises entre 1 et 15 cycles par degr De plus au del de 50 cycles par degr s l il ne d tecte plus rien Les mesures de Campbell et al 6 figure 2 7 sont similaires 2 4 Les ph nom nes importants de la vision 15 contrast sensitivity 1000 160 10 vlow angla O 16 4 deg 3 6 0 1 1 10 100 spatial frequency oyctes degree Fic 2 6 CSF mesur e par Watanabe et al contrast sensitivity 1000 100 0 view angle 10 deg O 2 0 1 1 10 100 spatial frequency cycies degras Fic 2 7 CSF mesur e par Campbell et al 2 4 Les ph nom nes importants de la vision 16 300 100 achromatic contrast sensitivity 30 chromatic 10 3 4 003 01 03 1 3 10 30 100 spatial frequency cycles degree FIG 2 8 Aberration chromatique Des tudes ont t men es pour trouver une formule analytique proche des r sultats exp rimentaux Parmi les plus connues nous pouvons citer la formule de Mannos et Sakrison 19 Celle ci est une des premi res solutions propos es Elle est utilis e dans bon nombre de modeles CSF f 2 6 0 0192 0 114f e 1MP 2 1 Citons aussi la solution de Ngan et al 24 plus r cente et donnant de meilleurs r sultats C
42. istance Nous cherchons alors conna tre l ordre moyen sur chaque s rie d images Cependant le nombre de classes n est pas fixe Par exemple voici deux s quences de r ponses donn es pour Lenna 11 2 4 8 lt 7 lt 0 lt 5 lt 43 91 11 24 7812413564 lt 9 Les chiffres entre accolades repr sentent les images que les observateurs n ont pas pu d partager Nous d cidons d affecter des poids chaque image Ainsi pour la premi re r ponse les images 1 2 4 et 8 re oivent le poids 1 L image Y re oit le poids 5 Le poids 6 est donne a l image 6 Enfin les images 3 5 et 9 re oivent respectivement 7 8 et 8 Pour la seconde r ponse les poids respectifs pour les images de 1 a 9 sont 1 1 6 1 6 6 1 1 9 Le tableau 5 7 montre les poids moyens re us par chaque image Images se RE Pi ce Cornell Box Es Lenna l 1 17 7 23 5 70 Poivrons i 1 29 7 47 5 47 TAB 5 7 Poids affecte aux images Il nous est alors facile d obtenir l ordre moyen en classant les images suivant leurs poids Par exemple cela donne pour la pi ce 1 lt 2 lt 3 7 lt 8 lt 5 lt 9 lt 4 lt 6 5 3 R sultats 48 Pi ce Cornell Box 0 15 Lenna Poivrons TAB 5 8 Distances calcul es Calculons maintenant les distances De la m me mani re nous obtenons un ordre cette fois ci calcul D autre part nous regroupons dans un m me ensemble les valeurs proches Test 1 lt 2 lt 8 7 lt 8 lt 5 lt 9 lt 4 lt 6
43. lir une pond ration sur chaque niveau Ce poids repr sente le volume sous la surface CSF pour une bande de fr quence BF donn e Pour 7 la fr quence maximale on a Tex CSFwdw Jer wdw On d finit alors la sensibilit S au niveau m en x comme Cm avec BFm Lr 3 16 gm 9m 1 S m x CmW m 3 17 La m trique perceptuelle n est autre qu une moyenne des diff rences de sensibilit ae x ISA Sp M A B 3 18 pl Ni Xx N 3 3 2 Un trac de rayons fr quentiel Gary Meyer et Mark Bolin ont aussi propos un algorithme de trac de rayons en fonction des fr quences spatiales 20 Il est bas sur la m thode de compression JPEG Le domaine est divis en blocs de taille 8 par 8 pixels L id e principale est de trouver la repr sentation fr quentielle sur chaque bloc Ceux ci sont alors tri s selon leur importance en fonction de la CSF A un instant t on tire des chantillons dans les blocs significatifs En r it rant le processus on obtient une image calcul e selon les bonnes fr quences De plus amples explications peuvent tre trouv es dans 20 3 3 D autres approches 29 3 3 3 Le mod le de Watson Nous parlerons enfin du mod le de vision d fini par A Watson et J Solomon 34 Tr s similaire au mod le de Sarnoff nous retrouvons la m me organisation s quentielle Chaque image en luminance subit des transformations successives les r sul
44. main A partir de deux images dont l une pourrait tre la r f rence par exemple on applique le mod le On obtient ainsi les deux images telles que les comprend le cerveau Un calcul de distance est alors effectu entre celles ci Deux r sultats sont possibles soit avoir une image de distances compl te soit une valeur unique symbolisant l cart entre les images De plus nous souhaiterions tre capables d obtenir une seule valeur partir de la carte des distances et inversement La figure 3 1 repr sente la d marche En synth se d image le calcul peut s effectuer soit dans la sc ne soit sur l image affich e sur l cran comme en analyse Dans la seconde hypoth se on rajoutera un dispositif permettant de conna tre l image affich e en fonction des caract ristiques pr cises du moniteur utilis Beaucoup de solutions ont t propos es La plupart ne prennent en compte que quelques ph nom nes C est le cas de 10 ou encore 34 Cependant deux mod les sont plus complets Ce sont les mod les de Sarnoff 15 et de Daly 7 3 1 Le mod le de Sarnoff un algorithme s quentiel Ce mod le d fini au centre de recherche David Sarnoff tente de prendre en compte les ph nom nes se produisant dans le syst me visuel humain de mani re s quentielle Toutefois il est important de pr ciser que ce mod le est d fini pour des images mono chromatiques Nous verrons plus loin que Meyer et Bolin ont propos
45. mparaison des deux demi images Le signal optique transform en signal lectrique par la r tine arrive alors au cortex o il est analys Des ph nom nes complexes entrent en jeu Ainsi la perception visuelle d pend des 2 4 Les ph nom nes importants de la vision 12 facteurs environnants comme le bruit L tat de fatigue ou de stress joue aussi un r le dans la compr hension de l image fournie 2 4 Les ph nomenes importants de la vision 2 4 1 L accomodation L accomodation est la facult d adapter l il en fonction de la distance aux objets observ s C est le r le de la corn e et du cristallin qui en se d formant ajustent l image projet e sur la r tine L hyperm tropie et la myopie sont les troubles visuels issus du dysfonctionnement de l accomodation Ces probl mes sont corrig s par l ajout d une lentille convergente ou di vergente devant la corn e 2 4 2 L adaptation la lumi re L intensit lumineuse la surface de la terre varie beaucoup Ainsi l clairage peut varier de 10 W cm entre une journ e ensoleill e et une nuit sans lune L il doit tre capable de capter les photons dans l obscurit mais aussi de se prot ger d une lumi re trop vive ceci gr ce un syst me d adaptation la lumi re Ce ph nom ne s illustre facilement Lorsque nous quittons un endroit fortement clair pour un autre plus sombre nous sommes temporairement aveugles Apr
46. naissances particuli res dans le domaine Il convient cependant de pr ciser que ces tests ne sont l qu titre indicatif Nous devons d abord admettre que nous ne sommes pas sp cialistes en la mati re et la th orie de la d tection est une discipline a part enti re qui demande des bases solides I nous tait donc difficile d organiser une v ritable proc dure de test grande chelle dans le temps qui nous tait imparti Nous pensons cependant que ces r sultats peuvent tre une bonne indication de la validit de la m thode 5 1 Trois tests Nous avons soumis les observateurs trois exp riences successives Dans la premi re nous affichions diff rents couples d images pendant quatre secondes et cela r p t cinquante fois Pour chaque couple nous posions la question Y a t il des diff rences dans l image La personne avait alors le choix entre trois r ponses 1 Les images sont semblables 2 les images sont peu diff rentes 3 les images sont diff rentes La distinction entre peu diff rentes et diff rentes n tait pas d finie chacun de d terminer ce qu il entendait par diff rences non n gligeables En outre les couples d images taient choisis al atoirement parmi quatre s ries de neuf Ce test comporte deux avantages Il recueille d abord la premi re impression de l observateur celui ci n ayant pas le temps d analyser les images Ensuite nous pensons ainsi conna t
47. nale de l Eclairage CIE tente de d finir de meilleures solutions 1 6 2 L espace CIECAM97 C est partir des trois mod les LLAB Hunt et RLAB que Luo et Hunt ont propos dans 17 un nouvel espace CIECA M97 tentant de prendre les avantages de chacun Il repose sur trois tapes une transformation d adaptation chromatique C est la phase de recalage sur un blanc de r f rence La transformation utilis e est celle de Bradford une fonction de r ponse dynamique Cette fonction mod lise la r ponse minimale de 1 pour les faibles stimulus et maximale de 41 pour les stimulus importants La transition entre les deux approxime une fonction racine une projection dans un espace couleur pour repr senter les donn es On obtient alors un espace 7 dimensions repr sentant l angle de teinte la teinte la lumi nosit le contraste la saturation la chromaticit et le piqu des couleurs Nous ne donnerons pas le d tail des op rations qui peuvent tre trouv es dans 17 Si cet espace semble a priori donner de meilleurs r sultats que LLAB il ne permet toujours pas l emploi de sources lumineuses diverses dans une m me sc ne De plus les temps occasionn s risquent d tre l encore prohibitifs 1 6 3 L espace LAB Cet espace pr sente le double avantage d tre uniforme pour les petites valeurs tout en restant plus facilement calculable S il n y a pas de solution miracle c
48. nce I peut ainsi tre ins r dans un autre La m thode de calcul doit tre obligatoirement sp cifi e par t tous les pixels v une valeur unique a m thode adaptative 61
49. ne don nant le contraste dans l image de d part en fonction des ph nom nes psycho visuels entrant en jeu Il s agit donc de comparer les r sultats obtenus pour les deux images D abord les premiers niveaux de la pyramide sont tir s pour avoir la m me taille que le niveau le plus bas On obtient alors un vecteur de dimension 28 pour chaque pixel Ensuite on calcule la distance dans l espace L entre les pixels des deux images ce qui nous donne une image de distances fi 4 D a 2 E LP 284 ray 3 6 1 1 Q prend g n ralement comme valeur 2 4 Lubin ne donne pas d explications cela Cepen dant 2 4 est une valeur aussi utilis e dans d autres modeles Outre la carte de distances une valeur unique peut tre g n r e Cela permet d avoir un descripteur de qualit d images et de comparer voire m me de classer plusieurs images 3 1 1 Am liorations En synthese d images le principal reproche que nous pouvons faire ce modele est son ap proche mono chromatique Meyer et Bolin ont propos lors du SIGGRAPH 98 une volution traitant la couleur 21 Nous verrons aussi que les auteurs utilisent une transform e en on delettes moins co teuse que la pyramide laplacienne associ e aux filtres gaussiens La premiere tape Syst me optique du mod le de Sarnoff est supprim e A la place on trouve un passage dans l espace colorim trique SML L tape Echantillonnage est aussi aban
50. ne plus grande corr lation entre les cartes de distances fonc es et les diff rences qu ils discernent dans les images analyser Conform ment aux r sultats obtenus lors des deux 5 3 R sultats 50 1 4 21 4 3 5 4 5 4 6 5 Cll oe 8 0 TAB 5 13 Troisi me test premiers exp riences 5 semble tre une valeur raisonnable comme seuil d imperceptibilit entre deux couleurs dans l espace LAB Les tests 7 et 8 mettent en vidence les limites de notre m thode La projection gaussienne sur Lenna g n re une distance importante dans la plume comme on peut le voir sur l image de distances figure 5 6 Or aucun observateur n a d tect cette diff rence la plupart qualifiant meme l image comme identique a la r f rence Cela s explique simplement par le fait que la plume est une zone tr s textur e avec de plus une fr quence spatiale lev e Comme nous l avons vu en 2 4 6 page 14 l il n est pas sensible a toutes les fr quences de la m me mani re qui plus est les fr quences lev es Nous voyons bien la l int r t d un mod le de vision Les r sultats pour la quantification couleur en huit niveaux sur les poivrons sont m diocres En effet la grande majorit les observateurs n ont pas trouv d image significative De plus les diff rences de couleurs qu ils voyaient ne se situaient pas aux m mes endroits que ceux donn s par le programme Ainsi les personnes test
51. ntral Arri re fond Observateur Plan image FIG 1 1 Champs visuels associ s chaque pixel Ah __ 2 Qp 1 21Npp tan nop tan gt A A S T a 0 Laia 2 Npp tan Z 2i tan Sh tan E gt ony 1 2 j Npn tan Z n tan Z d 727 tan tan E 1 1b 2 Npn tan Z 27 tan Z tan Z 1 2in tan amp ng tan 22 nh j _ A 2 P c 1 1c 2 Nyy tan S 2 tan Qu tan Z 1 29 Moy tan amp n tan 2 D id 1 1d 2 Np tan amp 2 j tan Y tan Z ou i j d signe le pixel Qp repr sente l angle du champ visuel 2 ou 20 ah et Gy repr sentent les angles d ouverture de la scene Nph t Npy d signent la taille de l image D autre part l acuit visuelle tant meilleure dans la zone fov ale le masque est pond r avec un poids de 1 pour le focus La zone d arriere fond est pond r e lin airement de mani re d croissante de 1 0 du centre vers les bords La figure 1 2 illustre cette distribution L espace LLAB impose que la cible soit uniforme Or la portion d image dans la zone fov ale peut contenir plusieurs objets Connaissant facilement la g om trie de la scene une segmentation est effectu e pour ne garder que les pixels appartenant a la m me face du m me objet que le pixel central cf figure 1 2 Le reste de la zone de focus est consid r comme appartenant l arriere fond 1 3 L espace colorim trique LLAB 4 e NZ ng 0 nd nd en perspective
52. obants L effet de pixelisation tr s d sagr able l il n est pas reconnu comme g nant par notre m thode Les valeurs calcul es sont en effet assez faibles image 5 La transformation num ro 8 projection gaussienne semble ne pas g ner les personnes test es Cela est plus marqu pour les poivrons Or d apr s nos calculs c est avec Lenna que cette transformation semble g n rer le moins d erreurs Le bruit al atoire image 9 d grade beaucoup la compr hension de Lenna selon les observa teurs N anmoins notre m thode nous donne une distance assez faible Cela montre que la solution n est pas encore parfaite Cependant il y a quand m me des motifs de satisfaction avec les images photographiques Les r sultats avec la quantification couleur sont corrects Quelle que soit l image la r duction en vingt couleurs est moins co teuse que celle ne gardant que huit niveaux images 2 et 3 Les calculs sur le rehaussement de contraste donnent aussi de bons r sultats Si une faible 5 3 R sultats 47 N Semblables TAB 5 6 R sultats de la premi re exp rience sur les poivrons augmentation n est pas g nante l il image 4 une forte l vation rend l image diff rente de sa r f rence aussi bien pour les observateurs que pour le calcul image 7 5 3 2 Deuxi me exp rience Les observateurs n ont pas de limite de temps En affectant des notes chaque image ils tablissent un ordre de d
53. ons de suite remarquer que le mod le n integre pas le syst me optique de l il Ce ph nom ne pourtant indispensable peut tre facilement rajout en pr traitement gr ce une convolution gaussienne par exemple 3 2 2 Fonction de sensibilit au contraste Nous avons vu en 2 4 6 que nous sommes moins sensibles aux d tails dans les zones hautes fr quences Pour chaque fr quence il y a donc un contraste seuil au dessus duquel nous ne d tectons rien La fonction utilis e est en deux dimensions ce qui permet de prendre en compte la fois les fr quences et les orientations Nous pouvons remarquer sur la courbe que la sensibilit 45 est bien inf rieure celles pour les directions horizontale ou verticale 3 2 3 M canismes de d tection partir de l plusieurs ph nom nes sont g r s Premi rement les fr quences spatiales sont rep r es Ensuite le masquage est int gr au mod le Troisi mement Daly propose luti lisation d une fonction psychom trique mod lisant la probabilit de d tection du contraste Enfin ces r sultats doivent tre combin s donnant ainsi une id e de la r ponse perceptuelle en chaque pixel 3 2 Le mod le de Daly Visual Difference Predictor 25 a F EEROR F Z E ag BEL z 4 BERIT i af F Fr fr r ee m Eu ee e PRE E Sh mm A 57 A z E z E rar A E H H F
54. plus 5 3 R sultats 49 Test 1 lt 12 4 lt 8 lt 7 lt 6 lt 19 3f lt 5 Calcul 1 lt 2 4 6 lt 5 9 lt 8 lt 3 7 TAB 5 11 Ordonnancement des images de Lenna Test 1 lt 4 lt 2 8 lt 7 lt 6 9 lt 3 5 Calcul 1 lt 2 lt 4 lt 16 01 lt 5 lt 8 lt 3 lt 7 TAB 5 12 Ordonnancement des images des poivrons diff rentes Or les distances calcul es sont assez faibles Au contraire l image 8 correspondant un plaquage de l image sur une surface gaussienne est mal interpr t e La distance calcul e est en effet beaucoup trop forte par rapport la vision de nos observateurs C est aussi le cas dans une moindre mesure de l image num ro 7 Si les premi res transformations affectent la qualit de l image les secondes ne provoquent pas de changement brusque de contraste dans l image obtenue C est notre sens la raison pour laquelle ces images semblent moins d grad es pour les observateurs Il est une fois de plus clair qu une solution mod lisant les changements de contraste est n cessaire 5 3 3 Troisi me exp rience Ce test a t effectu sur huit couples d images successifs Les trois premiers concernaient la pi ce A l image num ro 3 taient compar es les 5 6 et 7 c est dire un changement de m thode de rendu une source ponctuelle et un changement de texture Ensuite deux images de la C ornell Box l une tr s proche l autre distante devaient tre compar
55. quence spatiale dans cette direction cf figure 6 1 Sachant que nous sommes plus sensibles aux objets horizontaux 93 6 2 La dispersion des erreurs 54 et verticaux il nous suffit de pond rer le choix de l orientation des rectangles suivant cette sensibilit FIG 6 1 Choix des rectangles 6 1 3 Fonction psychom trique Le caract re al atoire de la r ponse peut tre facilement reproduit par la fonction psy chom trique Celle donn e par Graham dans 12 semble correcte P R 1 2 P 6 2 6 2 La dispersion des erreurs Nous avons vu au chapitre 5 que l image de la piece meubl e o seul changeait le tableau sur le mur tait consid r e comme tr s diff rente au contraire d autres ou des erreurs minimes affectaient toute l image Quoiqu ayant une valeur de distance proches ces sc nes ne sont pas vues de la m me fa on Dans l exemple 6 2 les deux images de distances ont la m me valeur moyenne Cependant celle de gauche devra avoir un poids plus important que l autre Notre id e est de nous inspirer de l algorithme de quantification couleur de Bouman et Orchard 25 et de son optimisation propos e par Balasubramanian et al 3 La m thode repose sur la partition binaire de l espace couleur en trois dimensions A chaque tape le but est de partitionner une zone selon la perpendiculaire a l axe de plus grande variance En r it rant nous obtenons un certain nombre de zones ou l activit
56. r lation avec les valeurs que nous calculons Keywords Distances between images Vision Vision models Quad tree Sampling Monte Carlo Abstract This document reports the work of the training period of a DEA It expounds the deve lopment of a distance between two images Besides the visual phenomena and the way to model them we study a method to compute a distance faster Our solution is based on a sampling technique First we show that a reduced number of samples is sufficient to get a good value Then we suggest the use of a quad tree to build a distance map faster than computing all the pixels Finally the results of a test procedure with some observers are shown We analyze their correlation with our distance Table des mati res Table des figures iv Liste des tableaux Vv Introduction 1 1 Travaux pr liminaires 2 Cadre d tude sa ae E AS ode eS Se Hoty Se AO BO eat ap 2 1 Champs vite sr Pis LL er 2 E 628 6 2 384465 EGA SHES A 2 1 3 L espace colorim trique LLAB 4 LA Galcul de distance 3 press do sa a r de 5 E AA 5 156 ELAB est il bien appropri T es bre d ii we ee Lee SR Ro RE Lei ue 5 1 6 1 Les espaces basiques 6 E62 L espace CIBCAMOT 3 25 2805 was ma et RL b R A Ee Sa es ee 6 OS Eepe LARD ad amp oo R ts G I RTS SSD SRE ES Re 6 2 Le syst me visuel humain 8 2a AA 9 Ded TROL LNG RE g ecu A we a E a es a 10 2 3 Transmission
57. r mental Ainsi la prise en compte de la vision humaine en synth se d images nous permettra de ne calculer que ce qui est n cessaire et notamment dans les zones fortes fr quences spatiales 6 3 Un trac de rayons incr mental k1 A N SA Dx AR gt gt N N ARS Fes SK gt Xx Se FIG 6 3 Segmentation de l image de distances 56 Conclusion La distance d finie pendant ce stage permet de conna tre avec une bonne pr cision l cart s parant deux images Lors des tests effectu s nous avons vu que nos r sultats taient en g n ral proches des diagnostics de nos observateurs En outre d un calcul qui prenait plus de trente minutes auparavant nous sommes pass s moins de dix secondes pour un r sultat quivalent Nous avons d abandonner faute de temps l laboration d un mod le de vision Cepen dant il semble clair que cela constitue la prochaine tape pour une distance encore plus pr cise Bien s r des tests compl mentaires de plus grande ampleur devront aussi tre mis en place Ce n est qu alors que le vaste domaine de la qualit des images pourra tre trait Il faut pr ciser que ce travail ajout la partie distance de la th se de Gilles Rougeron a fait l objet d un article en collaboration avec l Institut d Ing nierie de la Vision de Saint Etienne Ce papier sera pr sent au mois d octobre 1998 lors de l Inter Society Color Council
58. ransduction est la conversion de l nergie lumineuse en impulsions lectriques Si les tudes men es ont port sur les b tonnets il semble que les c nes fonctionnent de mani re similaire La perm abilit des cellules des b tonnets permet le passage des ions et provoque une excita tion lectrique sur le nerf optique L hyperpolarisation des cellules visuelles est r gie notam ment par l ion sodium Cependant ni le m canisme en jeu ni l influence d autres substances telles que l ion calcium ou le guanosine 3 5 n ont pu tre approfondis pour l instant Les physiologistes ont quand m me d fini une loi mettant en relation l intensit lumineuse et la r ponse du r cepteur cf figure 2 5 Cette loi prend la forme d une sigmolde 2 4 5 La vision des couleurs La couleur d pend de la discrimination des longueurs d ondes dans le spectre Deux facteurs permettent de qualifier une couleur le ton qui est la longueur d onde pr dominante et la saturation c est dire la quantit de cette longueur d onde par rapport la distribution spectrale Cependant il convient de faire un distinguo entre la notion de couleur physique et la perception de celle ci Ainsi certaines esp ces animales ont une vision seulement monochro matique ou dichromatique un seul ou deux types de c nes dans la r tine L homme est consid r comme trichromate La premi re th orie d velopp e par Young en 1802 puis Helmholtz sugg r
59. re la distance maximale entre deux images indiff renciables 38 9 2 Les images 39 Pour la deuxi me exp rience nous avons repris un test d j effectu l Institut d Ing nierie de la Vision de Saint Etienne Il consistait affecter des classes d quivalence Nous affichions 9 images une image trait e huit fois diff remment plus la r f rence L observateur devait alors donner des num ros aux images suivant l cart avec l image de base Celles n ayant pas de diff rences visibles recevaient la note 1 puis 2 pour les images peu distinctes etc Les observateurs avait de plus le choix de constituer autant de classes qu il le d sirait pouvant aussi s arr ter deux L encore le plus important pour nous tait de conna tre toutes les images qui recevraient la note 1 En ce qui concerne le troisi me test il s agissait de choisir entre plusieurs images de distances calcul es avec diff rents seuils figure 5 1 A partir de deux images affich es l ob FIG 5 1 Troisi me test servateur devait choisir l image de distances qui correspondait le mieux aux diff rences qu il voyait 5 2 Les images Nous avons choisi comme support deux sc nes synth tis es une pi ce meubl e et la Cornell Box et deux images classiques en traitement et analyse Lenna et les poivrons NB Les images que nous montrons ne sont l qu titre indicatif La qualit d impression n est pas suffisante pour permett
60. re une quelconque preuve La pi ce a t synth tis e gr ce au logiciel de trac de rayons YART d velopp au sein du laboratoire Chaque image comportait quelques modifications tant sur la m thode de rendu 5 2 Les images 40 que sur la g om trie de la sc ne M thode de Rendu Monte Carlo Anti aliassage VEI VEI sans 3 chaise VEI autre tableau sur le mur Terme ambiant BRDF de Schlick Terme ambiant BRDF de Schlick source ponctuelle VEI autre texture de marbre Terme ambiant BRDF de Schlick point de vue rehauss de 5cm Terme ambiant BRDF de Schlick angle de roulis de 2 oo I Oo W NHH TAB 5 1 Caract ristiques de la pi ce meubl e Pour la Cornell Box nous avons utilis le trac de rayons spectral en cours de d veloppement au laboratoire Nous avons seulement fait varier les param tres contr lant l erreur commise Enfin les images de Lenna et des poivrons ont subi les m mes traitements Traitement Image de r f rence Quantification couleur avec 20 niveaux Quantification couleur avec 8 niveaux L g re augmentation de contraste Pixelisation 3 x 3 Flou Forte augmentation de contraste Plaquage de l image sur une surface gaussienne Bruit al atoire 1 2 3 4 5 6 Y 8 9 TAB 5 2 Caract ristiques des images photographiques 9 2 Les images 41 FIC 5 2 Pi ce meubl e 9 2 Les images 42 FIG 5 3 Cornell Box
61. rnal of IEEE 93 429 457 1946 A Gaddipatti R Machiraju and R Yagel Steering image generation with wavelet based perceptual metric Eurographics 97 16 3 241 251 1997 A Glassner Principles of digital image synthesis Morgan Kaufmann publishers inc San Francisco California 1995 N Graham Visual pattern Analyzers Oxford University Press New York 1989 R Hunt Evaluation of a model of colour vision by magnitude scalings discussion of collected results Color Research and Applications 19 27 33 1994 R Hunt An improved predictor of colourfulness in a model of colour vision Color Research and Applications 19 23 26 1994 Lubin J A visual discrimination model for imaging system design and evaluation Vision Models for Target Detection and Recognition pages 245 283 1995 58 Bibliographie 59 16 17 18 19 R Luo The llab model for colour appearance and colour difference evaluation volume 2658 pages 261 269 SPIE 1996 R Luo and R Hunt The structure of the cie 1997 colour appearance model ciecam97s Color Research and Applications 23 3 138 146 June 1998 J L Maillot Pseudo r alisme et progressivit pour le trac de rayons PhD thesis Ecole Nationale Sup rieure des Mines de Saint Etienne 1996 J Mannos and D Sakrison The effects of a visual fidelity criterion on the encoding of images In IEEE Transactions on Information Theory volume IT 20 pages 525 536
62. rrespondant aux diff rentes sensibilit s fr quentielles et angulaires 3 2 Le mod le de Daly Visual Difference Predictor Quoique destin e pr dire la qualit des images l approche propos e par Daly est assez diff rente Elle s appuit sur la physiologie mais n est pas optimis e en temps De plus le calcul se fait sur l image affich e C est dire en fonction d une certaine distance l cran Ce mod le galement s quentiel est structur en trois tapes figure 3 3 1 la non lin arit de la r ponse 2 l utilisation d une fonction de sensibilit au contraste CSF pour d tecter les fr quences spatiales et les orientations 3 la prise en compte des m canismes masquage et fonction psychom trique 3 2 Le mod le de Daly Visual Difference Predictor 24 Non linearity Detection CSF 2D Amplitude Mechanisms FIG 3 3 Le modele de Daly 3 2 1 Amplitude non lin aire On ne travaille qu en luminosit Daly propose de mod liser la r ponse r tinienne par l quation suivante R T L Rmax L amp 12 6L 8 0 3 8 R Rmax est la r ponse normalis e en fonction de la luminosit L Cette phase simulant la transduction visuelle est assez approximative Daly ne donne pas de justifications quant la valeur des constantes La fonction sigmoide utilis e dans le mod le de Sarnoff est plus proche des r sultats obtenus par Bader dans 2 D autre part nous pouv
63. s Cependant il semble que le changement brusque de contraste provoqu par la source ponc tuelle image 6 soit moins d tect En quatre secondes la personne n a pas le temps de voir cela Nous verrons pour le prochain test cf 5 3 2 que ce d faut est bien diagnostiqu lorsque l observateur dispose du temps n cessaire Pour l image 1 les diff rences occasionn es avec la num ro 2 proviennent essentiellement de l anti aliassage Tout en restant voisine elle comporte quand m me de l g res diff rences Nous disons qu elle est proche de l cart maximal entre deux images semblables Cornell Box Les images spectrales dont les seules variations portent sur la couleur sont bien diagnos tiqu es La num ro 3 dont la distance est tr s grande est largement class e comme diff rente 5 3 R sultats 46 Semblables 75 20 5 O NO OR OY NHFH TAB 5 4 R sultats de la premi re exp rience sur la Cornell Box Nous pouvons noter que 5 semble tre encore le seuil de d tection image 2 Remarquons aussi une anomalie pour l image 4 certains observateurs ont vu des diff rences alors qu il n y en avait pas Nous pensons que ceux ci tant pr venus que chaque image tait g n r e diff remment ont cherch forcer leur r ponse Images photographiques Semblables 5 5 90 TAB 5 5 R sultats de la premi re exp rience sur Lenna Les r sultats sur les images non synth tis es sont moins pr
64. se le d faut de cellules photo r ceptrices par rapport a la fovea Notons enfin que la zone ou merge le nerf optique s appelle la t che aveugle Elle ne contient aucune cellules photo r ceptrices Outre une organisation spatiale la r tine poss de aussi plusieurs couches La couche externe est compos e de cellules photo sensibles les b tonnets et les c nes Ces photo r cepteurs re oivent l information optique par l interm diaire de pigments visuels et doivent la transmettre au cerveau par influx nerveux figure 2 3 gr ce plusieurs types de cellules Les cellules bipolaires d abord font le lien entre les photo r cepteurs et les cellules gan glionnaires I en existe deux types Les petites sont associ es aux c nes et les grosses aux b tonnets Les cellules horizontales et amacrines elles sont charg es de propager l informa tion lat ralement Enfin l impulsion visuelle est propag e via les cellules ganglionnaires en contact avec les fibres du nerf optique TNT cone receptor rod receptor Hi x lt I O v o gt midget a bipolar 2 e 6 a 2 gt E I 3 5 a 5 3 5 n on I II TT FIG 2 3 Sch ma d une section de r tine Il faut noter qu il existe trois types de c nes S M et L pour short medium et long 2 3 Transmission de l information au cerveau 11 wavelength Leurs sensibilit s maximales sont respectivement de 420nm 530nm et 560nm
65. spatiale est pratiquement constante En rempla ant l espace couleur par notre carte de distances nous pensons obtenir ainsi une segmentation de notre image 6 3 Un trac de rayons incr mental 55 FIG 6 2 Diff rences suivant la r partition des erreurs Il convient maintenant d analyser chaque zone L influence qu une surface aura dans la distance r sultante d pend de sa valeur moyenne son aire son longation les zones circulaires sont plus pr pond rantes que les zones allong es peut tre sa position nous avons vu en 5 3 3 figure 5 7 que le placement des objets pouvait influer peut tre aussi l orientation Nous ne savons pas l heure actuelle comment ces facteurs doivent tre pond r s entre eux mais chaque zone devrait tre affect e un coefficient La r union de ceux ci pourrait nous permettre de calculer une valeur globale cf figure 6 3 L optimisation de Balasubramanian tait de travailler non pas sur l espace couleur mais sur l histogramme de chaque composante Nous avons des valeurs de distances r elles mais il serait int ressant de faire une premi re discr tisation en ne gardant que deux ou trois chiffres significatifs pour obtenir un histogramme des distances et y appliquer la m thode 6 3 Un trac de rayons incr mental L objectif final du calcul d une distance entre images est de l int grer dans un algorithme de trac de rayons inc
66. tats sont en FIG 3 9 Le mod le de Watson suite compar s et somm s Remarquons l absence de pr traitement par un filtre passe bas simulant le syst me op tique de l il La premi re tape du mod le consiste r cup rer les informations fr quentielles suivant la fonction de sensibilit au contraste CSF combin e une transformation de Gabor 9 11 Cette op ration est un cas particulier de la transform e de Fourier fen tr e aussi appel e Short Time Fourier Transform Celle ci peut s crire CT a n t g t te Stat 3 19 La plupart du temps la fonction g est de la forme g t il t t1 to 3 20a 0 sinon 3 20b On a alors bien la transform e de Fourier r duite l intervalle t1 t2 Lorsque g est une fonction gaussienne sur t t2 on appelle X transformation de Gabor Il est ainsi possible de conna tre les fr quences localement dans l image Ensuite les auteurs construisent une pyramide la taille de chaque niveau n tant divis e par un facteur 2 Comme avec la pyramide laplacienne du mod le de Sarnoff cf 3 1 cette op ration permet d obtenir les composantes fr quentielles de l image Le signal est divis en deux parties inhibitrice et excitatrice Chacune suit une fonction non lin aire de la forme x Diff rentes valeurs de p sont admises Les auteurs se conforment au mod le de Teo et Heeger 30 31 o p est gal 2 De plus le signal in
67. tion comme l inverse de la fonction CSF 1 2 CSF eo Si le contraste est inf rieur a ce seuil on consid re que le syst me visuel ne d tecte rien ou tout au plus une forme grise peu pr cise Au contraire si le contraste est sup rieur la zone de l image est consid r e comme significative Mais ce n est pas une alternative binaire La transition se fait progressivement La probabilit de d tection varie donc en fonction de l cart du contraste calcul avec le seuil Lorsque la distance est gale a 1 la probabilit vaut 75 C est le r le de la fonction psychom trique La figure 2 10 montre un exemple La forme sigmoide est une bonne simulation du ph nom ne Remarquons aussi la progression lin aire pour des valeurs proches du seuil 2 4 Les ph nom nes importants de la vision 0 8 0 6 0 4 0 2 0 0 02040608 1 1 2 1 4 1 6 1 8 2 FIG 2 10 Fonction psychom trique 18 Chapitre 3 Les mod les de vision La mod lisation des ph nom nes r gissant notre vision est un domaine capital en imagerie num rique En effet les temps de calcul en synth se d images sont tr s longs Il serait alors utile d avoir un outil permettant de ne calculer que ce que l il est capable de voir Les tudes sur la qualit des images ont tout autant besoin de ces mod les Comment savoir si un r sultat est pertinent si l algorithme d analyse ne prend pas en compte les m canismes du syst me visuel hu
68. ure de la table sans anti aliassage source ponctuelle texture de la table TAB 4 5 Transitivit caract ristiques des images Nous remarquons que l absence d anti aliassage produit une distance 0 72 entre nos deux images De meme la pr sence d une source ponctuelle entre les images 2 et 3 induit une distance de 0 54 La distance entre les images 1 et 3 est de 1 20 Et 0 72 0 54 1 26 1 20 Le m me ph nom ne se produit si on modifie la texture de la table 1 36 1 20 0 17 0 72 0 54 0 17 Bien s r cela ne prouve rien Il semble cependant que les modifications de la sc ne se r percutent transitivement dans le calcul de la distance 4 3 Une pseudo distance AVAN Git BUga a ALE TADEN Hral ar EN AE uty s il E a is 7 RSR AT a AA V ER NE CARS R P FT peon Ers A OA HEN LUE ie g KA HE Fou FIG 4 4 Points effectivement calcul s Chapitre 5 Exp rimentation Apr s avoir d fini les bases d une distance entre images il nous est apparu indispensable de mettre en place une proc dure de test pour conna tre la robustesse de notre mod le d une part et pour nous permettre d valuer les constantes que nous utilisons d autre part Pour cela nous avons fait appel des observateurs neutres au sein de l cole Sur un total de vingt personnes il y avait dix sp cialistes en synth se d images Les dix autres personnes n avaient pas de con

Download Pdf Manuals

image

Related Search

Related Contents

Mikrotik R52NM  REFRESCANTE DE ALIENTO  Sony VAIO VGN-CS31S/P  PT Manual de Instruções PPF 650  取扱説明書 取付・設置説明書  Embedded System Platform Solutions  V2.01 - Milesight  MyCalls Installation Manual  CR RC 8 juin 2010 - Rive Gauche Ouest  Bedienungsanleitung  

Copyright © All rights reserved.
Failed to retrieve file