Home

Création de vidéos avec ffmpeg

image

Contents

1. ENSICAEN 6 bd mar chal Juin F 14050 Caen cedex 4 Sp cialit Informatique 1 ann e Rapport de mini projet Cr ation de vid os avec ffmpeg Griffon lt griffon ecole ensicaen fr gt Blanchard lt blanchar ecole ensicaen fr gt Elouarti lt ouarti ecole ensicaen fr gt d T Suivi ENSICAEN JEHAN BESSON St phanie 2 semestre 2005 2006 2 semestre 2005 2006 Table des mati res TOGO AS Re a A 5 L Inroducuon Sur IS EOPMATS VID O a en a 6 EME DATES CO D S den sn ne 6 OPA SA Ode a ee a te 7 NT Re ne tt se Ge die 7 Sko LES ormas MPEC ESS Se Nain 8 72 ODA AN a a cb Nan de nt at 9 2 Quelques fonctionnalit s de ffmpeg et ffdshow 10 2 11 Pr sentation de TANPeS sine a a aaa ARAE Oa fente en 10 22 UUHSAUON de MPE T io ka e aA te Ni 10 2 2 1 Conversion de fichiers vid o et audio 10 2 2 2 Combinaison entre fichiers audio et fichiers vid o 10 2 2 3 Cr ation de vid os partir d un ensemble d images 11 2 3 Quelques options disponibles d MPE eninin nn EE 11 2 4 Pr sentation de ffdshow et des fonctionnalit s disponibles 12 3 Notre programme de g n ration de mouvement de cam ra ffcam nnnnn000000000000000e1ee00ns 16 Se re NOE eT A E E ATE 16 PELO DECC HI Sn a a a cn 16 kS muc reS CEAD SCE CE aae E on taan 17 3 13 Manue ka utilisation SR A E EO EONA 19 32 Description des algonthmieS sieui neni a te 21 3 2 1 Trois mouv
2. vous pouvez appeler le programme ffcam avec les param tres souhait s Voici la syntaxe Jffcam image ppm move txt fps bitrate video image ppm est le nom du fichier image source move txt le nom du fichier contenant les instructions de mouvement de camera fps le nombre d images par seconde bitrate le taux de compression de la video et enfin video le nom de la vid o cr e Cr ation d un fichier de vecteurs mouvement Il existe en fait deux types de fichiers de vecteurs compatibles avec ffcam Le premier permet d effectuer des mouvements quelconques association d une translation d une rotation et d un zoom Le second type de fichier se limite au simple mouvement de translation mais 1l permet un calcul plus rapide de la vid o et peut tre g n r automatiquement avec l outil Tgenerator cf annexe 4 4 partir d une image o est dessin e la trajectoire suivre Fichier de type 1 mouvements complexes La premi re ligne est compos e de quatre entiers s par s par un espace Les deux premiers entiers ne sont pas utilis s Les deux suivant correspondent la r solution de la vid o longueur puis hauteur en pixels La seconde ligne comprends la lettre m qui signifie que le fichier est de type 1 mouvements complexes puis du nombre de mouvements de la s quence Dans l exemple on effectue quatre mouvements avant d en rajouter un cinqui me dans une deuxi me s quence Il est noter que la s paration
3. la diversit des formats vid o en tudiant les plus r pandus AVI MPEG YUV et en constatant leurs diff rences Nous avons par la suite tudi les fonctionnalit s les plus importantes de ffmpeg et ffdshow en constatant les facilit s qu ils apportent dans la manipulation de fichiers vid o tels que ceux que nous avons pu cr er avec notre programme ffcam Ce dernier bien qu effectif peut encore tre optimis dans son temps d ex cution en allouant une image dans un tableau unique ce qui permettra par la suite une recopie plus rapide gr ce memcpy 26 R f rences bibliographiques 1 http ffmpeg mplayerhq hu documentation sur ffmpeg 2 Cours d analyse vid o de St phanie Jehan Besson 3 http fr wikipedia org wik MPEG description de la compression mpeg 4 http fr wikipedia org wik RGB description de l espace couleur RGB 5 http fr wikipedia org wikr teinte saturation lumi re espace HSL 21 Annexes le code source Annexe 1 listing ffcam Script shell Tgenerator Script shell include lt rep gt ppm h Fichier d en t te mouvement h Fichier d en t te Scr lt rep gt Makefile Makefile ppm c Fichier source c mouvement c Fichier source c ffe c Fichier source c Tgenerator c Fichier source c 28
4. peut tre d crit avec un nombre limit de param tres vecteurs de mouvement des pixels La meilleure pr diction d un pixel est donn e par la pr diction de mouvement de la trame pr c dente Bien que soit la pr diction de l erreur que les vecteurs de mouvement sont transmis le codage de l information de mouvement pour chaque pixel de l image n est pas n cessaire Si la corr lation spatiale entre vecteurs de mouvement est assez haute un vecteur de mouvement pourra repr senter un bloc de pixels adjacents Ces blocs sont souvent constitu s d un groupe de 16x16 pixels comme lors de la compression jpeg et seulement un vecteur de mouvement est estim cod et transmis pour chaque bloc Ces vecteurs peuvent tre visionn s gr ce des logiciels tels que ffdshow 1 3 Format raw RAW de l anglais raw qui signifie brut est un format d images num riques Ce n est pas un standard mais plut t une d signation commune pour les fichiers g n r s par les dispositifs tels qu appare ls photos num riques ou scanners et n ayant subi aucun traitement Ces fichiers sont g n ralement sp cifiques chaque constructeur d appareil voire chaque appareil et n cessitent donc un logiciel sp cial pour pouvoir les exploiter Un fichier au format RAW est un fichier num rique peu compress qui contient les informations brutes enregistr es par le capteur de l appareil photo Ce fichier est en quelque sorte en attente de d vel
5. tre utilis es approximation qui donnera sans doute au final une image ayant des pixels qui n auront re u aucune valeur Il est possible gr ce des m thodes d interpolation de palier ces probl mes Cependant ces algorithmes sont assez complexes et peuvent amener des r sultats mitig s Nous avons donc opt pour une solution moins complexe et donnant malgr tout des r sultats tr s corrects En effet nous poss dons la base une image de taille importante mais o la cam ra ne se focalise que sur une partie r duite L astuce sera donc d appliquer la formule inverse sur une matrice de pixel n ayant pour taille que la partie r duite de l image Pour chaque pixel de cette matrice on cherchera la valeur d un pixel de la grande image qui doit lui tre attribu e L avantage de cette technique est d obtenir une matrice laquelle chaque pixel a re u une valeur s1 le mouvement d borde de l image le pixel sera noir De plus cette technique est moins gourmande puisqu elle ne n cessite pas de traitement par interpolation Voici donc la formule qui est appliqu e eur mal x fa h 2 sinad cost L y Ey dl Cependant appliquer cette formule directement ne donne pas le r sultat escompt car 1c1 le point fixe est l origine de l image en haut gauche Il faut donc avant d effectuer ces op rations translater ce point fixe 21 L op ration se fait en deux tapes l X M
6. 3 22050 Hz ffmpeg 1 test wav ar 22050 out mp3 2 2 2Combinaison entre fichiers audio et fichiers vid o Sur le m me mod le que la conversion de fichier il est possible de fusionner un fichier audio et un fichier vid o pour cr er une vid o avec une piste sonore ffmpeg 1 son wav 1 video yuv out mpg A l inverse on peut aussi extraire le flux audio d un fichier video ffmpeg 1i test avi out mp3 2 2 3 Cr ation de vid os partir d un ensemble d images Il est galement possible de g n rer une vid o partir d un ensemble d images Les images sont diffus es l une apr s l autre suivant le framerate souhait option r avec une compression fix e option b Puis on donne les fichiers sources et le fichier de sortie ffmpeg r 24 b 1800 1 502d bmp out mpg Dans l exemple ci dessus l encha nement est de 24 images par seconde avec un taux de compression 1800 Kbits par seconde Les images sources choisies sont successivement 00 bmp 01 bmp 02 bmp selon le nombre d images existantes 2 3 Quelques options disponibles de ffmpeg Sa Voir la licence ch Voir l aide formats Voir les formats codecs et protocoles disponibles i nomFichier Fichier d entr e V Ecrasement du fichier de sortie title chaineDeCaracteres Definir le titre de la vid o author chaineDeCaracteres D finir le nom de l auteur copyright chaimeDeCaracteres D finir le copyright comment chamne
7. DeCaracteres Inclure des commentaires target type Sp cifier le format du fichier sortant b bitrate Sp cifier le taux de compression en kb s par d faut 200 kb s r fps Sp cifier le nombre d images par seconde par d faut 25 S size Sp cifier la resolution de la vid o Le format est Largeurxhauteur par d faut 160x128 Les abbreviations suivantes sont reconnues sacif 128x96 qcif 176x144 cif 352x288 4cif 704x576 aspect aspect D finir l aspect 4 3 16 9 ou 1 3333 1 7777 maxrate bitrate Sp cifier la tol rance maximale du taux de compression en kbit s minrate bitrate Sp cifier la tol rance minimale du taux de compression en kbit s 2 4 Pr sentation de ffdshow et des fonctionnalit s disponibles ffdshow est un puissant pack de codecs permettant sous Windows de d coder et encoder des fichiers audio et vid os dans les formats les plus r pandus Pour cela ffdshow utilise des biblioth ques de ffmpeg De plus ffdshow propose un nombre consid rable d options pour sa version r cente Apr s installation ffdshow se lance automatiquement et simultan ment au lecteur par exemple Windows Media Player lors de l ouverture d une vid o Un ic ne appara t alors dans la zone de notification de la barre des taches et permet d acc der la configuration et aux options de ffdshow On peut ainsi modifier les param tres vid o ou bien audio galiseur
8. L yd l 1 i x z F z 3 F Pour la translation zoom 1 i X i X z Ja a pag 2 2 F7 E sn 0 cos F7 l l gt tn Pour la rotation Dans ces formules h repr sente la hauteur de l image voulue et 1 la largeur en pixel 3 2 2 Mouvement de translation optimis L algorithme r sultant des formules pr c dentes est assez rapide car 1l ne d pend que du nombre de pixels de l image cr er et du temps de calcul d un cosinus et d un sinus Mais il faut par la suite appeler la fonction criture qui elle aussi est en O n Vu que la fonction ecriture de la biblioth que libppm permet de sauvegarder un morceau de l image quelconque elle peut tre utilis e pour simuler un effet de translation En effet il suffit de l appeler en boucle en ne changeant que les coordonn es du pixel d origine comme l illustre ce sch ma ecriture color en boucle Cette astuce permet d conomiser l appel des fonctions de mouvement lorsqu elles ne sont pas n cessaires pour une translation simple 22 3 3 Exemples d utilisations et comparaison des performances 3 3 1 Exemple de mouvements complexes Prenons une image ayant une r solution de 1141x631 pixels Nous allons effectuer un mouvement combinant translation zoom et rotation sur un cadre de 200x200 pixels au centre du village Les param tres pass s dans le fichier de vecteur sont 10 10 1 1 05 et sont
9. convolution filtrage mais dans le cadre de notre projet seul le traitement de l image nous int resse Les fonctionnalit s de ffdshows sont les suivantes _ Choix pour chaque format vid o d utiliser ffdshow ou non et de choisir la biblioth que utiliser pour d coder si plusieurs g rent ce format _ Affichage d informations incrust es dans la vid o lue On peut par exemple conna tre les propri t s des images dur e num ro taille la dur e de la vid o ou le temps d j coul le nom de la source le d bit le codec utilis pour la lecture ou encore l espace couleur de la sortie Les options suivantes permettent quant elles de modifier l apparence de la vid o Certaines d entre elles peuvent s appliquer l image enti re ou seulement sa moiti droite pour comparer le r sultat du traitement l image d origine _ Zoom et recadrage pour les vid os dont les bords sont alt r s ou pour donner un aspect 16 9 une vid o 4 3 dont les parties inf rieures et sup rieures ne sont pas int ressantes voir _ D sentrelacement par une douzaine de m thodes diff rentes _ Filtrage _ Post traitement _ R glage du contraste de la luminosit de la teinte de la saturation correction gamma _ Niveaux _ Flou et r duction du bruit _ Accentuation effet de nettet mais assez peu d tectable _ Profondeur de chant donne l image un effet n peinture l huile _ Ajout de b
10. de translation mais aussi sur un axe perpendiculaire ce plan effet de zoom sur l image et enfin la cam ra peut effectuer une rotation autour de cet axe L utilisation du programme se doit d tre assez simple L utilisateur param tre le mouvement qu il souhaite appliquer l image et le programme g re lui m me la g n ration de la vid o Uz Cas FFCA Parametrer k Les inaude mn Utilisateur L Genereer vigen Created wih Poseidon for JML Community Edition Motfor Commercial Use 3 1 2 Structures et arborescence Une biblioth que dynamique de gestion de ppm a t g n r e car elle pourra tre utilis e ult rieurement par d autres programmes cf Tgenerator en annexe 4 4 Elle permet de charger une image ppm dans une structure image bw ou image color selon le type de fichier et aussi de sauvegarder une partie de l image charg e dans un nouveau fichier Voici les diff rents types de structure utilis s dans le programme cf annexe 4 2 Diagram me de stnictures inage bw magic int Size int 1 pixelMaxint readH eadert rint nitiname chart j woid ecrture_bwname chat pimage Flim age bscint cit iint hint F ir age Ke alloue_bwipimage Plm age ki woid reeBwipimage Fim age Es void rint image color magic int int size int 0 1 Ecint pixelMaxint LoS readH eadert rint nitiname chart i void ecrture_coloriname cha
11. de la vid o en s quences n a aucune influence sur le rendu final mais permet juste de s parer les diff rentes phases du mouvement lorsqu on regarde ce fichier texte Les quatre lignes suivantes sont donc les quatre mouvements qui composent la s quence Ils sont crits dans l ordre de leur r alisation et sont compos s de quatre param tres s par s par un espace Les deux premiers param tres sont le vecteur de translation d compos suivant les axes x et y l origine d une image est le coin sup rieur gauche Lors du premier mouvement ces deux valeurs indiquent les coordonn es de d part de la vid o Viennent ensuite l angle de rotation entier en degr et le facteur de zoom r el Exemple 1 0 0 320 240 m 4 100 50 0 1 2401 o 0 10 1 0 O O0 1 2 m 1 2 4 10 0 83 Remarque Si la cam ra sort en partie ou totalement de l image elle verra un fond noir Fichier de type 2 translations seules La premi re ligne est compos e de quatre entiers s par s par un espace Les deux premiers entiers indiquent les coordonn es de d part Les deux suivants correspondent la r solution de la vid o longueur puis hauteur en pixels La seconde ligne comprend la lettre t qui signifie que le fichier est de type 2 translations seules puis du nombre de translations de la s quence Dans l exemple on en effectue quatre avant d en rajouter un cinqui me dans une deuxi me s quence Les quatre lignes suivantes sont d
12. eaucoup plus rapide L cart grandissant en m me temps que le nombre de sollicitations des fonctions il doit donc y avoir au moins un degr de complexit de diff rence entre les deux algorithmes 3 4 Visualisation des r sultats avec ffdshow En appliquant la fonctionnalit de visualisation de vecteurs de mouvement de ffdshow on v rifie la nature du mouvement effectu Translation Sur une translation en diagonale vers le bas les vecteurs sont tous de direction semblable celle de le diagonale et dirig s dans le sens inverse du mouvement ce qui est le mouvement naturel des blocs de pixels auquel on aurait pu penser au pr alable Rotation Rotation de la cam ra dans le sens horaire les vecteurs sont dirig s dans le sens oppos du mouvement RTE Due IS a i Dee ee e niet L EUNTTER SE on p ra i i ALl E H i Er A Fa a si Fa FA Fa ha r 4 Fa Fa Fy ri T r Fa i A Pai o r i 4 LI I r RL wp ET r LE d mi Er Zoom Enfin pour un zoom d amplitude 0 95 s loignant de l image les vecteurs sont tous dirig s vers le centre de l image Au final notre programme coupl ffdshow met en vidence la pertinence de la compression mpeg La plupart des blocs de pixels r sultant de la compression jpeg tant conserv s d une image une autre 1l est donc int ressant de ne stocker que leur d placement dans l image 25 Conclusion Nous avons donc vu
13. el qui permettant la navigation dans une image en utilisant une fonctionnalit de ffmpeg Celui ci pourra permettre lavalidation des outils d estimation de mouvements d velopp s au laboratoire de recherche GREYC 1 Introduction sur les formats vid o 1 1 Espaces couleur La couleur tel que nous l entendons peut se repr senter selon deux crit res simples La chromaticit c est dire la teinte globale de la couleur L intensit lumineuse la quantit de lumi re contenue dans la couleur c est l aspect clair ou fonc Lorsque l on repr sente une image en couleur on souhaite conserver ces deux informations tandis que pour une image en noir et blanc ou en niveaux de gris on ne garde que l intensit lumineuse Avant tout 1l faut choisir un mod le de repr sentation en voici trois exemples Le syst me RGB Red Green Blue Le syst me RGB est le codage le plus simple et le plus r pandu Il s appuie sur la synth se additive adapt e pour la repr sentation sur l cran Chaque couleur est repr sent e par son niveau de rouge de vert et de bleu Synth se additive des couleurs Le mod le HSL Hue Saturation Luminance Le mod le HSL s appuie sur une mod lisation plus naturelle de la couleur et plus proche de la perception de l oeil humain C est une alternative au mod le RGB qui ne facilite pas toujours le choix de la couleur On d compose ainsi la couleur en trois cri
14. ements combin s Translation Rotation Zoom eseesesesessessessersersse 21 3 2 2 Mouvement de translation optimis ossseeeeensssssssseeessesssssssteresssssssrrerressssssererees 22 3 3 Exemples d utilisations et comparaison des performances sssesennssssssseeeeenssssssseeree 23 3 3 L Exemple de MOUVEMENTS complexes Lan cn die tie 23 7 9 2 Exe mpe d ranla OD anna nn ancre te cet anti 24 3 3 9 COMPA sondes D TIOPIMANCES nn Rd de Le su 24 3 4 Visualisation des r sultats avec ffdshow nnnnnnnnnnnnsssssssseeeeeereeeennsnssssssssssssseerrrreesees 25 C ODC HSI ON er ee ec be ini cd tion 26 R I EENCES DIDHOSTAPHIQUES un RE Re Li dan ide il di 27 Annexes l cod SOUTCE 32 0 IR ee an venons tetes 28 Introduction Il existe de nos jours de nombreux formats vid o propri taires ou libres Aux vues de leur diversit 1l est int ressant de disposer d outils tels que ffmpeg et ffdshow capables manipuler analyser et convertir ces vid os assez simplement FFmpeg est un logiciel open source permettant de convertir rapidement des fichiers vid o et audio qui est sans cesse en volution ce qui lui permet de reconna tre les formats les plus r cents FFdshow permet quand lui d analyser de mani re plus efficace les videos en tudiant leur flux de donn es Dans de nombreux domaines tels que les trucages au cin ma on a parfois besoin de naviguer dans les images Nous avons ainsi labor un logici
15. er Y U et V partir des composantes R G et B Y 0 299 0 587 0 114 R UJ 0 147 0 289 0436 G V 0 615 0 515 0 100 E 1 2 Formats vid o 1 2 1 Le format AVI L Audio Vid o Interleave audio vid o entrelac e dont l acronyme est AVD est un format de fichier con u pour stocker des donn es audio et vid o AVI utilise un m me paquet standard afin d tre lu simultan ment Ce paquet standard est un format de fichier permettant de rassembler en un seul fichier e un ou des flux vid o e un ou des flux audio e d autres donn es par exemple o descriptions des flux que contient le conteneur o des m ta donn es auteur date etc o des sous titres o chapitrages Les flux audio et vid o sont compress s ou d compress s l aide de codecs Les principaux conteneurs vid o sont e NUT e OGM plus volu s e Matroska plus volu s e AVI e Quick time e ASF Dans un fichier AVI chaque composante audio ou vid o peut tre compress par n importe quel codecs Le format DivX est souvent utilis comme codecs vid o et le format mp3 comme codecs audio mais d autres codecs peuvent galement tre utilis s par exemple XviD ou MPEG pour la vid o et mp2 WAV etc pour l audio Le format AVI permet de r unir en un seul fichier une piste vid o et jusqu 99 pistes audio ce qui permet de b n ficier par exemple de plusieurs langues pour un m me film 1 2 2 Les formats MPEG Les r u
16. l mentation DivX ainsi que dans les t l phones mobiles La partie 10 appel e MPEG 4 AVC permet des gains d un facteur 2 3 par rapport MPEG 2 et a d j t retenu comme le successeur de celui ci pour la TV haute d finition la TV sur ADSL et la TNT H 264 ou MPEG 4 AVC est une norme de codage vid o qui permet de cr er une nouvelle architecture de codecs ayant pour but un gain en efficacit de codage d un rapport au moins gal 2 par rapport aux standards existants MPEG 2 H 263 et MPEG 4 Part 2 Cette norme permet le codage de vid o avec images progressives et entrelac es ventuellement combin es dans une m me s quence Elle permet aussi de cr er une interface simple pour pouvoir adapter le codec aux diff rents protocoles de transport commutation de paquets et de circuits Le codec a t d velopp en s assurant qu il serait impl mentable sur plate forme un co t raisonnable c est dire en tenant compte des progr s r alis s par l industrie des semi conducteurs en mati re de design et le proc d s La pr diction compens e de mouvement La pr diction compens e de mouvement est un puissant moyen pour r duire les redondances temporelles entre trames et elle est utilis e dans MPEG I et MPEG 2 Le concept de la compensation du mouvement est bas sur l estimation du mouvement entre trames vid o si tous les l ments d une sc ne vid o sont proches dans l espace le mouvement entre trames
17. nions du Moving Picture Experts Group ont d marr en 1988 dans le but de d velopper un premier standard MPEG 1 pour des applications de stockage audio vid o du type Vid o CD MPEG a ensuite rapidement produit un second standard MPEG 2 visant essentiellement les applications li es la t l vision num rique D autres familles de standards ont depuis t produites MPEG a d velopp les standards suivants e MPEG I leur premier standard audio et vid o utilis plus tard comme standard des Vid o CDS Ce format offre une r solution l cran de 352 x 240 pixels 30 images par seconde ou de 352 x 288 25 images par seconde avec un d bit d environ 1 5 Mbit s Il inclut le populaire format audio MPEG 1 Layer 3 MP3 e MPEG 2 standard couvrant le codage de l audio et la vid o ainsi que leur transport pour la t l vision num rique et avec quelques restrictions pour les vid o disques DVD ou SVCD C est notamment le format utilis jusqu pr sent pour la TV sur ADSL Les d bits habituels sont de 2 6 Mbit s pour la r solution standard SD et de 15 20 Mbit s pour la haute r solution HD e MPEG 4 norme comblant le vide des bas d bits jusqu 2 Mbit s pour lesquels MPEG 2 n avait pas t d velopp Il permet entre autres de coder des objets vid o audio le contenu 3D et supporte le DRM La partie 2 de MPEG 4 Visuel est compatible avec la partie baseline de H 263 et a connu du succ s gr ce l imp
18. onc les quatre translations Les deux param tres sont les coordonn es du vecteur de translation suivant les axes x et y l origine d une image est le coin sup rieur gauche Exemple 2 100 50 320 240 t5 11 2 2 2 2 t1 2 4 Remarque Avec ce type la vid o est g n r e plus rapidement mais si la cam ra sort en partie de l image le programme est interrompu et la vid o s arr te cet instant 20 3 2 Description des algorithmes 3 2 1 Trois mouvements combin s Translation Rotation Zoom Lorsque l on veut appliquer une matrice de pixels divers mouvements sur ses valeurs on applique g n ralement la formule qui suit X 50 0 us aP fad Le y anial cos Lir Ey Le vecteur x y repr sente les coordonn es du point consid r dans l image de base et xp yp les coordonn es du point correspondant x y dans l image ayant subit l op ration Le vecteur tx ty est un vecteur de translation le scalaire effectue une homoth tie sur le vecteur d origine et donc un effet de zoom enfin la matrice en cosinus et sinus est une matrice de rotation d angle 6 Notre programme aurait pu ainsi appliquer cette formule chaque pixel de la matrice d origine pour ensuite prendre la partie d image qui nous int resse Cependant cette m thode poss de quelques inconv nients car les coordonn es de pixels obtenues ne sont plus enti res et n cessitent donc une approximation pour pouvoir
19. oppement dans la mesure o il n a subi aucun des traitements de lin arisation contraste luminosit ou saturation n cessaires pour produire une image lisible Comme le format mpeg le format raw usuel utilis en vid o se base sur l espace couleur YUV 2 Quelques fonctionnalit s de ffmpeg 2 1 Pr sentation de ffmpeg FFmpeg est un logiciel open source qui peut enregistrer lire ou convertir un flux num rique audio ou vid o Il est d velopp sous Linux mais il peut tre compil sur la plupart des syst mes d exploitation notamment windows Le projet ffmpeg est h berg par SourceForge ffmpeg sourceforge net Il tait t l chargeable sous Linux gr ce CVS et maintenant avec SVN 2 1 Utilisation de ffmpeg 2 2 1 Conversion de fichiers vid o et audio FFmeg permet de convertir les formats de fichiers vid o et audio Il d code et encode un tr s grand nombre de formats On retrouve notamment les formats vid os avi les diff rents mpeg Quicktime ou YUV les formats audio wav et mp3 mais aussi des formats d image comme ppm jpeg ou gif La commande pour convertir est intuitive L option 1 permet de sp cifier le fichier source Cet exemple convertit un avi en mpg ffmpeg 1 test avi out mpg Il est galement possible de g n rer de la m me mani re des gif anim s non compress s partir d une vid o ffmpeg 1 test avi out gif De m me pour les fichiers audio ici un wav est convertit en mp
20. r p t s 24 fois pour ainsi obtenir une vid o d une seconde 24img s Il y aura ainsi 24 translations de vecteur 10 10 combin es avec une rotation d 1 degr et un zoom d amplitude 1 05 La vid o obtenue s apparente ceci 23 3 3 2 Exemple de translation Appelons la fonction de translation optimis e sur cette image ESSA REAN LELE pp AUREERRMERLRME Mantes b D ae 5 ka n s y cn gt z a a a MEEA P aM _ M zie Gwuygdinnmoller dk H i se _ 5 Encha nons 3 translations de vecteur 20 20 sur un cadre de l image de 200x200 pixels situ aux coordonn es 200 200 le r sultat obtenu est F MP Le a mia i DE me 7 jp su 3 3 3 Comparaison des performances Nous avons inclus dans le code la possibilit de mesurer le temps d ex cution du programme Nous allons donc tester celui ci avec un mouvement de translation en faisant appel aux deux fonctions possibles Pour effectuer 264 translations sur une image de 200x200pixels Le programme classique a mis 4 43 secondes pour g n rer les images Le programme de g n ration de translations am lior a mis 1 8 secondes Pour effectuer 408 translations sur une image de 200x200pixels Le programme classique a mis 6 83 secondes pour g n rer les images Le programme de g n ration de translations am lior a mis 2 79 secondes 24 On s aper oit donc bien que le programme optimis est b
21. ruit grain tremblement spatial tremblement d intensit ajout de poussi res de rayures _ Redimensionnement pour corriger les vid os dont le ratio d origine n est pas respect _ Correction des perspectives _ Gestion des sous titres affichage correction orthographique peu de langues disponible non test modification de la police et de la couleur _ Affichage des vecteurs de mouvement cf galement partie 3 a Pour mouvement proche d une translation 14 _ Filtrage DCT _ ajout d une image fixe par plusieurs m thode assombrissement clairsissement m lange clusion ajout _ Capture d image une seule ou une s quence en jpg bmp ou png _ R glage de sortie retournement vertical de l image choix de l espace couleur par d faut ffdshow choisit automatiquement pour chaque vid o l espace couleur qui semble le mieux adapt Ffdshow permet donc de visionner un grand nombre de vid os de formats diff rents mais permet aussi de modifier l aspect des vid os pour corriger les imperfections ou appliquer des effets particuliers travers un important panel d options 15 3 Notre programme de g n ration de mouvement de cam ra ffcam 3 1 Structure du projet 3 1 1 Objectifs L objectif du programme est de g n rer des mouvements de cam ra partir d une grande image de base au format ppm Les mouvements de cam ra peuvent se faire dans les plans de l image mouvement
22. t res physiologiques La teinte Elle correspond a la perception chromatique de la couleur On peut la repr senter par un cercle chromatique allant du rouge au violet On passe ainsi par toutes les nuances interm diaires orange jaune vert bleu La saturation Elle se rapporte l intensit ou puret de la couleur La saturation permet de distinguer les couleurs vives pastels ou d lav es Augmenter la saturation consiste rajouter un pourcentage de gris dans la couleur La luminosit Elle indique la quantit de lumi re de la couleur la luminosit indique si une couleur est sombre ou claire En augmentant la luminosit on se rapproche du blanc en la diminuant on se rapproche du noir Luminance Luminance Saturation Teinte Repr sentation du mod le HSL Le mod le YUV Le mod le YUV d finit un espace colorim trique en trois composantes Le premier repr sente la luminance et les deux autres repr sentent la chrominance YUV est utilis dans les syst mes de diffusion t l visuelle et il est consid r comme tant le mod le qui se rapproche beaucoup plus de la perception humaine des couleurs que le standard RGB utilis dans l imagerie informatique Dans le traitement des signaux vid o couleur on ajuste les coefficients des signaux U et V de telle sorte que la valeur cr te cr te soit gale la valeur maximale de Y soit 0 7 V Cette relation peut tre utilis e pour d riv
23. t pimage Plim age _ color intinti int hinti Pr age _ color alloue_colortpimage F Irm age color void feeColonmpimadge Flm age _colort void x int Hs init theta foat Hambda int L initialisation d une image passera par l allocation de m moire n cessaire pour stocker les donn es dans tab pixel Elle se fait ainsi size 0 size 1 E7 Les fonctions ecriture bw et ecriture color permettent de sauvegarder une partie de l image cf annexe 4 2 nn nyLena ppm lena ppm Le fichier mouvement c contient les fonctions qui permettent de manipuler l image afin de simuler un mouvement de cam ra Nous expliquerons les algorithmes utilis s dans ces fonctions par la suite Le fichier central est ffc c il lit les param tres du mouvement simuler dans un fichier texte pass en argument et appelle en boucle les fonctions de mouvement c afin de cr er une suite d images qui en appelant ffmpeg donneront la vid o d sir e Un script ffcam permet de coordonner l appel du programme final ffc et celui de ffmpeg L organisation des fichiers est donc Oraanisation des fichiers fi QUy trn Et Fi QU tr Er Created with Poseidon for UML community dition Not for Commercial Use 18 3 1 3 Manuel d utilisation Installation Copiez le contenu de l archive sur votre disque Puis dans le dossier ffcam src tapez la commande make install Utilisation Dans le dossier ffcam

Download Pdf Manuals

image

Related Search

Related Contents

Sony Xperia U 8GB Black    Classe de seconde - ecole du cinema et de la video  Fiche-produit  NEC LCD8205 LCD User Manual  GP160 • GP200  REFLOW OVEN FT01  Samsung 180T Manual de Usuario  PA 250 PA 250  EC-F2 Gas Sensor - Honeywell Analytics  

Copyright © All rights reserved.
Failed to retrieve file