Home
ici - C4 project
Contents
1. C4 Project Cahier des charges Project Ald ric Coroir coroir_ a Julien Freche freche_ j Romain Riedinger riding_r Benoit Zanotti zanott_ b Team Forty Two C4 Project 1 Introduction Ce document a pour vocation de poser les bases et d tablir les besoins objectifs et contraintes de notre projet de deuxi me semestre Apr s avoir in troduit le sujet nous pr senterons notre projet puis nous d taillerons chaque partie et nous terminerons par la r partition des t ches et le planning de r al isation Cadre Le projet sera r alis par un groupe de quatre personnes il s tendra sur environ cinq mois Le sujet est libre mais il doit cependant tre valid par nos professeurs Trois soutenances jalonneront l avanc e de celui ci Le sujet Le sujet tant laiss libre nous avons choisis de r aliser un logiciel de re connaissance optique de caract re souvent appel s OCR pour Optical Carac ter Recognition ces logiciels sont capables partir d une image typiquement un document scann d en extraire le texte et de le convertir dans un format de fichier ditable Restrictions Ce projet sera d velopp sous Linux principalement sur Ubuntu 10 10 et Fedora 13 il sera cod en Objective Caml et en C Il fonctionnera donc sur les deux syst mes pr c dents et donc sur les machines du PIE celui ci devrait cependant marcher correctement sur la plupart des distributions Linux int grant
2. a soutenance finale le groupe fournira en plus des l ments pr c dents un dossier d exploitation compor tant un manuel d installation et d utilisation le projet en lui m me avec ses sources et les biblioth ques utilis es ainsi qu une proc dure d installa tion d sinstallation Team Forty Two C4 Project 3 D coupage du projet Notre projet sera d coup de la mani re suivante 1 Le pr traitement de l image 2 Le r seau de neurones 3 L apprentissage du r seau de neurone 4 L interface graphique 3 1 Pr traitement de l image Dans cette partie il s agit d abord de pr parer l image afin qu elle soit exploitable En premier lieu il convient d appliquer lissage afin d viter tous les bruits qui pourraient venir contrarier la reconnaissance des caract res Il faut cependant faire attention ne pas enlever certains bouts de caract res comme l accent sur le le point sur le i par exemple Ensuite il convient de convertir l image en noir et blanc ou du moins d augmenter le contraste afin de faire ressortir de la mani re la plus nette possible la diff rence entre les caract res et le fond de l image Par la suite il est peut tre n cessaire de recadrer l image voir de la redresser afin de mieux cibler la zone de texte dans laquelle il va falloir extraire les caract res Enfin une fois la zone de texte correctement d tect e est mise en vidence il faut d te
3. cter les lignes afin de les prendre une par une puis d couper ces lignes en mots pour finalement d couper tous les mots en caract res Les caract res seront alors transmis un par un au r seau de neurone Cette partie sera cod e en C Team Forty Two C4 Project 3 2 R seau de neurones Parmi les trois m thodes de reconnaissance cit s plus haut nous avons fait le choix de la m thode par classification par caract ristiques Features Cette m thode fait donc appel un r seau de neurone Les neurones dits formels sont en fait une repr sentation simplifi e des neu rones biologiques Ces r seaux de neurones formels simples peuvent th orique ment r aliser des fonctions logiques arithm tiques et symboliques complexes Le neurone formel est con u comme un automate dot d une fonction de transfert qui transforme ses entr es en sortie selon des r gles pr cises Ces neurones sont par ailleurs associ s en r seaux dont la topologie des connex ions est variable r seaux proactifs r currents etc Enfin l efficacit de la transmission des signaux d un neurone l autre peut varier on parle de poids synaptique et ces poids peuvent tre modul s par des r gles d ap prentissage Cette partie sera donc certainement cod e en Objective Caml afin de pou voir d finir un neurone comme un objet FIGURE 3 1 Sch ma simplifi d un r seau de neurone Team Forty Two C4 Project 3 3 Ap
4. e situation La plupart des OCR op rent de la fa on suivante pr analyse de l image segmentation en lignes caract res reconnaissance post traitement correction de mots etc et enfin conversion en format texte La reconnaissance peut se faire de trois mani res 1 Par classification par caract ristiques Features faisant appel un r seau de neurones 2 Par m thodes m triques on calcule la distance entre deux lettres 3 Par m thodes statistiques on utilise les cha nes de Markov Les logiciels les plus performants sont capable de d tecter directement la police utilis e et ainsi d viter la phase d apprentissage si ce n est pas le cas il faut d abord fournir au logiciel les lettres utilis es par la police qui doit tre reconnue Parmi les logiciels les plus populaires on trouve aujourd hui GOCR Unix Windows OCRopus Unix et Tesseract Unix Windows qui sont tous les trois libres Et d autres logiciels propri taires comme Adobe Acrobat Professional Windows Mac OS ExactScan Mac OS OCRkit Mac OS et Scansoft Omnipage Windows R gles impos es Le projet devra r pondre au r gles en vigueur sur le code PEPITA D autre part sera fournit chaque soutenance un plan de soutenance com portant le d roulement pr vu de la soutenance un rapport de soutenance d une vingtaine de pages pour les deux premi res soutenances et de 50 pages la soutenance finale et un site web A l
5. elle doit permettre tout d abord l utilisateur de s lectionner un fichier image avec le texte reconna tre Elle sera divis e en deux parties une partie avec l image de base et les ventuels traitements qu elle subit et une seconde partie contenant le texte ditable reconnu dans une text box L interface permettra galement de choisir les diverses options de traite ment et proposera l utilisateur d enregistrer le r sultat de la reconnaissance dans un fichier Il sera bien s r possible de choisir une nouvelle image tout moment afin de recommencer le traitement L utilisateur n aura au final pas besoin d utiliser la console pour tirer pleinement parti du logiciel Une aide pourra galement tre affich e via l interface Cette partie sera cod e en C Team Forty Two C4 Project 3 5 site Web et Rapport Le site web contiendra une page d accueil avec diff rents liens vers Une pr sentation du projet historique probl mes rencontr es Une pr sentation des membres Une page de t l chargement du projet et du rapport Les liens utiles au projet biblioth ques documentation Une page de contact Les rapports de soutenance et le rapport de projet seront tous crit avec LateX 3 6 Bonus De nombreux bonus sont envisageables si jamais l quipe termine ses ob jectifs en avance notamment Un post traitement du texte comparaison avec un dictionnaire de mo
6. enfin restitue l utilisateur le texte reconnu dans un format ditable L tat de l art La premi re machine d OCR fut cr e par Gustav Tauschek un ing nieur allemand en 1929 Elle contenait un d tecteur photosensible qui pointait une lumi re sur un mot lorsqu il correspondait un gabarit contenu dans sa m moire Par la suite David Shepard avec l aide de son ami Harvey Cook d cid rent sous la demande de Frank Rowlett de construire une machine permettant la conversion de messages imprim s en langage machine pour le traitement informatique Cette machine f t baptis Gizmo Shepard fonda alors Intelligent Machines Research Corporation IMR qui livra les premiers syst mes d OCR au monde exploit s par des soci t s priv es Elle fournit les premi res machines d OCR Reader s Digest en 1955 puis l Ohio Bell Telephone Company et PUS Air Force Depuis les OCR sont assez r pandu et sont beaucoup utilis notamment par les syst mes postaux de nombreux pays afin de reconna tre automatiquement une adresse et de trier le courrier Team Forty Two C4 Project Jusqu une date r cente le fonctionnement des syst mes d OCR perfor mants tait peu connu car prot g par le secret industriel les logiciels open source disponibles ex GOcr tant plut t l uvre d amateurs La publi cation en open source de syst mes performants en particulier Tesseract en 2006 a quelque peu chang cett
7. les paquets Ocaml et C n cessaires Protocole Ce projet doit tre r alis par groupe de quatre personnes dont un chef de projet qui servira entre autre d interlocuteur avec le jury pendant les soutenances Les groupes sont form s librement Il est tout d abord demand de fournir un cahier des charges afin qu il soit valid Team Forty Two C4 Project Soutenances Notre projet sera valu lors de trois soutenances par un jury compos de deux de nos professeurs Les deux premi res soutenances auront une dur e de 15 minutes la derni re aura une dur e plus longue Lors de ces soutenances nous pr senterons clairement les avanc es de notre projet par rapport au cahier des charges Team Forty Two C4 Project 2 Nature et but du projet Introduction Notre projet sera un OCR de l anglais Optical Character Recognition si vous poss dez un scanner vous pouvez num riser un document dactylo graphi et le logiciel se chargera de vous fournir un document texte ditable Ainsi l utilisateur a la possibilit de convertir ses documents papiers au for mat num rique afin de les archiver ou de les diter et de pouvoir les r imprimer Principe Le principe est simple l utilisateur fournit un document num ris au format A4 contenant du texte dactylographi Le logiciel analyse l image corrige les ventuels imperfections rep re les zones de texte proc de une reconnaissance des caract res et
8. prentissage du r seau de neurone Ce r seau de neurones formels va nous permettre d op rer rapidement des classifications et d apprendre les am liorer Les param tres importants de ce mod le sont les coefficients synaptiques et le seuil de chaque neurone et la fa on de les ajuster Ce sont eux qui d terminent l volution du r seau en fonction de ses informations d entr e Il faut choisir un m canisme permettant de les calculer et de les faire converger si possible vers une valeur assurant une classification aussi proche que possible de l optimale C est ce qu on appelle la phase d apprentissage du r seau Dans un mod le de r seaux de neurones formels apprendre revient donc d terminer les coefficients synaptiques les plus adapt s Il est alors question de fournir au r seau des mod les consid r s comme parfaits des caract res Ces mod les vont donc varier en fonction de la police reconna tre Cette police devra donc tre sp cifi e par l utilisateur afin que le r seau de neurone puisse apprendre sur un mod le pr d fini et qu il puisse proc der la reconnaissance dans de bonnes conditions Le principe est simple on pr sente une image parfaite d un caract re au r seau en lui pr cisant quel est ce caract re celui ci commence alors les classifier Cette partie sera cod e en C et ou Ocaml suivant les besoins 3 4 Interface Graphique L interface se veut claire et fonctionnelle
9. ra ventuellement r adapt e si un des mem bres du groupe finit sa partie plus vite que pr vu Il pourra ainsi aider les autres Si tous les objectifs sont r alis s en avance la r partition des t ches pourra tre revu afin d y int grer des bonus Il est important de noter que les rapports de soutenance et le rapport de projet sont r alis s par tous les membres du groupe la t che est cependant assign Julien car il r alisera la structure du document Latex et fusionnera le texte de tous les membres du groupe 11
10. ts connus Une reconnaissance de l criture manuscrite Un apprentissage automatique en d tectant la police automatiquement La possibilit de fusionner plusieurs images de texte afin de fournir un seul document La prise en charge de format texte enrichi pour l enregistrement du texte Nous aurons s rement d autres id es au cours du projet si nous avons les moyens de les r aliser et quelles nous semblent plus int ressantes que celles ci nous les ajouterons au projet de nous m me Team Forty Two C4 Project 4 Calendrier des soutenances Voici la r partition des t ches en fonction des membres du groupe et de la soutenance L gende Ebauche Avanc Termin Premi re Soutenance Ald ric Julien Romain Benoit Pr traitement de l image R seau de neurones Apprentissage Interface graphique Site Web Rapport Deuxi me Soutenance Ald ric Julien Romain Benoit Pr traitement de l image R seau de neurones Apprentissage Interface graphique Site Web Rapport Soutenance Finale Ald ric Julien Romain Benoit Pr traitement de l image R seau de neurones Apprentissage Interface graphique Site Web Rapport 10 Team Forty Two C4 Project Cette r partition des t ches se
Download Pdf Manuals
Related Search
Related Contents
User Guide Manual del usuario T40/T40m EXTER - Beijer Electronics AirLive Powerline Network Configuration Utility Features Manual Questo In Win BP659 Télécharger la notice Analog Product Family Hardware Installation Manual 製品事故(A2,B1,B2) 石油機器 Whiteness Perborato Danfoss TLX User Manual ML L00410310 Copyright © All rights reserved.
Failed to retrieve file