Home

développements méthodologiques et détermination du mécanisme

image

Contents

1. docking py AtomSet Docking Atom Vector d Vector AtomList Info Info concat rot append cut copy center 7 rdPDB WK l origin visualPDB DT rot visualXYZ en updateCoords Hue quaternion copy controlDistance getCharge Fic 3 1 Diagramme UML simplifi du module docking py 58 3 Interface ALGOGEN DIVCON La classe Atom repr sente la structure d un atome Un objet instanci de cette classe poss de un attribut Vector qui est son vecteur position sous la forme d un quaternion imaginaire pur et un attribut Info sous la forme d un dictionnaire o sont stock es toutes les autres informations relatives la description de cet atome l ment masse type num ro de r sidu II poss de galement les fonctions rot pour effectuer une rotation et copy pour obtenir une copie de l atome La classe AtomSet repr sente un syst me d atomes Il est structur comme tant une liste d atomes At omList et poss de deux autres attributs qui sont Vector le vecteur position du centre g om trique sous la forme d un quaternion imaginaire pur et Info un dictionnaire o sont stock es les informations relatives la description du syst me d atomes Plusieurs fonctions sont disponibles pour chacun des objets instanci s de cette classe e append ajoute un nouvel atome dans le syst me e center calcule le centre g om trique
2. 22 1 2 1 Mod lisation du syst me prot ine ligand et d finition du score 23 1 2 2 Algorithme de recherche 25 1 3 Motivations pour le d veloppement d un nouveau programme 25 1 4 Objectifs cahier des charges du nouveau programme 27 2 D veloppement d un algorithme g n tique de minimisation 29 2 1 M thodes de minimisation et atouts des algorithmes g n tiques 30 2 2 Principe des algorithmes g n tiques 31 2 2 1 D finition et principe g n ral 32 2 2 2 Exemple de minimisation 34 2 3 Programmation de l algorithme g n tique 39 2 8 1 Structure du code 39 2 3 2 Codage des g nes 42 2 33 Elei er t ES IC hn det D DT RE UR wr da 44 2 9 4 Reproduction zx suos Ros xk UR AO Bo dee AN Ne Er D EU 45 2 3 5 Strat gie d volution 49 2 3 6 Population initiale 50 2 3 7 Evaluation i m 2o o om Room moo md AL E e nm men 51 244 GONCIUSION es orean ee boe i Re ee hs RAR A deas RR RU ese Bs 53 3 Interface ALGoGEN DIVCON 55 3 1 Pr sentation g n rale 56 3 2 Structure du COJE xi s eme bow ew ee Roto oS ghost ee od d a es E Re 57 3 2
3. 7 2 1 Mod le dusiteactif c 7 2 2 M thodologie 7 2 8 Chemin de r action 7 3 Dynamique mol culaire du substrat activ 7 3 1 Simulation de la forme proton e duDMSO 7 3 2 Simulation de l interm diaire sulfurane dans le site actif FAs GONCIUSIONS 1 SAR e eee MARNE MEN EN Ee nra eda 65 66 70 74 78 80 82 85 87 88 89 91 93 95 96 98 99 102 108 108 108 109 109 114 117 118 119 126 126 129 132 135 135 141 148 155 Table des mati res 8 R duction du substrat 8 1 M canisme Transfert d un groupement OH 8 1 1 Hypoth se de travail 8 1 2 Chemin de r action dans un syst me isol 8 1 3 Chemin de r action dans un environnement enzymatique mod le 8 2 M canisme Il 1H 16 8 2 1 Hypoth se de travail 8 2 2 Propri t s redox des esp ces impliqu es 8 2 3 Transfert d lectron dans l environnement enzymatique 8 3 M canisme Ill 2 H 267 8 3 1 Hypoth se de travail 8 3 2 Chemin de r action dans un environnement enzymatique mod le 8 4 Devenir du substrat m thionine r duit 8 5 GonclusioBlS ieu eed bo
4. Aromatiques Hydrophobe Diagramme de Venn des propri t s physico chimiques des acides amin s Table des figures l 1 Sch ma du bilan nerg tique d une catalyse enzymatique 15 2 1 Analogie entre volution biologique naturelle et algorithme g n tique 32 2 2 Processus de minimisation dans les algorithmes g n tiques 33 2 3 Fonction f x x minimiser d finie dans l intervalle entier 0 931 osx moth E x EE 34 2 4 Sch ma de la s lection de type roulette wheel 36 2 5 Diagramme UML simplifi du module genetic py 40 2 6 Sch ma de fonctionnement de la s lection par tournois 45 3 1 Diagramme UML simplifi du module docking py 57 3 2 Diagramme UML de s quence des proc dures du programme ALGOGEN DIVCON 61 4 1 Evolution de l nergie d interaction du dim re de l eau en fonction de la m thode semi empirique utilis e EE v v Bee e Een UR RO HY Xov wa YO Yo e wow Bois does 68 4 2 Structures optimis es dudimeredel eau 69 4 3 Catalyse enzymatique d oxydation de l acide urique enallantoine 70 4 4 Structure de l urate oxydase d Aspergillus flavus 72 4 5 Structures chimiques de la 8 azaxanthine de l acide oxonique et de l acide urique 73 4 6 Structure du complexe UOX
5. 266 Est Fonctions 32202359 A ed a dene Oe bod a SS 266 3 2 RIES x ua uu Run Uum OR E EME E ds e e a 266 Attributs de divcon 544 29 eu as Rok xS wo se ae a 267 264 C Manuel utilisateur d ALGOGEN DIVCON C 1 Exemple de script de docking Le script Python suivant est un exemple de script de lancement du logiciel ALGOGEN DIVCON correspondant au docking du dianion urate dans le site actif de l urate oxydase Les diff rentes com mandes et options sont pr sent es ensuite Import des modules import math import docking from genetic import ga options parameters from divcon import divcon d j Initialisation f f2 2 2 2 2 2 4 Definition des repertoires de travail et de scratch wrkDir II scrDir auto juliet7 thiriot scratch URATE THEHHHE if not len wrkDir wrkDir os getcwd Tf not lens crDin E scrDir wrkDir ee d Creation du systeme Proteine Ligand re d Identifiant Docking title UOX URA PM3 2 Taille de la boite de docking boxSize 12 Residus Site actif dies c9 A E215 E IMA 3951 PDB de la proteine protPDB uox pdb PDB du ligand ligPDB urate pdb Charge du ligand ligChrg lt 2 THEE Lecture de la PDB de la proteine prot docking rdPDB s s wrkDir protPDB Centre sur le site actif prot center actSite Decoupe des residus prot docking cut prot prot Vector boxSize math sqrt 75
6. 5 2 4 Structure tridimensionnelle des m thionine sulfoxyde r ductases 5 3 Etudes ant rieures sur l tape reductase de MsrA 5 3 1 Caract risation cin tique a 5 3 2 Identification des r sidus impliqu s 5 3 8 Etat de protonation des r sidus du site actif 5 3 4 Travaux th oriques sur la r duction d un sulfoxyde par un thiol 5 4 Objectifs et approche m thodologique Reconnaissance et ancrage du substrat 6 1 Etat de protonation du site actif 6 2 Simulations protocole op ratoire 6 3 Enzyme DIG amp 4 opo ooo ORE vo SORS RUE PP pa EE SUE de 6 3 1 Etat de protonation CysH GIU 6 3 2 Etat de protonation CysH GluH 6 3 3 Etat de protonation Cys GluH 6 4 Complexe enzyme substrat sulfoxyde 6 4 1 Etat de protonation CysH Glu 6 4 2 Etat de protonation CysH GluH 6 4 8 Etat de protonation Cys GluH 0 5 CONnCIUSIONS ie EG ee Rey XXe OS a oe cw Xo Goes YR LORS E Rees Activation du substrat 7 1 R duction des sulfoxydes g n ralit s 7 2 M canisme de transfert de proton
7. 104 5 Rappels bibliographiques et objectifs Cys51 As CH b FIG 5 9 Structure tridimensionnelle de la MsrA d E coli a Architecture globale de l enzyme Les structures secondaires ont t color es en violet pour les h lices 0 en jaune pour les feuillets B et en bleu clair pour les coudes B La cyst ine catalytique Cysc a t repr sent e en b tons ainsi que les cyst ines de recyclage Cysg de l extr mit C terminale b Structure du site actif Ce site actif est compos des r sidus conserv s Phe52 Trp53 Tyr82 Glu94 et Tyr134 L adduit dim thylars niate cristallographique As CH pr sent sur la Cysc51 a t repr sent atome d arsenic en vert La position de celui ci ainsi que la mol cule d eau en interaction avec les r sidus du site actif mime la position du substrat MetSO Les diff rentes interactions possibles entre r sidus ont t symbolis es en marron 5 2 M thionine sulfoxyde r ductases 105 Le site actif est organis autour de Cysc51 situ e l extr mit N terminale d une h lice o Les r sidus qui l entourent tous conserv s dans l alignement de s quences des MsrA forment une large poche ouverte qui offre une grande accessibilit vers Cysc adapt e la r duction de sub strats enfouis au sein de prot ines oxyd es Il pr sente une grande quantit de cha nes lat rales aromatiques Phe52 Trp53 Tyr82 Tyr134 Tyr197 ce qui lui conf re un caract re partielleme
8. Dapprich S Kom romi l Byun K S Morokuma K et Frisch M J J Mol Struct THEOCHEM 462 1 21 1999 Vreven T et Morokuma K J Comput Chem 21 1419 1432 2000 Warshel A et Levitt M J Mol Biol 103 227 249 1976 Field M J Bash P A et Karplus M J Comput Chem 11 700 733 1990 280 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 BIBLIOGRAPHIE Monard G Loos M Th ry V Baka K et Rivail J L Int J Quant Chem 58 153 159 1996 Antonczak S Monard G Ruiz L pez M F et Rivail J L J Am Chem Soc 120 8825 8833 1998 Ferr N Assfeld X et Rivail J L J Comput Chem 23 610 624 2002 Monard G Prat Resina X Gonz lez Lafont A et Lluch J M nt J Quant Chem 93 229 244 2003 Amara P et Field M J Theor Chem Acc 109 43 52 2003 Martins Costa M T C et Ruiz L pez M F Chem Phys 332 341 347 2007 Yang W et Lee T S J Chem Phys 103 5674 5678 1995 Stewart J J P Int J Quant Chem 58 133 146 1996 Li X P Nunes R W et Vanderbilt D Phys Hev B 47 10891 10894 1993 Rosen E D O Donnell A L et Koenig R J Mol Cell Endocrinol 78 C83 C88 1991 Roberts M R Curr Opin Plant Biol 3 400 405 2000 Pawson T et Nash P Genes Dev 14 1
9. L 5 M H 9 CE 1347 DH 2000 d y e S5 rs Ay LS T S H0 DMSO A5 amp 2302 PE L S 7 8 AE 7 8 S c TSs e AE 0 0 AE 132 ce AE 133 yd i i 2 o en 2093 ww ey uy eq St e 744 KI i Y ds amp M ed nie n Kach amp FIG 5 12 Chemin r actionnel de la r duction du DMSO par le m thanethiol dissociation de l interm diaire sulfurane Les g om tries sont optimis es au niveau B3LYP 6 311G d p et les nergies calcul es au niveau MP2 6 311 G 3d2f 2df 2p Le terme AE inclut l nergie libre lectrostatique de solvatation dans le continuum di lectrique relativement au syst me 1 CH3SH Les valeurs donn es sont en et kcal mol Tir de Balta et al 256 y tO WW 6 9 eh S i KI ng i H M DET 0 H g 3557 oO T 0 280 g ei v 6 AS Q H 0 2 LS TS6_10 AE 0 9 E Le SSS 10 AE 0 0 a 0 994 S oy l WE eu d Se t Cu P 2661 DL oe s e A 21318 e pe HS 11 AE 3 1 12 es 1 827 1827 e FIG 5 13 Chemin r actionnel de la r duction du DMSO par le m thanethiol formation de l acide sulf nique Les g om tries sont optimis es au niveau B3LYP 6 31 1G d p et les nergies calcul es au niveau MP2 6 31 14 G 3d2f 2df 2p Le terme AE inclut l nergie libre lectrostatique de solvatation dans le continuum di lectrique relativement au syst me 1 CH3SH Les valeurs donn es sont en et kcal mol Tir de Bal
10. e la cr ation des fichiers de log et de visualisation e l ex cution du docking 3 2 Structure du code 57 3 2 Structure du code Le programme ALGOGEN DIVCON se compose de plusieurs modules Python aussi appel s scripts dont nous faisons la liste e genetic py algorithme g n tique de minimisation e docking py outils de construction des syst mes mol culaires et de d finition de la fonction de score de docking e quaternion py outils de manipulation des syst mes mol culaires e divcon py interface du programme DIVCON Cette conception en structure modulaire est un avantage de ce programme Les diff rentes fonctions sont s par es dans des modules diff rents genet ic py pour l algorithme de recherche conforma tionnelle minimisation docking py et quaternion py pour la gestion du syst me prot ine ligand et divcon py pour le calcul de l nergie potentielle de ce syst me Il en r sulte une certaine flexi bilit d utilisation et de d veloppement ult rieur Il est possible de remplacer chaque module fonc tionnel par un autre de m me type Par exemple le calcul de l nergie du syst me prot ine ligand peut tre effectu par un autre programme au choix de l utilisateur condition d en crire l interface ad quate 3 2 1 Module docking py Ce module Python d environ 1000 lignes contient trois classes d objet La figure 3 1 pr sente le diagramme UML simplifi de ce module
11. l utilisation de la suite logicielle AMBER Ce protocole consiste utiliser les param tres du champ de forces gaff 9 General Amber Force Field pour les atomes de type inconnu Les charges de ces atomes sont obtenues par le biais d un calcul du potentiel lectrostatique Pour cela la g om trie du compos est optimis e par un calcul quantique programme GAUSSIANO3 9 au niveau de th orie HF 6 31G Les charges issues du potentiel lectrostatique sont ensuite recalcul es par rapport une contrainte donn e programme RESP 4265 Uaiout d une contrainte sur les charges atomiques permet par exemple de fixer la 6 2 Simulations protocole op ratoire 121 valeur de la charge d un atome ou d obtenir la m me valeur pour des atomes quivalents Nous avons utilis un script Perl nomm RED 11 68 pour faciliter les traitements de donn es entre les programmes La nomenclature utilis e pour d signer les atomes du substrat DMSO est indiqu e dans la figure 6 1 TN B Fic 6 1 Nomenclature des atomes du substrat DMSO Les atomes sont color s en cyan pour le carbone en blanc pour l hydrog ne en bleu pour l azote en rouge pour l oxyg ne et en jaune pour le soufre Les param tres de champ de forces du substrat DMSO sont regroup s dans le tableau 6 3 Nous avons utilis le type s4 du champ de forces gaff pour d crire l atome de soufre Ce type repr sente un atome de soufre trivalent Lors du calcul RESP nous avons
12. parameters MutationPartNumber int Valeur par d faut 1 248 B Manuel utilisateur d ALGOGEN MutationProbability Probabilit de mutation e R el d finissant la probabilit de mutation Cette valeur doit tre comprise entre O et 1 parameters MutationProbability float Valeur par d faut 02 MutationMaxNumber Nombre maximal de mutations par partition e Entier d finissant le nombre maximal de mutations effectuer sur chaque partition parameters MutationMaxNumber int Valeur par d faut 1 InversionProbability Probabilit d inversion e R el d finissant la probabilit d inversion Cette valeur doit tre comprise entre O et 1 parameters InversionProbability float Valeur par d faut 01 PopulationSize Taille de la population e Entier d finissant la taille de la population construire lors de la reproduction parameters PopulationSize int Valeur par d faut 32 B 2 3 S lection ElitismRatio Taux d litisme e R el d finissant la fraction conserv e des meilleurs individus de la population parameters ElitismRatio float Valeur par d faut 5 TournamentNumber Nombre de tournois e Entier d finissant le nombre de tournois cr er lors de la s lection par tournois i e le nombre d individus s lectionn s au final parameters TournamentNumber int Valeur par d faut 8 B 2 4 Options de minimisation Initia
13. 340 00 233 80 448 70 Distance d quilibre 1 090 1 807 1 497 Angle H1 CT H1 s4 CT H1 CT s4 O CT s4 CT Constante de force kcal mol deg 35 000 42 900 65 600 62 100 Angle d quilibre deg 109 50 108 66 106 21 96 82 Angle di dre H1 CT s4 O H1 CT s4 CT Constante de force kcal mol 0 200 0 200 Phase rad 0 00 0 00 P riode 3 3 TAB 6 3 Param tres du champ de force du substrat DMSO types charges masses param tres de Lennard Jones potentiels de liaison d angle de valence et d angle di dre en fonction du type de l atome Cx repr sente Cy et Cp Hx repr sente Ha Ha Has He Hg2 et Hgs de la Msr La structure est compos e de 3 cha nes de 211 r sidus Certains r sidus des cha nes B et C n ont pu tre localis s lors de la diffraction Une superposition des 3 cha nes ne montre aucune diff rence au niveau structural Nous choisissons la cha ne A pour effectuer les diff rentes simulations de dynamique mol culaire Avant le d marrage des simulations nous enlevons de cette structure les mol cules d eau et les anions sulfates qui sont pr sents Le r sidu CAS est transform en cyst ine Le cas ch ant nous positionnons le substrat dans le site actif de telle sorte qu il se confonde avec le r sidu CAS i e l oxy g ne et les groupements m thyles sont aux m mes positions respectives Nous identifions l tat de protonation des r sidus ionisables tels que His Lys etc en effectuant une analyse PROPK
14. Exemple D finition de la fonction constraint pour contraindre un g ne de tous les individus de la population exprimer une seule et m me valeur fix e contrainte apr s reproduction et calculer la moyenne des valuations apr s la phase d valuation def constraint if ga EvaluationFlag False for individual in ga Population individual Chromosome recode l1 100 else 258 B Manuel utilisateur d ALGOGEN sum 0 for value in ga Population Evaluations sum value import sys sys stdout write 15 3f sum len ga Population Evaluations Remarque Nous rappelons que cette fonction de contr le sera appel e par le programme apr s l tape de reproduction individus en attente d valuation et apr s l tape d valuation indivi dus valu s Pour distinguer les op rations effectuer par cette fonction nous utilisons donc la propri t EvaluationFlag qui indique l tat de la population vis vis de l valuation B 4 4 D finition de la fonction de contr le de reproduction La fonction de contr le de reproduction ReproductionControl permet la suppression d in dividus produits pendant la phase de reproduction avant la phase d valuation Exemple D finition de la fonction cont rolRoot qui permet de supprimer les individus repr senta tifs de yY x 1 def controlRoot individual x y z individual Chromosome decode import math as meu eeng RUE ap D S ap quA em Ji retur
15. Lecture de la PDB du ligand ligand docking rdPDB s 5 wrkDir ligPDBR Creation de la boite cubique de docking box boxSize 3 T Configuration DivCon Methode semi empirique divcon Method PM3 C 1 Exemple de script de docking Charge totale du systeme divcon Charge getCharge prot ligChrg 7 Parametres Divide amp Conquer diven Eltere Mi Ms 2 Configuration Algorithme genetique dan Parametres des genes parameters GeneSize parameters Ranges 10 10 10 B 9 Sl Lafe O72 dexess DIAS Mer iI exe IA Boxq21029 bostes qe Meth pil Dol rnb DUI 2 meth os Parametres de selection parameters ElitismRatio 1 parameters TournamentNumber 16 Parametres de reproduction parameters CrossoverProbability parameters CrossoverMaxNumber 1 parameters CrossoverPartNumber 1 parameters MutationProbability SE parameters MutationMaxNumber 1 parameters MutationPartNumber 1 parameters InversionProbability 0 parameters PopulationSize 32 ls Options de l algorithme g n tique options Initzalization UOX URACPMS TI bEp options MaxGenerations 50 options Unicity True options OutputPrint docking printing options OutputFile s s out wrkDir title options Gray False options BackupFile s s bkp wrkDir title options BackupFrequency 1 options Strategy ga un
16. foxyde Nous allons tudier ensuite comment ce processus peut avoir lieu dans le site actif de MsrA 7 2 M canisme de transfert de proton Le seul r sidu ayant a priori des propri t s acido basiques et ayant un proton facilement mobili sable proximit du substrat est le r sidu Glu94 Nous avons donc fait l hypoth se d un transfert de 160 7 Activation du substrat proton partir de ce r sidu pour arriver au sulfoxyde proton Le r sidu Cys51 reste sous une forme Cys Nous allons valuer pr sent l aspect nerg tique de ce processus Pour cela nous allons choisir un mod le du site actif et nous allons analyser le m canisme de la r action l aide des outils de la chimie quantique 7 2 1 Mod le du site actif Le mod le de site actif que nous avons utilis est constitu des r sidus susceptibles d avoir une importance dans le m canisme catalytique soit par leur participation directe soit par leur contribution essentielle la stablisation du syst me chimique Nous nous sommes repos sur les observations des simulations de dynamique mol culaire pour tablir la liste des r sidus n cessaires e Cys51 cyst ine catalytique repr sent e par une mol cule de m thanethiol e Glu94 donneur de proton et de liaison hydrog ne repr sent par une mol cule d acide ac tique Tyr134 donneur de liaison hydrog ne repr sent par une mol cule de ph nol Tyr82 donneur de liaison hydrog
17. la jonction de deux monom res Lys10 Thr57 Asp58 Phe159 Arg176 Val227 Gin228 et Asn254 Last risque indique une localisation des r sidus sur le deuxi me monom re Deux mol cules d eau W1 et W2 ont aussi t d termin es proximit de ces r sidus Elles joueraient un r le important dans le m canisme catalytique La structure de l enzyme avec l inhibiteur 8 azaxanthine connue sous le code PDB 2IBA nous informe des prin cipales interactions qu il se forme entre ces r sidus du site actif et le ligand La figure 4 4 montre la structure globale de l enzyme en complexe avec son inhibiteur ainsi qu un zoom sur le site actif o sont repr sent es les principales interactions Plusieurs liaisons hydrog ne sont impliqu es dans la stabilisation du ligand e entre GIn228 O 4 et Aza N e entre GIn228 Ne et Aza Og e entre Val227 N et Aza O e entre Arg176 Ny2 et Aza O e entre Arg176 Nq et Aza Nz e entre Thr57 N et Aza N e entre Thr57 O et Aza N7 e entre Wat2 O et Aza No Compte tenu de la nature des r sidus impliqu s dans ces interactions et de la structure du complexe enzyme inhibiteur l tat de protonation est impos par l enzyme L inhibiteur doit ainsi se pr senter sous la forme d un monoanion proton en position 1 et 9 Les tests du programme ALGOGEN DIVCON que nous avons r alis s avec l urate oxydase ont pour but de v rifier la capacit de ce code reproduire la structure du
18. o D est la distance entre les atomes de la liaison hydrog ne Cette distance est d finie comme tant celle entre les atomes d oxyg ne d un groupe carboxyle et les protons pour les liaisons hydro g ne entre les groupes carboxyles et les groupements de cha ne lat rale de type Asn Gin Trp His Arg et les groupes amides du squelette Pour les autres liaisons hydrog ne elle est d finie comme la distance entre les atomes d oxyg ne et les autres atomes lourds O S et N Le param tre d est la distance optimale de liaison hydrog ne pour laquelle la valeur de ApKyp est maximale G n ra lement cette distance vaut 2 0 si D repr sente la liaison hydrog ne et 3 0 si D est la distance entre atomes lourds Le param tre d est la distance pour laquelle l interaction de liaison hydrog ne n existe plus elle vaut en principe 1 0 A de plus que la distance d Ces deux param tres d et d ont t ajust s pour reproduire les valeurs de pK exp rimentales Pour la description des liai sons hydrog ne avec le squelette de la prot ine 8 est d fini comme tant le plus grand des deux angles NHO D solvatation Les groupes carboxyles enfouis l int rieur de la prot ine montrent souvent des valeurs de pK sup rieures PKyogei ll en est de m me pour les r sidus His qui voient ces valeurs diminu es lorsqu ils sont enfouis La d solvatation est le facteur majeur d un tel d placement de pK Pour les carboxyles C terminaux les
19. optimis es d une mol cule d eau en PM3 et PM3 PIF sont identiques o M thode O41 H2 O41 H3 H2 O1 H3 AM1 0 96 0 96 103 6 PM3 0 95 0 95 107 6 TAB 4 1 Structure de la g om trie optimis e d une mol cule d eau par la m thode des gradients conjugu s avec les m thodes semi empiriques AM1 et PM3 La figure ci contre indique la nomenclature utilis e pour les atomes de la mol cule c R sultat du docking L optimisation est lanc e sur 500 g n rations de l algorithme g n tique et ce pour chacune des m thodes semi empiriques La figure 4 1 montre l volution de l nergie d interaction du dim re de l eau pour l individu repr sentant la meilleure solution potentielle de chaque g n ration en fonction de la m thode semi empirique utilis e Nous constatons que les nergies d interaction convergent plus ou moins rapidement vers une valeur donn e Il ne nous est pas possible de prime abord de d terminer si l algorithme g n tique a permis de faire converger l nergie d interaction vers son mi nimum global Cependant nous consid rons que les tr s faibles variations nerg tiques observ es apr s un grand nombre de g n rations sont dues de petites variations de la structure du dim re ne changeant en rien sa structure globale d un point de vue qualitatif En d autres termes nous consid rons que la structure du dim re a converg vers sa structure optimale lorsque les variations
20. Angle H1 CT H1 s4 CT H1 s4 oh ho CT s4 oh CT s4 CT Constante de force kcal mol deg 35 000 42 900 43 6000 67 300 62 100 Angle d quilibre deg 109 50 108 66 106 31 93 88 96 82 Angle di dre H1 CT s4 oh CT s4 oh ho H1 CT s4 CT Constante de force kcal mol 0 200 5 000 0 200 Phase rad 0 00 0 00 0 00 P riode 3 1 3 TAB 7 5 Param tres du champ de forces du substrat DMSO proton types charges masses param tres de Lennard Jones potentiels de liaison d angle de valence et d angle di dre en fonction du type de l atome Cx repr sente Cy et Cp Hx repr sente Ha Ha Has He Hg2 et Hgs L atome de soufre S est repr sent par un atome de type s4 l atome d oxyg ne O par un type oh et l hydrog ne H par un type ho du champ de forces gaff Nous avons contraint les carbones d une part et les hydrog nes d autre part avoir les m mes charges Les charges port es par S O et H sont respectivement de 0 42 0 46 et 0 49 u a Dans le champ de forces gaff l hydrog ne de type ho a des param tres de Lennard Jones nuls Bien que les types d atomes de gaff utilis s ici n aient pas t optimis s pour d crire la g om trie du DMSO proton les distances de liaison et les angles de valence correspondent ceux de la structure de ce ligand optimis e au niveau quantique b Protocole de simulation Le protocole de simulation que nous avons suivi pour r aliser cette simulation est identique celui pr sent pr c
21. H I H KN Biel Du Z oH CH FIG 5 14 Chemin r actionnel de la r duction du DMSO par le m thanethiol hypoth se de formation de l acide sulf nique partir de l interm diaire sulfurane par repliement de l angle S S O Tir de Balta et al 296 5 4 Objectifs et approche m thodologique L objectif principal de cette th se est d apporter des l ments nouveaux concernant le m canisme de r duction enzymatique des sulfoxydes de m thionine par les m thionine sulfoxyde r ductases de classe A Nous nous sommes int ress plus sp cialement l tape r ductase du m canisme catalytique 5 4 Objectifs et approche m thodologique 115 Dans un premier temps nous tudierons la phase de reconnaissance et d ancrage du substrat sulfoxyde dans le site actif de l enzyme docking En principe la m thode de docking d velop p e dans la premi re partie de cette th se aurait pu tre utilis e Cependant la description des tats hypervalents du soufre par les m thodes semi empiriques est peu fiable avec les param tri sations actuelles et nous avons pr f r faire appel aux techniques de dynamique mol culaire Une comparaison entre les r sultats exp rimentaux disponibles et les r sultats th oriques permettra de valider la mod lisation du complexe micha lien d un sulfoxyde de m thionine dans le site actif de l enzyme MsrA Nous nous int resserons dans une deuxi me partie l activation du substrat Met
22. HO S OO R Ce dernier se r arrange via une oxydation un lectron pour former 5 1 Stress oxydant et oxydation des r sidus m thionine 91 un sulfoxyde 58 169 R gt S OH O gt R HO S 00 R R S 0 HO b Oxydation par le peroxyde d hydrog ne H202 La r action de H2O avec une m thionine est un processus d oxydation deux lectrons com parable un transfert formel d oxyg ne selon RoS H202 gt R2SO H20 Selon une tude th orique de Chu et al 0 171 ce m canisme est consid r comme une r action de type Sy2 accompagn e de la rupture h t rolytique de la liaison O O du peroxyde La figure 5 2 montre la structure de l tat de transition de cette r action L allongement de la liaison O O est concert avec le raccourcissement de la liaison S O Deux trois mol cules d eau stabilisent la s paration de charge pr sente au niveau de l tat de transition Le transfert de l hydrog ne encore port par l oxyg ne du sulfoxyde vers l anion HO intervient apr s cet tat de transition Fe 5 2 Etat de transition de l oxydation d un sulfure par le peroxyde d hydrog ne La r action est de type Sw avec rupture h t rolytique de la liaison O O In vivo un r le catalytique important a t attribu au dioxyde de carbone En effet la pr hydrata tion r versible du CO2 par H202 g n re des ions peroxomonocarbonates HCO capables d oxyder les r sidus m thionine cent fo
23. par l enzyme et que le m canisme de transfert du groupe ment OH tr s d favorable en phase gazeuse le restera dans le cas de la r action enzymatique Afin de v rifier cette analyse qualitative un traitement quantique du m canisme intramol culaire dans l environnement enzymatique a t men en utilisant le mod le quantique de site actif que nous avons d crit dans le chapitre pr c dent Fig 7 2 La structure de d part est celle de l in term diaire sulfurane 2 dans le site actif La m thode quantique utilis e est comme auparavant B3LYP 6 31G d L approche quantique montre en fait qu il n est pas possible de localiser un minimum dans la surface d nergie potentielle correspondant la structure de l interm diaire sulfurane avec S CHs 8 1 M canisme Transfert d un groupement OH 197 quatorial Lorsque partant de la structure 2 l angle S S O est diminu nous observons la d pro tonation spontan e de l interm diaire sulfurane et la dissociation de sa liaison S S Nous retrouvons dans ce cas le substrat sulfoxyde non proton DMSO dans le site actif c est dire la structure de complexe micha lien d crite dans le chapitre 6 Nous avons galement optimis une structure de sulfurane avec S CHs en position quatoriale en imposant deux contraintes g om triques distance S S proche de 2 2 et angle S S O proche de 90 par analogie avec la structure B A la lib ration des contraintes g om
24. tats de protonation principaux pour le couple Cys51 Glu94 sont envisageables CysH Glu CysH GluH et Cys GIuH la fois pour l enzyme libre et le complexe enzyme substrat 6 2 Simulations protocole op ratoire Dans un premier temps nous avons r alis trois simulations de dynamique mol culaire de l en zyme libre correspondant aux trois tats de protonation mentionn s ci dessus Cette tude se justifie par le fait que la structure cristallographique utilis e n est pas celle d une enzyme native i e l en zyme a t modifi e mutations ventuelles de r sidus formation d adduit etc pour les besoins de la cristallisation et ou de la diffraction de rayons X Les structures tridimensionnelles disponibles ne comportant pas d hydrog ne il est n cessaire d envisager les trois tats de protonation Nous avons ensuite r alis les simulations en pr sence du substrat sulfoxyde Parmi les trois tats de aUn quatri me tat Cys Glu et sulfoxyde proton sera abord au prochain chapitre 120 6 Reconnaissance et ancrage du substrat protonation nous souhaitons identifier celui ou ceux permettant de r aliser la reconnaissance et l ancrage du substrat sulfoxyde Les informations concernant ces six simulations sont r sum es dans le tableau 6 2 Le substrat sulfoxyde que nous avons simul est le dim thylsulfoxyde DMSO Nous n avons pas simul un peptide sulfoxyde de m thionine pour des raisons de simplicit L
25. teraction avec Tyr134 est plus faible avec des fluctuations importantes Le r sidu Tyr134 interagit aussi faiblement avec l oxyg ne Oe de Glu94 Fig 7 10 i Nous retrouvons l interaction lectrostatique stabilisante entre le soufre S de Sulf et l hydrog ne Hy de Tyr197 avec une distance majoritairement 2 Fig 7 10 f Un des groupements m thyle du sulfurane est en interaction hydrophobe avec Trp53 La valeur moyenne de la distance Sulf Cg2 Trp53 Ne vaut 3 5 A Fig 7 10 g Cette interaction permet au sulfurane de rester peu mobile dans le site actif de l enzyme Ceci est v rifi par l angle di dre Sulf Cg Sulf S Sulf Ss Sulf Ca qui reste relativement constant Fig 7 10 h Signalons enfin que nous n avons pas observ d interaction particuli re des r sidus du site actif ni avec le soufre Ss ni avec sa paire libre Si nous mettons de c t les probl mes de simulation en fin de trajectoire probablement li s un souci de param trisation qui devra tre am lior e nous remarquons que le site actif de l enzyme est parfaitement capable de stabiliser le sulfurane Nous retrouvons la plupart des interactions que nous avons d crites pour le complexe micha lien 7 3 Dynamique mol culaire du substrat activ 185 Distance 0 2 4 6 8 0 200 400 600 Temps ps Distance a Distance Sulf HO Glu94 O SUA51HO E940E2 Distance 0 200 400 600 0 2 4 6 8 Temps
26. 0 78 0 78 0 82 0 82 Hog 0 34 0 37 0 36 0 36 0 33 O39 0 78 0 76 0 76 0 82 0 78 H31 0 34 0 37 0 37 0 44 0 38 H32 0 35 0 33 0 33 0 36 0 36 C33 0 37 0 32 0 30 0 57 0 32 S37 0 74 0 59 0 56 0 48 0 51 Osg 0 54 0 57 0 55 0 72 0 60 Cao 0 44 0 39 0 41 0 05 0 71 TAB 8 7 Valeurs des ordres de liaison et des charges du complexe micha lien 1 de l tat de transition TS4 du sulfurane 2 de l tat de transition TS 4 et de l interm diaire sulfurane dissoci 4 dans le mod le quantique de site actif La g om trie est optimis e au niveau B3LYP 6 31G d Les charges sont d ri v es du potentiel lectrostatique AE kcal mol 1 TS 2 2 TS24 4 B3LYP 6 31G d 00 45 44 81 58 BSLYP 6 31 G 2df 2p 0 0 4 56 56 70 438 TAB 8 8 Bilan nerg tique du chemin r actionnel correspondant au transfert de proton entre le r sidu Glu94 et le substrat sulfoxyde et de protonation de l interm diaire sulfurane dans le mod le de site actif Les esp ces ont t optimis es au niveau B3LYP 6 31G d L nergie a t recalcul e au niveau B3LYP 6 3144 G 2df 2p L nergie du complexe micha lien 1 est la r f rence des valeurs d nergie 214 8 R duction du substrat Ce chemin de r action conduisant au final la dissociation de la liaison S O existant initialement dans le substrat sulfoxyde pr sente donc un profil nerg tique qui semble au niveau de th orie uti lis ici tr s favorable au processus de r
27. Caldwell J W Kollman P A et Case D A J Comput Chem 25 1157 1174 2004 Frisch M J Trucks G W Schlegel H B Scuseria G E Robb M A Cheeseman J R Montgomery Jr J A Vreven T Kudin K N Burant J C Millam J M Iyengar S S Tomasi J Barone V Mennucci B Cossi M Scalmani G Rega N Petersson G A Nakatsuji H Hada M Ehara M Toyota K Fukuda R Hasegawa J Ishida M Nakajima T Honda Y Kitao O Nakai H Klene M Li X Knox J E Hratchian H P Cross J B Bakken V Adamo C Jaramillo J Gomperts R Stratmann R E Yazyev O Austin A J Cammi R Pomelli C Ochterski J W Ayala P Y Morokuma K Voth G A Salvador P Dannenberg J J Zakrzewski V G Dapprich S Daniels A D Strain M C Farkas O Malick D K Rabuck A D Raghavachari K Foresman J B Ortiz J V Cui Q BIBLIOGRAPHIE 287 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 288 284 285 286 287 288 289 290 291 292 298 294 295 296 297 298 Baboul A G Clifford S Cioslowski J Stefanov B B Liu G Liashenko A Piskorz P Komaromi l Martin R L Fox D J Keith T Al Laham M A Peng C Y Nanayakkara A Challacombe M Gill P M W Johnson B Chen W Wong M W Gonzalez C et Pople J A Gaussian 03 Revision C 02 Gaussian Inc Wallingford CT 2004 Bayly C 1
28. Cieplak P Cornell W et Kollman P A J Phys Chem 97 10269 10280 1993 Cornell W D Cieplak P Bayly C I et Kollmann P A J Am Chem Soc 115 9620 9631 1993 Pigache A Cieplak P et Dupradeau F Y Automatic and highly reproducible RESP and ESP charge derivation Application to the development of programs RED and X RED In 227th ACS National Meeting 2004 Typke V et Dakkouri M J Mol Struct 599 177 193 2001 Jorgensen W L Chandrasekhar J Madura J D Impey R W et Klein M L J Chem Phys 79 926 935 1983 Darden T York D et Pedersen L J Chem Phys 98 10089 10092 1993 Essmann U Perera L Berkowitz M L Darden T Lee H et Pedersen L G J Chem Phys 103 8577 8593 1995 Drabowicz J Dudzi ski B et Miko ajczyk M Synlett 1992 252 254 1992 Lee G H Choi E B Lee E et Pak C S Tetrahedron Lett 35 2195 2196 1994 Mohanazadeh F Momeni A R et Ranjbar Y Tetrahedron Lett 35 6127 6128 1994 Zhang Y Yu Y et Bao W Synth Commun 25 1825 1830 1995 Wang J Q et Zhang Y M Synth Commun 25 3545 3547 1995 Nicol s E Vilaseca M et Giralt E Tetrahedron 51 5701 5710 1995 Fujiki K Kurita S et Yoshida E Synth Commun 26 3619 3626 1996 Wang Y et Koreeda M Synlett 1996 885 886 1996 Black S Harte E M Hudson B et Wartofsky L J Biol Chem 235 2910 2916 1960 Denisov G S Koll A Lobadyuk V
29. Dans la premi re le d veloppement du programme de docking mol culaire sera d crit Nous rappellerons l utilit de ce type de programme dans le contexte g n ral d une tude th orique de syst mes biologiques complexes ainsi que le principe g n ral de leur fonctionnement Nous expo serons ensuite les motivations qui nous ont men s d velopper un nouveau code reposant sur un calcul quantique de l nergie ainsi que le cahier des charges que nous nous sommes fix Nous d crirons enfin le code informatique d velopp durant ce travail qui utilise un algorithme de type g n tique Le programme de docking mol culaire sera valid par l tude de diff rents syst mes dont un complexe enzyme substrat La deuxi me partie du manuscrit traitera du m canisme r actionnel des m thionine sulfoxyde r ductases de classe A Cette tude sera men e dans une approche multi outils combinant des m thodes issues de la m canique statistique dynamique mol culaire pour l analyse des aspects structuraux du syst me enzymatique et des m thodes issues de la m canique quantique pour ce qui a trait la r activit Nous ferons dans un premier temps un rappel bibliographique portant sur l importance biologique de cette classe d enzymes Nous ferons galement un bilan des tudes th oriques et exp rimentales ant rieures cette th se qui fournissent des l ments de connais sance importants vis vis du travail r aliser Nous d
30. Initialement la cause de cette accumulation a t attribu e une baisse de l activit du pro 213 t asome et de la prot ase mitochondriale Lon au cours de la vie d une cellule La possibilit que des syst mes de r paration des prot ines oxyd es comme les Msr puissent galement tre impliqu s dans la diminution li e l ge de l activit des prot ines a t r cemment envisag e Chez le rat une diminution significative de l activit Msr a t d cel e au niveau du foie du rein et du cerveau durant le vieillissement cellulaire Cette m me diminution a galement t observ e dans des fibroblastes humains au cours de leur vieillissement corr l e avec la diminution de l expression des g nes codant l enzyme MsrA et une enzyme MsrB Ces donn es indiquent que les capacit s de r paration des Msr sont diminu es lors du vieillissement contribuant probablement l accumulation de prot ines oxyd es 98 5 Rappels bibliographiques et objectifs 5 2 2 M canisme catalytique Les Msr sont des enzymes ne n cessitant aucun cofacteur r dox pour la r duction des sulfoxydes de m thionine Boschi Muller et a ont d montr que le m canisme se d roule en trois tapes en passant par la formation d un interm diaire acide sulf nique produit d oxydation d une cyst ine La r g n ration de l enzyme vers sa forme r duite n cessite la pr sence d un r ducteur qui est la thior doxine
31. Nous avons ajout ces tableaux les valeurs relatives aux structures 1 et TS _2 afin de montrer le m canisme depuis le complexe micha lien dans le site actif Dans l tat de transition TS2 4 la liaison S37 O38 a augment de 1 82 2 15 tandis que la liaison Ss S37 a diminu de 2 58 2 31 respectivement entre 2 et TS 4 Ces variations sont en accord avec celles des ordres de liaison passant de 0 59 0 32 pour S37 Ozg et de 0 49 0 72 pour S5 S37 La deuxi me mol cule d eau atomes 30 32 vient se placer proximit de la mol cule de ph nol La distance O2 H3 passe de 2 05 1 76 entre 2 et TS A Il se forme une liaison hydrog ne stabilisant la charge n gative de 0 69 u a sur oxyg ne O Le transfert de densit lectronique entre les deux atomes de soufre que nous avons observ pr c demment entre le complexe micha lien 1 et le sulfurane 2 est accru au niveau de cet tat de transition Les charges varient de 0 61 0 33 u a pour Ss et de 0 56 0 48 u a pour S37 entre 2 et TS 4 L ion sulfuranyle 4 form lors de ce tranfert de proton porte une charge globale de 1 u a qui est stabilis e par la pr sence de la mol cule d eau H43 O3s H proximit de l atome de soufre S37 La distance et l ordre de liaison de S37 O3g valent respectivement 2 39 et 0 15 L atome d oxyg ne Osg se situe dans l axe de la liaison Ss S37 La mol cule d eau H43 O3s H est maintenue par un
32. Particle Mesh Ewald La m thode Particule Mesh Ewald 9 PME a pour but de r duire le temps de calcul des inter actions lectrostatiques dans le cadre de la somme d Ewald Dans cette derni re l tape limitante est la transform e de Fourier qui permet de faire converger le deuxi me terme de l quation A 20 dans l espace r ciproque Le but de la m thode PME est d utiliser des transform es de Fourier rapides FFT Pour cela on doit discr tiser le probl me le volume de la bo te de simulation est divis en sous bo tes et on interpole les charges de chacune d elles sur une grille tridimen sionnelle Ainsi le temps de calcul des interactions lectrostatiques est diminu et croit maintenant en O Nlog N 236 A M thodologie A 2 4 Dynamique mol culaire La dynamique mol culaire consiste tudier l volution d un syst me mol culaire au cours du temps en r solvant les quations de Newton relatives ce syst me Mm aj f A 22 o m est la masse d un atome i a son acc l ration et f la force qui lui est appliqu e du fait de son interaction avec les autres atomes et l environnement Suivant l hypoth se ergodique l tude d une trajectoire infiniment longue d un syst me par dynamique mol culaire revient chantillonner tout l espace des phases de ce syst me Il est alors possible d acc der des grandeurs thermo dynamiques telles que les coefficients de diffusion les fonctions d
33. crire la rupture et la formation de liaisons dans le syst me biologique Dans un premier temps le chemin de r action est g n ralement tudi en solution l aide d un syst me mod le puis transpos dans le site actif de l enzyme L environnement enzyma tique i e les r sidus du site actif mais aussi l environnement de ces r sidus joue un r le souvent tr s important qu il convient de prendre en compte pour pouvoir d crire la catalyse Cependant il n est pas possible en g n ral de d crire tout le syst me biologique avec les m thodes standards de la chimie quantique et des approximations sont n cessaires Plusieurs m thodes ont t d velopp es et utilisent soit une partition du syst me complet en deux sous syst mes classique quantique comme les m thodes ONIOM 4 et QM MM 5 soit des algorithmes croissance lin aire comme les m thodes Divide amp Conquer MOZYME ou Density Matrix Minimization pour ne citer que les plus connues Introduction objectifs 17 d Objectifs de la th se Parmi les objectifs du projet SIRE ce travail de th se s est int ress aux deux points suivants i le d veloppement d un programme de docking mol culaire exploitant le principe de calcul quan tique semi empirique croissance lin aire sous architecture parall le et ii la d termination du m canisme r actionnel des m thionine sulfoxyde r ductases de classe A Ce manuscrit est ainsi divis en deux parties
34. crirons enfin les r sultats de nos travaux qui apportent des informations fondamentales et nous permettent de proposer un m canisme d taill de l tape r ductase pour ces enzymes Dans un souci de clart nous ne ferons volontairement pas dans le corps de ce manuscrit de rappels m thodologiques correspondant aux outils utilis s mais ceux ci seront pr sent s sous forme d annexes Cependant la m thode utilis e dans chaque tape du travail sera rappel e dans le texte chaque fois que cela sera n cessaire Nous avons aussi report en annexe du manuscrit les deux manuels utilisateur des programmes que nous avons crits ALGOGEN algorithme g n tique de minimisation et ALGOGEN DIVCON logiciel de docking Premi re partie D veloppement d un programme de docking mol culaire semi empirique croissance lin aire Chapitre 1 Rappels bibliographiques et objectifs Sommaire 1 1 1 2 1 3 1 4 Ce chapitre pr sente de fa on g n rale et succincte les programmes de docking mol culaire et leur utilit dans le contexte d une tude th orique des syst mes biologiques De tels programmes commerciaux ou non sont d j disponibles mais ils conduisent certaines limitations principa lement li es au traitement classique des interactions que nous verrons en d tail A partir de ces constatations nous pr senterons les motivations qui nous ont amen s d velopper un nouveau programme de docking
35. d eau avec 10 mol cules proximit distance lt 3 4 Fig 6 6 j Ces mol cules forment des liaisons hydrog ne avec les r sidus du site actif et permettent au substrat de demeurer l int rieur pendant les 200 premi res picosecondes de la simulation Ceci est visible sur le trac des distances Tyr82 H DMSO O Fig 6 6 a Tyr134 Hy DMSO O Fig 6 6 b et Cys51 Hy DMSO O Fig 6 6 c o nous observons un palier de 0 200 ps avec une distance d environ 6 dans tous les cas Le nombre de mol cules de solvant va croissant dans la suite de la simulation Au del de 200 ps l absence d interactions sp cifiques du substrat avec les r sidus du site actif entraine son d part vers le solvant Au d but de la simulation il y a une interaction stabilisante entre le soufre du DMSO et le soufre S de Cys51 Ces deux atomes de charges oppos es sont s par s d une distance moyenne de 3 5 durant les 100 premi res picosecondes Fig 6 6 d Il s agit d une interaction sp cifique entre l en zyme et le substrat mais qui ne permet pas de fixer le DMSO dans le site actif Rappelons qu un 1232 est l interaction de l ment de reconnaissance du substrat d crit par les travaux de Gand et a type hydrophobe d un groupement m thyle du substrat avec la poche hydrophobe form e par les r sidus Phe52 et Trp53 Nous n observons pas ce type d interaction dans notre simulation Fig 6 6 e La distance Trp53 Ne DMSO
36. de l tat de transition TS _2 et du sulfurane 2 dans le mod le quantique de site actif La g om trie est optimis e au niveau B3LYP 6 31G d Les charges sont d riv es du potentiel lectrostatique En comparaison les valeurs pour le DMSO non proton DMSO et proton DMSOH et pour le r sidu Glu proton GluH et non proton Glu sont indiqu es isol phase gazeuse AXE kcal mol 1 TS 2 B3LYP 6 31G d 00 45 44 B3LYP 6 311 G 2df 2p 0 0 5 6 5 6 TAB 7 3 Bilan nerg tique du chemin r actionnel correspondant au transfert de proton entre le r sidu Glu94 et le substrat sulfoxyde dans le mod le quantique de site actif Les esp ces ont t optimis es au ni veau B3LYP 6 31G d Les nergies ont t recalcul es au niveau B3LYP 6 311 G 2df 2p L nergie de l esp ce 1 est la r f rence des valeurs d nergie 7 2 M canisme de transfert de proton 165 a Complexe micha lien 1 b HOMO E 0 04080 Hartree c LUMO E 0 09826 Hartree Fic 7 3 Structure du complexe micha lien 1 dans le mod le quantique de site actif apr s optimisation de g om trie au niveau B3LYP 6 31G d a et trac des orbitales HOMO et LUMO b et c Les trac s correspondent une valeur d isosurface de 0 05 166 7 Activation du substrat L ordre de liaison entre Ss et S37 vaut 0 21 et indique une interaction orbitalaire non n gligeable entre ces deux atomes bien qu ils soient s par s d une distance
37. demment e ajout des hydrog nes de l enzyme partir de la structure PDB en accord avec l tat de proto nation des r sidus ionisables e solvatation de l enzyme dans une boite d eau et minimisations successives pour placer les mol cules de solvant 7 3 Dynamique mol culaire du substrat activ 175 e quilibration thermodynamique du syst me pendant 100 ps avec une mont e progressive en temp rature et contrainte sur la cha ne principale de l enzyme par rapport la cristallographie e production de la trajectoire dans l ensemble NPT P 1 atm T 300 K sur une dur e de 1 ns avec un pas de temps de 0 5 fs c Analyse de la trajectoire Les r sultats de la simulation qui sera identifi e par le sigle DMSOH Cys Glu sont pr sent s dans la figure 7 8 Le substrat DMSO proton est d sign dans cette analyse par le terme DMSOH La plupart des interactions d crites dans le chapitre pr c dent pour le complexe micha lien sont pr sentes dans cette simulation mais elles sont g n ralement plus faibles Nous observons une liaison hydrog ne une distance d environ 2 entre l hydrog ne DMSOH H et les oxyg nes Ok et Ogo de Glu94 Fig 7 8 a Cette interaction est altern e entre ces deux atomes tout au long de la simulation L extr mit de la chaine lat rale de Glu94 est tr s mobile comme le montre la variation de l angle di dre autour de la liaison CC Fig 7 8 d sans doute cause de l absence de liai
38. des diff rents sulfoxydes test s sont extr mement basses et se situent toutes entre 2 et 35 96 Des donn es structurales relatives des sulfoxydes engag s dans des liaisons hydrog ne et des sulfoxydes proton s ont pu tre obtenues par cristallographie de rayons SIB D une longueur r f rence de 1 492 la liaison S O passe 1 513 pour un sulfoxyde engag dans une liaison hydrog ne et 1 587 pour un sulfoxyde proton 5 2 M thionine sulfoxyde r ductases Les m thionine sulfoxyde r ductases Msr sont des enzymes de la classe des oxydor ductases EC 1 8 4 11 1 8 4 14 catalysant la r duction des sulfoxydes de m thionine MetSO libres ou inclus au sein d une prot ine Ces enzymes sont pr sentes chez de nombreuses esp ces vivantes tant chez les animaux que les v g taux et les bact ries Elles sont localis es la fois au niveau mitochondrial au niveau du noyau et dans le cytoplasme 9 7199 96 5 Rappels bibliographiques et objectifs L oxydation de la fonction thio ther de la m thionine conduit la formation de deux st r oisom res R et S de la fonction sulfoxyde au niveau de l atome de soufre Les Msr de classe A MsrA r duisent l som re S de la fonction sulfoxyde et les Msr de classe B MsrB l som re R comme illustr par la figure 5 4 se 0 b e BS ae d Met S SO HN S 3 o A j Fwd P aN SC MsrB O Met R SO Fig 5 4 St r osp cificit de la r duction enz
39. duction qui couplerait le transfert d lectron et l activation du substrat par transfert de proton Glu DMSO Comme nous l avons d j dit le caract re plus ou moins ionique du syst me d pend de la dis tance S S A la distance d quilibre ds s 2 5 la liaison poss de un caract re covalent notable 8 2 M canisme Il 1 H 1 e 205 5 0 An e AE ET CH AS OH CHJ S OH E CH S CH S 3 0 2 0 L lt 10 Constante di lectrique 0 0 e 20 40 60 80 e 1 0 D 2 0 E Ox Red aps Ploaz Red kcal mol AGgoly Ox AGsoiv Red E Solvant AE AH AG kcal mol kcal mol V 42 82 44 03 43 68 2 17 H3 S d E cV 3 46 4 85 H i 3 GC 5 01 Gaz 135 73 137 03 138 82 0 00 0 00 6 30 H 3 3 3 3 3 3 SRE rU Cyclo 30 95 3 77 5 12 DMSO 61 18 8 22 4 00 Diaen OH Eau 62 00 8 48 3 98 TAB 8 5 Potentiel r dox absolu des couples CHa S CHs4 S et CHa e S OH CHs e S OH en fonction du solvant Les valeurs sont obtenues au niveau de th orie B3LYP 6 311 G 2df 2p sur g om tries optimis es B3LYP 6 31 G d avec un mod le de solvant CPCM Cyclohexane 2 02 DMSO 46 7 et Eau 78 39 selon la m thode de Fu et al 9 Le graphique ci dessus indique la variation de la diff rence de potentiel correspondant la r action d oxydor duction CS ES CH3 2S OH CH3 S CH3 s S OH 206 8 R d
40. en fonction du temps dans la simulation DMSO CysH Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 140 6 Reconnaissance et ancrage du substrat 25 20 a o 15 TD 49 2 10 o m o 5 z 0 0 200 400 600 800 1000 0 5 10 15 20 25 Temps ps Mol cules de solvant i Nombre de mol cules d eau proximit du substrat DMSO distance 3 4 25 E 20 a o 15 D ZS 10 o Be o 5 A 0 0 200 400 600 800 1000 0 5 10 15 20 25 Temps ps Mol cules de solvant k Nombre de mol cules d eau proximit du r sidu Cys51 distance 3 4 25 T T T T T T S 20 E E94 o 15 o D 10 o wv s 0 200 400 600 800 1000 0 5 10 15 20 25 Temps ps Mol cules de solvant I Nombre de mol cules d eau proximit du r sidu Glu94 distance lt 3 4 FiG 6 6 suite Variation du nombre de mol cules d eau dans la solvatation du substrat DMSO j du r sidu Cys51 k et du r sidu Glu94 I en fonction du temps dans la simulation DMSO CysH Glu Les valeurs sont moyenn es sur 10 ps Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 4 Complexe enzyme substrat sulfoxyde 141 6 4 2 Etat de protonation CysH GluH Les r sultats de la simulation sont pr sent s dans la figure 6 7 Dans ce cas le substrat reste dans le site actif de l enzyme durant toute la dur e de la simulation La protonation de Gl
41. en fonction du temps dans la simulation DMSO CysH GluH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 146 6 Reconnaissance et ancrage du substrat C51SG DMS212S DMS2120 0 200 400 600 800 1000 0 60 Temps ps j Angle Cys51 Sy DMSO S DMSO O Distance Y82HH E940E1 Y134HH E940E1 0 200 400 600 800 1000 0 2 6 Temps ps Distance k Distance Tyr82 Hn Glu94 Oe rouge et Tyr134 Hy Glu94 Oe bleu 10 8 T o 6 G i 4 a 2 Y82HH E940E2 Y184HH E940E2 al a La Lau La dad Li Lal al 0 200 400 600 800 1000 0 2 4 6 8 10 Temps ps Distance A I Distance Tyr82 Hy Glu94 O 2 rouge et Tyr134 Hy Glu94 Oe2 bleu FIG 6 7 suite Variation de l angle Cys51 S DMSO S DMSO O j de la distance Tyr82 H Glu94 Oc et Tyr134 Hh Glu94 O 1 k et de la distance Tyr82 Ha Glu94 Oz2 et Tyr134 Hn Glu94 Oe2 I en fonction du temps dans la simulation DMSO CysH GluH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 4 Complexe enzyme substrat sulfoxyde 147 t oO 2 o o TD o 2 o Ko o 0 200 400 600 800 1000 0 2 4 6 8 10 Temps ps Mol cules de solvant m Nombre de mol cules d eau proximit du substrat DMSO distance 3 4 P oO 2 o o TD o o 23 o NO o 0 200 400 600 800 1000 0 2 4 6 8
42. et O38 Ce mouvement est coupl avec une vibration d longation de la liaison 85 557 Il montre que la protonation du substrat sulfoxyde se fait de mani re concert e avec un rapprochement des deux atomes de soufre Ge et S37 Le transfert de proton est pratiquement achev au niveau de cet tat de transition la longueur de la liaison H43 O3g qui se forme tant gale 1 10 De ce fait les distances S5 S37 et 837 O3s se trouvent fortement modifi es La premi re a diminu de 2 97 2 61 La seconde s est allong e passant de 1 63 1 79 II existe encore le r seau de liaisons hydrog ne autour de l oxyg ne Ogg du sulfoxyde avec les r sidus Tyr82 et Tyr134 Le syst me adopte une g om trie de type bipyramide base trigonale dans laquelle le plan quatorial est form par les deux atomes de carbone C33 et Cas et par la paire libre de l atome de soufre S37 Ceci pr figure la structure de l interm diaire sulfurane 2 que nous allons d crire ensuite Signalons enfin que l augmentation de l ordre de liaison de 0 21 0 46 entre les atomes S5 et S37 d une part et de 0 13 0 46 entre les atomes Osg et H13 d autre part ainsi que la redistribution de la charge confirment le m canisme concert de formation d une liaison Ss S37 lors du transfert du proton entre O42 et Ogg c Interm diaire sulfurane 2 L optimisation de g om trie conduit l esp ce 2 illustr e dans la figure 7 4 b Nous retrouvons donc une
43. l mentaires en fonction de l environnement nous avons calcul le potentiel d ionisation Pl de la cyst ine d proton e et l affinit lectronique AE du substrat sulfoxyde proton Les m thodes quantiques de haut niveau comme G3 ou CBS Q sont connues pour donner des valeurs pr cises de ces grandeurs mais elles sont excessivement co teuses Notre choix s est port une fois encore sur la m thode B3LYP mais afin d obtenir des valeurs suffisament pr cises l utilisation d une base tendue est n cessaire 95 Pour l optimisation des g om tries nous utiliserons la base B3LYP 6 31 G d et pour le calcul des nergies la base 6 311 G 2df 2p Le r sidu cyst ine a t mod lis par une mol cule de m thanethiol CH3 SH et le substrat sulfoxyde par une mol cule de DMSO 202 8 R duction du substrat Le tableau 8 3 regroupe les valeurs du potentiel d ionisation et de l affinit lectronique calcul es pour diff rents tats de protonation des compos s en phase gazeuse Les valeurs sans relaxation A Eye et avec relaxation A E4gi4 de la g om trie ont t calcul es Les r sultats montrent l effet fondamental de l tat de protonation sur le transfert lectronique entre ces deux esp ces Pour le processus CH3 SH CH3 2S 0 CH3 SH CH3 2S O le bilan nerg tique est fortement positif 6A Eyer 279 1 kcal mol tandis que pour le processus CHa3 S CH3 2S OH CHs S CH3 2S OH il est forteme
44. l interaction coulombienne entre la paire d ions s oppose fortement ce transfert Les deux contributions ont un ordre de grandeur compa rable et par cons quent la diff rence d nergie finale entre les deux tats lectroniques n est pas tr s grande Lorsque l environnement est pris en compte la configuration ionique est fortement sta bilis e par les r sidus du site actif et cette fois le syst me diradicalaire se situe tr s haut en nergie avec des valeurs conparables celles obtenues pour le sulfurane une distance d quilibre Le pro cessus n est donc pas favorable dans l enzyme Compte tenu des diff rences d nergie obtenues l utilisation d une m thode de calcul plus pouss e n a pas t envisag e Les tats lectroniques d une esp ce dissoci e l infini d j discut s dans la section pr c dente sont repr sent s par les diagrammes 3a et 3b Ils correspondent au bilan nerg tique du transfert d lectron PI AE entre les deux esp ces isol es respectivement en phase gazeuse et dans l eau La comparaison des diagrammes 2a et 3a permet d estimer la contribution coulombienne dans la stabilisation de la forme ionique de 2a lorsque de s 4 0 environ 54 kcal mol La comparaison des diagrammes 2b et 3b en outre permet de constater que selon les mod les simples utilis s ici le processus de transfert d lectron dans l enzyme est encore moins favorable que dans l eau 8 3 M canisme Ill 2 H 2
45. nous avons un syst me mol culaire qui poss de six degr s de libert e trois degr s pour la translation du ligand d crite par un vecteur x y Z e trois degr s pour la rotation du ligand d crite par les trois angles d Euler 6 0 et y Dans l algorithme g n tique chaque individu poss de donc un chromosome contenant six g nes correspondant ces six degr s de libert Les domaines de d finition de chaque variable sont e L 2 L 2 pour les variables de translation o L est la taille de la bo te cubique o s effectue le docking boite de docking e 7 7 pour les variables de rotation A et y n 2 n 2 pour la variable de rotation 0 La fonction de score de notre programme de docking rigide est l nergie d interaction du syst me prot ine ligand Elle est calcul e comme tant l nergie totale de celui ci laquelle on retranche l nergie de chaque entit isol e Le programme effectue les t ches suivantes e la lecture de la structure de la prot ine et du ligand sous la forme de deux fichiers distincts au format PDB e l extraction de la partie d int r t de la prot ine i e le site actif de celle ci et son environnement plus ou moins proche e le r glage des diff rents param tres et options de l algorithme g n tique e le r glage des diff rents param tres et mots cl s du programme DIVCON e la cr ation des fichiers d input de DIVCON et la lecture des fichiers de r sultat
46. r seau important de liaisons hydrog ne avec les groupements mod lisant les r sidus Glu94 Tyr82 et Tyr134 Elle participe avec l autre mol cule d eau pr sente sur le site H3 O39 H32 la stabili sation de la charge n gative de 0 65 u a port e par l oxyg ne Oo du ph nolate Nous observons aussi que cette mol cule d eau s est tourn par rapport sa position dans l tat de transition TG 4 pour orienter l atome d oxyg ne Ox vers l atome de soufre Ss Notons galement une diminution importante de la densit lectronique sur l atome S5 mod lisant Cys51 qui change de 0 61 0 24 u a entre l interm diaire sulfurane 2 et l interm diaire dissoci 4 D apr s les calculs Tab 8 8 au niveau de th orie le plus pouss l tat de transition TS2_4 se si tue seulement 1 4 kcal mol au dessus de l interm diaire sulfurane 2 L nergie d activation de l tat de transition se trouve donc tre un peu plus petite que celle obtenue dans les travaux de Balta et al AE 5 5 kcal mol en solution de DMSO ce qui est probablement d en partie au moins l affai blissement de la liaison S O dans le sulfurane interagissant avec le carboxylate mimant Glu94 8 3 M canisme Ill 2 H 2 e 211 a Etat de transition TS2 4 b Interm diaire sulfurane dissoci 4 lon sulfuranyle Fic 8 7 Structure de l tat de transition TS 4 et de l ion sulfuranyle 4 dans le mod le de site actif apr s optimisation
47. rentiellement le minimum global de l nergie d interaction Le tableau 4 2 reporte les nergies d interaction et les g om tries des dim res de l eau que nous avons obtenus avec ALGOGEN DIVCON et avec GEOMOP pour les diff rentes m thodes semi empiriques Nous constatons que les structures obtenues avec notre programme sont proches de celles obtenues avec GEOMOP tant au niveau de la g om trie que de l nergie d interaction Nous obtenons une nergie d interaction du dim re de l eau valant 5 15 kcal mol en AM1 et 3 43 kcal mol en PM3 La correction des fonctions coeur coeur de la m thode PM3 PIF am liore la valeur de 4 1 Structure du dim re de l eau 69 G a b Fic 4 2 Structure obtenue apr s 500 g n rations de l algorithme g n tique a La structure AM1 est de type Cov Les plans de sym trie sont d finis par les atomes Oi H et Hs d une part et O4 Hs et Hs d une part b Les structures PM3 et PM3 PIF sont toutes les deux de type Cs Le plan de sym trie est d fini par les atomes O4 Hs et Hs ALGOGEN DIVCON M thode R A B AE kcal mol G n rations Evaluations AM1 2 55 55 5 148 6 5 15 487 9408 PM3 276 2 7 111 2 8 43 482 7792 PM3 PIF 2 86 3 8 119 7 4 94 340 5472 GEOMOP M thode R oi Dr AE kcal mol AM1 2 49 58 5 161 3 5 17 PM3 2 76 0 111 0 8 44 TAB 4 2 Energies d interaction AE et param tres structuraux du dim re de l eau optimis par ALGOGE
48. s fixer la position de certains atomes lors des phases d optimisation de g om trie pour assurer la conservation de la 7 2 M canisme de transfert de proton 161 structure globale du site actif Les atomes gel s sont Cys51 Cg C1 Tyr134 C C14 Glu94 C Ce et Tyr82 O O27 Le syst me quantique porte une charge totale de 1 u a Fic 7 2 Structure du mod le quantique de site actif utilis lors des calculs de chimie quantique Il est consti tu d une mol cule de m thanethiol atomes 1 5 pour Cys51 une mol cule d acide ac tique atomes 6 13 pour Glu94 une mol cule de ph nol atomes 14 26 pour Tyr134 une mol cule d eau atomes 27 29 pour Tyr82 et une mol cule d eau atomes 30 32 correspondant une mol cule de solvant Wat L tat de protonation des r sidus repr sent s ici correspond celui du complexe micha lien Les atomes dont la position est fix e dans les calculs quantiques sont Cys51 Cg C1 Tyr134 Cy C14 Glu94 Cy Ce et Tyr82 On O7 7 2 2 M thodologie Toutes les structures pr sent es dans cette tude ont t optimis es au niveau B3LYP 6 31G d puis valu es nerg tiquement au niveau B3LYP 6 311 G 2df 2p Cette m thodologie a t choi sie afin d avoir un bon compromis entre pr cision et temps de calcul Toutes les structures ont fait l objet d une optimisation de g om trie compl te sauf les quelques atomes gel s dans le vide et d un calcul
49. sence d H2O suivi d une dilution par H20 ou H20 6 Les cyst ines de recyclage ont t mut es en r sidus s rine pour arr ter la r action au niveau de l interm diaire acide sulf nique Ce dernier a t analys par spectrom trie de masse MsrA E coli Substrat Solvant R sultat C86S C198S C206S AcMetSO 5NHMe Hait Cys51 SO SH C86S C198S C206S AcMetSO 95NHMe H20 Cys51 SO 6H C86S C198S C206S AcMetSO 5NHMe Hai Cys51 SO 8H C86S C198S C206S AcMetSO 5NHMe Ha dilution H2O 8 Cys51 SO FH C86S C198S C206S AcMetSO 5NHMe H2O 8 dilution H2016 Cys51 SO6H C86S C198S C206S E94A AcMetSO SNHMe H20 6 Cys51 SO H C86S C198S C206S E94A AcMetSO SNHMe H20 8 Cys51 SO 6H TAB 8 9 R capitulatif des conclusions des analyses de marquage isotopique de l interm diaire acide sul f nique pour les mutations C86S C198S C206S et C86S C198S C206S E94A de la MsrA dE coli R sultats obtenus par ESI MS en conditions natives Tir d Antoine 216 8 R duction du substrat Les r sultats de ces exp riences ne sont pas concluants car il existe un change rapide entre l interm diaire acide sulf nique et le solvant Dans le cas d une mutation du r sidu Glu94 par une alanine cet change n est plus observ ce qui sugg re que l atome d oxyg ne pr sent sur l acide sulf nique serait celui initialement pr sent sur le substrat MetSO Mais le r le d un r sidu Ala la place de Glu94 sur le m canisme de r action devra tre clarif
50. sum La mod lisation de la reconnaissance et de la catalyse enzymatiques a t abord e dans ce travail Dans une premi re partie un logiciel de docking ALGOGEN DIVCON d terminant la structure optimale d un syst me prot ine ligand a t d velopp en combinant une m thode semi empirique coupl e un algorithme croissance lin aire Divide amp Conquer pour la description du syst me et un algorithme g n tique ALGOGEN pour la recherche conformationnelle Des tests sur diff rents syst mes dont des complexes enzyme substrat ont t effectu s pour valider l approche La seconde partie concerne l tude du m canisme phase r ductase des m thionine sulfoxyde r ductases de classe A MsrA catalysant la r duction de r sidus m thionine oxyd s MetSO A l aide de simulations de dynamique mol culaire pour diff rents tats de protonation du site actif de l enzyme nous montrons que l ancrage du substrat est particuli rement favorable pour un tat de protonation Glu94H et Cys519 L tude au niveau quantique du m canisme de r duction partir du complexe micha lien indique la formation d une esp ce sulfurane par protonation de la fonction sulfoxyde et cr ation d une liaison S S avec Cys51 Le transfert d un second proton provenant de Tyr134 ou Tyr82 vers le groupement OH du sulfurane induit la formation d une mol cule d eau et la dissociation de la liaison S O Lion sulfuranyle r sultant est enfin hy
51. un tat de transition permettant la formation de la liaison S O de l acide sulf nique La pseudorotation conduit deux st r oisom res le groupement OH est positionn sur l axe S CH a ou sur l axe S Met b 8 1 2 Chemin de r action dans un syst me isol Nous avons consid r dans un premier temps le syst me mod le illustr par la figure 8 2 a La cha ne lat rale de la cyst ine catalytique est simplement repr sent e ici par un groupement CH3 atomes 1 5 Le mod le avait d j t utilis par Balta et a 96 en solution de DMSO un niveau de calcul pouss Nous le d crirons ici un niveau de th orie plus simple B3LYP 6 31G d mais de facon plus d taill e Nous verrons que ce niveau permet de reproduire l essentiel des r sultats de Balta et al 8 1 M canisme Transfert d un groupement OH 191 Les diff rentes esp ces pr sentes sur le chemin r actionnel ont fait l objet d une optimisation de g om trie compl te dans le vide et d un calcul de fr quences La structure des tats de transition a t optimis e apr s une analyse de la surface d nergie potentielle scan selon une coordonn e interne correspondant un angle de liaison Nous avons v rifi l existence d une seule fr quence imaginaire dont le mode normal de vibration correspond ce repliement Un calcul du chemin de r action intrins que IRC a permis de v rifier la nature des interm diaires connect s par l tat de
52. 10 Temps ps Mol cules de solvant n Nombre de mol cules d eau proximit du r sidu Cys51 distance 3 4 Mol cules de solvant d Dal a 0 a a a zi 0 200 400 600 800 1000 0 2 4 6 8 10 Temps ps Mol cules de solvant 0 Nombre de mol cules d eau proximit du r sidu Glu94 distance lt 3 4 A FIG 6 7 suite Variation du nombre de mol cules d eau dans la solvatation du substrat DMSO j du r sidu Cys51 k et du r sidu Glu94 I en fonction du temps dans la simulation DMSO CysH GluH Les valeurs sont moyenn es sur 10 ps Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 148 6 Reconnaissance et ancrage du substrat 6 4 3 Etat de protonation Cys GluH Les r sultats de la simulation sont pr sent s dans la figure 6 9 Nous retrouvons la grande majo rit des interactions que nous avons d crites dans la simulation pr c dente Il se forme tout au long de la simulation un r seau important de liaisons hydrog ne autour de l atome d oxyg ne du substrat sulfoxyde Une liaison hydrog ne forte une distance de 2 se forme entre l oxyg ne du DMSO et l hydrog ne He de Glu94 Fig 6 9 a et entre l oxyg ne du DMSO et l hydrog ne Hy de Tyr82 Fig 6 9 b Une liaison hydrog ne se forme aussi avec Tyr134Hq Fig 6 9 c mais de mani re moins importante Nous n avons pas observ de liaison hydrog ne se formant entre les r sidus Tyr82 Tyr134 d une par
53. 184 La cin tique de la r action de d amidation varie non seulement en fonction de la s quence de r sidus adjacents dans la structure primaire mais d pend aussi des structures secon daires tertiaires et quaternaires Ce constat permet Robinson et al de soutenir l hypoth se appel e Molecular Clocks selon laquelle le r le majeur des r sidus Asn et Gin serait de mesurer le temps de vie d une prot ine La d gradation par d amidation des r sidus Asn et Gln d une prot ine marquerait la fin de vie de celle ci et signalerait l organisme la d gradation de la prot ine et la formation d une nouvelle entit en remplacement 5 1 3 Propri t s physico chimiques de la fonction sulfoxyde La fonction sulfoxyde est une fonction particuli re dont les propri t s physico chimiques diff rent de celles habituellement connues pour des analogues comme la fonction carbonyle Nous allons faire un rappel bibliographique des principales caract ristiques de cette fonction a Aspects structuraux Le dim thylsulfoxyde DMSO est le compos de r f rence de la famille des sulfoxydes Plu sieurs structures tridimensionnelles du DMSO ont t r solues par cristallographie 9 La g om trie adopt e par le DMSO dans ces structures est t tra drique Elle est caract ris e par une distance moyenne entre l atome de soufre et l atome d oxyg ne de 1 49 A un angle C O S de 107 et un 94 5 Rappels bibliographiques et obje
54. 2 109 1 115 2 113 7 Oo1 H31 Osp 153 1 168 6 169 1 165 1 175 8 H31 O30 H3 gt 104 1 104 6 104 6 102 1 103 3 S5 H32 O30 166 6 158 6 157 4 1042 14 8 Ci S5 Hzo 101 2 99 4 991 856 61 Ci S5 O30 102 7 103 2 108 2 69 9 59 4 Os O35 55 118 1 120 8 120 3 1149 1165 Cs C10 014 122 9 1490 118 7 117 6 117 9 Cs C10 0O12 112 2 1148 1150 1152 114 4 C10 012 O3g 113 6 115 4 1153 1150 1164 TAB 8 6 Valeurs des distances et des angles du complexe micha lien 1 de l tat de transition TS4 du sulfurane 2 de l tat de transition TSo 4 et de l interm diaire sulfurane dissoci 4 dans le mod le quantique de site actif La g om trie est optimis e au niveau B3LYP 6 31G d 8 3 M canisme Ill 2 H 2e 213 Ordre de liaison 1 TSy_2 2 TSo 4 4 C1 55 1 04 1 03 1 03 1 08 1 02 S5 S37 0 21 0 46 0 49 0 72 0 87 Ce C10 0 99 0 97 0 96 0 96 0 96 C1o O12 1 14 1 94 1 96 1 42 1 38 C1o7 O 41 1 68 1 52 1 51 1 48 1 49 O12 H43 0 57 0 26 0 23 0 14 0 18 H13 O3s 0 13 0 46 0 49 0 59 0 54 S 37 O3g 0 88 0 61 0 59 0 32 0 15 37 C33 0 97 0 98 0 98 0 99 0 98 S 37 C39 0 97 0 98 0 99 0 99 1 00 Charge u a 1 TS 2 TSo 4 4 C 0 04 0 01 0 03 0 37 0 22 S5 0 79 0 64 0 61 0 33 0 24 Ce 0 40 0 42 0 40 0 49 0 44 Cio 0 71 0 73 0 73 0 83 0 79 O11 0 55 0 62 0 63 0 66 0 67 O12 0 59 0 68 0 69 0 73 0 70 Hu 0 38 0 40 0 40 0 41 0 40 C20 0 52 0 37 0 36 0 41 0 40 On 0 57 0 52 0 51 0 69 0 65 H22 0 31 0 30 0 29 0 46 0 31 O27 0 78
55. 28 1 25 O12 H13 1 02 1 25 1 44 O12 O38 2 62 248 2 51 C20 021 136 1 37 1 37 O21 H22 1 00 1 00 1 00 O21 O38 2 71 2 72 272 O21 H31 2 58 2 07 2 05 H2g O3g 1 83 1 83 1 82 S5 Sa7 2 97 2 61 2 58 S5 H32 2 39 2 64 2 67 H22 O3g 1 71 173 78 H13 O3g 1 61 1 10 1 08 0 98 S37 O38 1 63 1 79 1 82 1 64 937 C33 1 88 1 83 1 83 1 81 937 C39 1 88 1 83 1 83 1 81 Angle 1 TS12 2 DMSOH C1 S5 Sg 88 1 93 3 93 7 S5 S37 O3s 166 2 170 5 170 9 S37 038 H13 117 5 111 0 110 1 109 5 Osg H15 O12 172 0 172 5 172 6 C19 O12 H 13 1098 112 2 112 2 O11 C10 O12 1249 126 2 126 3 C20 021 H22 112 4 111 6 111 5 O21 H22 O38 172 4 169 7 169 7 C20 021 0O38 116 4 116 2 116 1 H22 O3s 837 102 0 956 95 6 C33 937 O3s 107 5 99 4 91 9 91 8 100 4 C39 937 O3s 107 5 110 8 95 1 94 5 100 4 C33 937 C39 95 8 99 1 100 9 101 1 102 6 O27 H28 O38 169 6 165 8 165 5 H2g O38 837 119 8 123 4 123 0 C29 O21 Hs1 96 9 108 2 109 1 O21 H31 O3o 153 1 168 6 169 1 H31 O3o H32 1041 1046 104 6 Ss H32 O39 166 6 158 6 1574 C1 85 Hs2 1012 99 4 99 1 C4 S5 Hso 102 77 103 2 103 2 O27 O38 S37 118 120 8 120 3 Ce C10 011 122 9 119 0 118 7 Ce C1o O12 112 2 1148 115 0 C19 O12 O3s 113 6 115 115 3 TAB 7 1 Valeurs des distances et des angles du complexe micha lien 1 de l tat de trans
56. 3 207 Hypoth se de travail 2 H 2e M canisme ll 209 Structure de l tat de transition TS 4 et de l interm diaire sulfurane dissoci 4 dans le mod le de SILE ip pm 211 Hypoth se de m canisme concert imagin pour la formation de l interm diaire acide sulf nique partir de l interm diaire sulfurane dissoci 215 Repr sentation sch matique des diff rents termes intervenant dans un champ de forces 231 Liste des tableaux 2 1 2 2 2 3 4 1 4 2 4 3 4 4 4 5 SCH 5 2 6 1 6 2 6 3 6 4 6 5 1 1 A 7 8 7 4 pes 7 6 7 7 8 1 8 2 8 8 8 4 8 5 8 6 8 7 8 8 8 9 A 1 Population initiale de quatre individus 35 R sultat de la s lection d individus 36 Cr ation d une nouvelle population d individus 38 G om trie optimis e d une mol cule d eau en PM3 et AM1 67 Energies d interaction et param tres structuraux du dim re de l eau 69 Energies d interaction et param tres structuraux du complexe UOX AZA 75 Energies d interaction et param tres structuraux du complexe UOX OXC 79 Energies d interaction et param tres structuraux du complexe UOx URA 81 Principales esp ces oxyg n es activ es 88 Structures de m thion
57. 3 1 Structure du code L algorithme g n tique que nous avons crit est un module Python nomm genetic py d en viron 1500 lignes Il comporte 9 classes d objets 3 objets et 1 fonction La figure 2 5 pr sente le diagramme UML simplifi de ce module Les classes Gene Chromosome Individual et Population repr sentent respectivement la structure d un g ne d un chromosome d un individu et d une population d individus Un g ne pos s de un attribut appel BinaryCode qui est une cha ne de caract res correspondant au code g n tique On d finit pour cet objet deux fonctions encode et decode respectivement pour coder et d coder le code g n tique Un chromosome est structur comme tant une liste de g nes Nous avons repr sent un individu par un objet contenant un chromosome et une valeur num rique d va 2 D veloppement d un algorithme g n tique de minimisation genetic py Gene Population BinaryCode SUR Ed Individual IndividualList m GenesList Chromosome encode e e sort append Evaluation decode copy copy append copy copy Ga Parameters Flags e GenesParameters AD here J random SelectionParameters Eegen ae Population ReproductionParameters History User i sys Options _
58. 312 313 314 315 316 Pople J A et Segal G A J Chem Phys 44 3289 3296 1966 Pople J A Beveridge D L et Dobosh P A J Chem Phys 47 2026 2033 1967 Pople J A Santry D P et Segal G A J Chem Phys 43 S129 S135 1965 Yang W Phys Rev Lett 66 1438 1441 1991 Allen M P et Tildesley D J Computer Simulations of Liquids Oxford Clarendon Press Oxford 1989 Leach A R Molecular Modelling Principles and Applications second edition Prentice Hall 2001 Rapaport D C The Art of Molecular Dynamics Simulations Cambridge University Press 2004 Lennard Jones J E Proc R Soc London A 106 463 477 1924 Patra M Karttunen M Hyv nen M T Falck E Lindqvist P et Vattulainen l Biophys J 84 3636 3645 2003 Ewald P P Ann Phys 369 253 287 1921 Cooley J W et Tukey J W Math Comput 19 259 301 1965 Verlet L Phys Rev 159 98 103 1967 Hockney R W et Eastwood J W Computer Simulations Using Particules McGraw Hill 1981 Gear C W Numerical Initial Value Problems in Ordinary Differential Equations Prentice Hall 1971 Berendsen H J C Postma J P M van Gunsteren W F DiNola A et Haak J R J Chem Phys 81 3684 3690 1984 Mehler E L et Guarnieri F Biophys J 77 3 22 1999 Demchuk E et Wade R C J Phys Chem 100 17373 17387 1996 Li H Robertson A D et Jensen J H Proteins 55 689 704 2004 R
59. 4 Complexe enzyme substrat sulfoxyde 151 E94HE2 DMS2120 Distance 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance a Distance Glu94 He2 DMSO O Y82HH DMS2120 Distance 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance b Distance Tyr82 H DMSO O Distance Y134HH DMS2120 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance c Distance Tyr134 Hy DMSO O FIG 6 9 Variation de la distance Glu94 He DMSO O a de la distance Tyr82 H DMSO O b et de la distance Tyr134 H DMSO O c en fonction du temps dans la simulation DMSO Cys GIuH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 152 6 Reconnaissance et ancrage du substrat C51SG DMS212S Distance 0 200 400 600 800 1000 0 2 4 6 8 H Temps ps Distance d Distance Cys51 S DMSO S C51SG Y197HH Distance A 0 200 400 600 800 1000 0 2 4 6 8 o Temps ps Distance e Distance Cys51 S Tyr197 Hy Distance W53NE1 DMS212CB 0 200 400 600 800 1000 0 2 4 6 8 H Temps ps Distance f Distance Trp53 Ne1 DMSO Cg FIG 6 9 suite Variation de la distance Cys51 S DMSO S d de la distance Cys51 Sy Tyr197 Hh e et de la distance Trp53 Ne DMSO Cj f en fonction du temps dans la simulation DMSO Cys GluH Les histogrammes
60. 400 600 0 2 4 6 8 Temps ps Distance A g Distance Trp53 Ne1 Sulf Ce1 rouge et Trp53 Ne1 Sulf Ce2 bleu 360 T T T 270 SUA51CB SUA51SG SUA51SD SUA51CE1 g E 5 180 2 9 Z 90 0 0 200 400 600 0 100 200 300 400 Temps ps Angle di dre h Angle di dre Sulf Cg Sulf S Sulf Ss Sulf Ce Y82HH E940E2 Y134HH E94OE2 Distance 0 200 400 600 Temps ps Distance i Distance Tyr82 Hy Glu94 Oec rouge et Tyr134 Hy Glu94 O bleu Fic 7 10 suite Variation des distances Trp53 Ne4 Sulf C et Trp53 Ne4 Sulf Ce2 g de l angle di dre Sulf Cg Sulf S Sulf Ss Sulf Ce h et des distances Tyr82 Hy Glu94 O 2 et Tyr134 Hy Glu94 Ox i en fonction du temps dans la simulation Sulf Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 188 7 Activation du substrat 7 4 Conclusions Cette tude a permis de caract riser l tape d activation du substrat sulfoxyde apr s son ancrage dans le site actif de l enzyme L hypoth se d une protonation du substrat semble la plus raisonnable mais nous avons constat que au sein du site actif l esp ce DMSOH n est pas stable et a tendance former une liaison S S caract re partiellement covalent avec la cyst ine catalytique L identification de l interm diaire sulfurane comme forme proton e du substrat nous am ne mo dif
61. 56 3 2 Structure d code 273 284 dia a Wa e wave EO RO we ELA ES aus 57 3 3 D roulement du docking 60 Ce chapitre pr sente le programme de docking mol culaire semi empirique croissance lin aire que nous avons d velopp en interfa ant l algorithme g n tique ALGOGEN d crit dans le chapitre pr c dent et le programme DIVCON Nous nous sommes attach s dans cette phase de d velop pement r aliser un programme de docking rigide plus simple mettre en oeuvre Apr s avoir d crit les sp cificit s de notre programme nous parlerons plus en d tail de la partie d veloppement informatique dans laquelle nous pr senterons sa structure Nous terminerons cette pr sentation par une description du fonctionnement du programme 56 3 Interface ALGOGEN DIVCON 3 1 Pr sentation g n rale Le programme de docking semi empirique croissance lin aire que nous avons d velopp com bine ALGOGEN pour la partie minimisation et DIVCON pour la partie nergie potentielle du systeme mol culaire Il r alise le docking d un ligand rigide dans le site actif rigide d une prot ine i e les g o m tries internes de la prot ine et du ligand sont gel es durant le processus Il a t d cid en outre que la position des atomes de la prot ine soit fixe La position et l orientation du ligand par rapport la prot ine sont ainsi optimis es en minimisant l nergie totale du syst me De ce fait
62. 68 4 Validation du programme ALGOGEN DIVCON de l nergie d interaction tendent tre plus faibles et plus rares Il est tout fait possible de pro longer l algorithme g n tique afin de s assurer de sa bonne convergence vers la structure optimale Nous avons v rifi avec succ s cette affirmation Energie d interaction kcal mol 0 100 200 300 400 500 G n rations FIG 4 1 Evolution de l nergie d interaction du dim re de l eau en fonction de la m thode semi empirique utilis e L nergie d interaction repr sent e chaque g n ration est celle correspondant la meilleure solution potentielle donn e par l algorithme g n tique Sur un plan structural nous observons une diff rence entre le dim re de l eau obtenu avec la m thode AM1 d une part et les m thodes PM3 et PM3 PIF d autre part La premi re nous donne une structure bifurqu e type Cev et la deuxi me une structure lin aire type Cs Ces deux structures sont pr sent es dans la figure 4 2 Cette diff rence de la structure du dim re en AM1 est connue La structure lin aire existe aussi en AM1 Elle se situe environ 6 kcal mol au dessus de la structure bifurqu e cas d une optimisation compl te de g om trie qui est celle de plus basse nergie Nous n observons pas de structure AM1 lin aire durant le processus de docking Cette remarque nous am ne penser que l algorithme g n tique utilis permet d atteindre pr f
63. 685 1975 Sch neich C et Bobrowski K J Am Chem Soc 115 6538 6547 1993 Bobrowski K et Sch neich C J Chem Soc Chem Comm 795 797 1993 Hiller K O Masloch B Goebl M et Asmus K D J Am Chem Soc 103 2734 2743 1981 284 165 166 167 168 169 170 171 172 178 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 BIBLIOGRAPHIE Asmus K D Acc Chem Res 12 436 442 1979 Miller B L Kuczera K et Sch neich C J Am Chem Soc 120 3345 3356 1998 Sch neich C Aced A et Asmus K D J Am Chem Soc 115 11376 11383 1993 Sch neich C et Bobrowski K J Phys Chem 98 12613 12620 1994 Mer nyi G Lind J et Engman L J Phys Chem 100 8875 8881 1996 Chu J W et Trout B L J Am Chem Soc 126 900 908 2004 Chu J W Yin J Wang D I C et Trout B L Biochemistry 43 1019 1029 2004 Richardson D E Regino C A S Yao H et Johnson J V Free Radic Biol Med 35 1538 1550 2003 Chao C C Ma Y S et Stadtman E R Proc Natl Acad Sci USA 94 2969 2974 1997 Taggart C Cervantes Laurean D Kim G McElvaney N G Wehr N Moss J et Levine R L J Biol Chem 275 27258 27265 2000 Sch neich C Arch Biochem Biophys 397 370 376 2002 Varadarajan S Yatin S Kanski J Jahanshahi
64. C Brown S T Gilbert A T Slipchenko L V Levchenko S V ONeill D P DiStasio Jr R A Lochan R C Wang T Beran G J Besley N A Herbert J M Lin C Y Van Voorhis T Chien S H Sodt A Steele R P Rassolov V A Maslen P E Korambath P P Adamson R D Austin B Baker J Byrd E F C Dachsel H Doerksen R J Dreuw A Dunietz B D Dutoi A D Furlani T R Gwaltney S R Heyden A Hirata S Hsu Cp Kedziora G Khalliulin R Z Klunzinger P Lee A M Lee M S Liang W Lotan l Nair N Peters B Proynov E l Pieniazek P A Rhee Y M Ritchie J Rosta E Sherrill C D Simmonett A C Subotnik J E Woodcock III H L Zhang W Bell A T et Chakraborty A K Phys Chem Chem Phys 8 3172 3191 2006 Ventura O N Coiti o E L Lled s A et Bertean J J Mol Struc THEOCHEM 187 55 68 1989 Csonka G l J Comput Chem 14 895 898 1993 Csonka G I et ngy n J G J Mol Struc THEOCHEM 393 31 38 1997 Bernal Uruchurtu M I Martins Costa M T C Millot C et Ruiz L pez M F J Comput Chem 21 572 581 2000 Bernal Uruchurtu M et Ruiz L pez M F Chem Phys Lett 330 118 124 2000 Harb W Bernal Uruchurtu M et Ruiz L pez M F Theor Chem Acc 112 204 216 2004 Monard G Bernal Uruchurtu M l van der Vaart A Merz Jr K M et Ruiz L pez M F J Phys Chem A 109 3425 3432 2005 Wang B Raha K Liao N P
65. Cg est sup rieure 5 clairement le site de reconnaissance hy drophobe n est pas combl Nous consid rons pr sent les interactions entre les r sidus du site actif Durant la premi re moiti de la simulation nous observons une liaison hydrog ne entre Hy de Cys51 et O 2 de Glu94 Fig 6 6 g avec une distance de 2 pr sentant des fortes fluctuations Pendant la m me p riode 136 6 Reconnaissance et ancrage du substrat les oxyg nes O et Oc de Glu94 forment des liaisons hydrog ne fortes avec les hydrog nes Hy des r sidus Tyr82 et Tyr134 Fig 6 6 h et 6 6 i permettant la stabilisation de la charge n gative port e par Glu94 Apr s 500 ps de simulation toutes ces interactions deviennent plus faibles ou sont rompues pour certaines Linteraction entre Cys51 et Glu94 est plus ponctuelle et moins longue en dur e Nous retrouvons donc globalement les interactions que nous avons d crites dans le cas de l enzyme libre pour ce m me tat de protonation Free CysH Glu A partir de 500 ps le substrat se situe dans le solvant et donc il n a plus d influence sur les r sidus du site actif Nous v rifions ce changement de comportement dans l analyse de l angle di dre de Cys51 autour de la liaison Cg S Fig 6 6 f dont les variations sont corr l es la distance Cys51 Hy Glu94 O L analyse de la solvatation de Cys51 et Glu94 Fig 6 6 k et 6 6 1 montre que le nombre de mo l cules d eau autour de ces
66. Distances Tyr82 H DMSOH O Tyr134 Hn DMSOH O et Tyr134 Hy Cys51 S dans DMSOH Cys Glu ee 178 suite Distances Trp53 Ne DMSOH C Trp53 Ne DMSOH Cg angle Cys51 S DMSOH S DMSOH O et angle di dre Cys51 Cg Cys51 S DMSOH S DMSOH Og dans DMSOH Cys SGI ae ee D M os dee A 179 Nomenclature des atomes du r sidu sulfurane 180 TABLE DES FIGURES 275 7 10 Distances Sulf HO Glu94 O Sulf HO Glu94 02 et angle di dre Glu94 Cg Glu94 C Glu94 Cs Glu94 O dans Sulf Glu 185 7 10 suite Distances Sulf Oc Tyr82 Hy Sulf Oc Tyr134 Hq et Sulf S Tyr197 Hy dans Sulf Glu 186 7 10 suite Distances Trp53 Ne Sulf Ce1 Trp53 Ne1 SulfCe2 Tyr82 Hn Glu94 Oc2 Tyr134 Hy 7 11 8 1 8 2 8 3 8 4 8 5 8 6 8 7 8 8 A 1 Glu94 Oe et angle di dre Sulf Cg Sulf Sy Sulf Ss Sulf Ce dans Sulf Glu 187 M canisme d activation de l tape r ductase du m canisme catalytique 188 Hypoth se de travail Transfert d un groupement OH M canismel 190 Structures A TSa p B TSBcetC 193 Structure de l interm diaire 3 198 Hypoth se de travail 1 H 1e M canisme ll 200 Structure de l interm diaire sulfurane quatorial dissoci dans le mod le de site actif
67. H1 CT ss H1 CT H1 O C N C N CT 42 400 35 000 80 000 50 000 109 34 109 50 122 90 121 90 ce s6 ce ss s6 ce CT CT ss CT C O 90 000 61 8000 61 100 80 000 Angle d quilibre deg 100 00 90 00 112 69 120 40 Angle N CT CT N CT C Constante de force kcal mol deg 80 000 63 000 Angle Constante de force kcal mol deg Angle d quilibre deg Angle Constante de force kcal mol deg Angle d quilibre deg Angle Constante de force kcal mol deg Angle d quilibre deg Angle Constante de force kcal mol deg Angle d quilibre deg 109 70 110 10 Angle di dre O C N CT O C N x CT C N H N CT C Constante de force kcal mol 10 500 2 000 2 500 1 100 Phase rad T 0 00 T T P riodicit 2 1 2 2 Angle di dre C N CT CT C N CT C N CT x H1 CT C O Constante de force kcal mol 0 530 0 200 0 000 0 800 Phase rad T T 0 00 0 00 P riodicit 2 1 2 1 Angle di dre N CT C N CT CT C N CT C ho oh s6 Constante de force kcal mol 0 750 0 070 0 000 9 500 Phase rad 0 00 0 00 0 00 T P riodicit 1 2 2 1 Angle di dre H1 ce s6 x CT CT x H1 CT ss s6 CT ss s6 Constante de force kcal mol 0 144 0 156 0 333 3 067 Phase rad 0 00 0 00 0 00 T P riodicit 3 3 3 2 TAB 7 7 Param tres du champ de forces du r sidu sulfurane suite potentiels d angle de valence et d angle di dre en fonction du type de l atome Le symbole x repr sente n importe quel type d atome 7 3 Dynamique mol culaire du substrat activ
68. I Schreiber V M Shurukhina A V et Spevak V N J Mol Struct 605 221 226 2002 Dixon R W et Kollman P A J Comput Chem 18 1632 1646 1997 Cardey B et Enescu M Chem Phys Chem 6 1175 1180 2005 Cardey B et Enescu M J Phys Chem A111 673 678 2007 Jalbout A F Chem Phys Lett 340 571 580 2001 Jursic B S J Mol Struct THEOCHEM 452 145 152 1998 McKee M L J Phys Chem 97 10971 10976 1993 Turecek F J Phys Chem 98 3701 3706 1994 Wang B Hou H et Gu Y J Mol Struct THEOCHEM 505 241 246 2000 Aloisio S Chem Phys 326 335 343 2006 Barone V et Cossi M J Phys Chem A 102 1995 2001 1998 Cossi M Rega N Scalmani G et Barone V J Comput Chem 24 669 681 2003 Fu Y Liu L Yu H Z Wand Y M et Guo Q X J Mol Struct THEOCHEM 127 7227 7234 2005 Trasatti S Pure Appl Chem 58 955 966 1986 Forni L G et Willson R L Biochem J 240 897 903 1986 Vorontsov A V Russ Chem Rev 77 909 926 2008 Wood P M FEBS Lett 124 11 14 1981 Stewart J J P Review in Computational Chemistry In Vol 1 K B Lipkowitz and D B Boyd ed VCH New York 1990 Chapter 2 pages 45 81 Zerner M C Review in Computational Chemistry In K B Lipkowitz and D B Boyd ed VCH New York 1991 Chapter 8 pages 313 365 299 300 301 302 303 304 305 306 307 308 309 310 311
69. J Comput Chem 17 1633 1644 1996 Perrin D D Dempsey B et Serjeant E P pK Prediction for Organic Acids and Bases Chapman amp Hall London 1981 Li H Robertson A D et Jensen J H Proteins 61 704 721 2005 10 11 12 13 Bas D C Rogers D M et Jensen J H Proteins 2008 Davies M N Toseland C P Moss D S et Flower D R BMC Biochemistry 7 18 2006 Stanton C L et Houk K N J Chem Theory Comput 4 951 966 2008 Kollman P A Massova l Reyes C Kuhn B Huo S Chong L Lee M Lee T Duan Y Wang W Donini O Cieplak P Srinivasan J Case D A et Cheatham Ill T E Acc Chem Res 33 889 897 2000 Kuhn B et Kollman P A J Med Chem 43 3786 3791 2000 Huo S Massova I et Kollman P A J Comput Chem 23 15 27 2001 Wang J Kang X Kuntz D et Kollman P A J Med Chem 48 2432 2444 2005 Mobley D L Graves A P Chodera J D McReynolds A C Shoichet B K et Dill K A J Mol Biol 371 1118 1134 2007 Feliu Maseras K M J Comput Chem 16 1170 1179 1995 Humbel S Sieber S et Morokuma K J Chem Phys 105 1959 1967 1996 Matsubara T Sieber S et Morokuma K Int J Quant Chem 60 1101 1109 1996 Svensson M Humbel S Froese R D J Matsubara T Sieber S et Morokuma K J Phys Chem 100 19357 19363 1996 Svensson M Humbel S et Morokuma K J Chem Phys 105 3654 3661 1996
70. J P Nat Struct Biol 4 947 952 1997 Retailleau P Colloc h N Vivar s D Bonnet F Castro B Hajji M E Mornon J P Monard G et Prang T Acta Cryst D 60 453 462 2004 Gabison L Prang T Colloc h N Hajji M E Castro B et Chiadmi M BMC Struct Biol 8 32 2008 Colloc h N Sopkova de Oliveira Santos J Retailleau P Vivar s D Bonnet F Langlois d Estainto B B Gallois B Brisson A Risso J J Lemaire M Prang T et Abraini J H Biophys J 92 217 224 2007 Colloc h N Poupon A et Mornon J P Proteins 39 142 154 2000 Case D Darden T Cheatham III T Simmerling C Wang J Duke R Luo R Merz K Pearlman D Crowley M Walker R Zhang W Wang B Hayik S Roitberg A Seabra G Wong K Paesani F Wu X Brozell S Tsui V Gohlke H Yang L Tan C Mongan J Hornak V Cui G Beroza P Mathews D Schafmeister C Ross W et Kollman P AMBER 9 University of California San Francisco 2006 Duan Y Wu C Chowdhury S Lee M C Xiong G Zhang W Yang R Cieplak P Luo R Lee T Caldwell J Wang J et Kollman P J Comput Chem 24 1999 2012 2003 BIBLIOGRAPHIE 283 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 Altarsha M Monard G e
71. Les liaisons entre le carbone Cg et le groupement NH d une part et le groupe CO d autre part sont remplac es par des liaisons C H de 1 de distance Le programme r cup re ensuite les param tres relatifs l algorithme g n tique 3 1 et au pro gramme DIVCON 3 2 La derni re instruction du script utilisateur est le lancement de la minimisa tion 4 par la partie AlgoGen Une premi re population d individus est cr e 5 Lors de la phase d valuation de cette population le chromosome de chaque individu est d cod et les variables sont transmises la partie Docking 6 1 Un syst me prot ine ligand est cr pour chaque individu 6 2 en effectuant une copie du syst me PROT et du syst me LIG Les trois derni res variables angles d Euler servent cr er un quaternion de rotation et on effectue la rotation du syst me LIG Les trois premi res variables cr ent ensuite un vecteur de translation des atomes de ce syst me Les deux syst mes PROT et LIG sont finalement fusionn s en un seul syst me transmis la partie Divcon pour l criture du fichier d entr e correspondant 6 3 Le nombre d valuations effectuer chaque g n ration est souvent important du fait de la taille de la population de l algorithme g n tique Aussi il est possible de distribuer l ensemble des calculs sur un ensemble de processeurs e g un cluster de PC Cette technique a t int gr e dans le programme de docking en combinai
72. RR TR een s 155 Le but de l tude pr sent e dans ce chapitre est de mod liser la reconnaissance du substrat sulfoxyde par l enzyme afin de d terminer la structure du complexe micha lien La probl matique abord e pr sente quelques difficult s qui sont li es principalement l tat de protonation des r si dus du site actif et leur influence vis vis de l ancrage du substrat Nous verrons que plusieurs tats de protonation sont envisageables sur la base des travaux exp rimentaux Nous aborderons chacun de ces cas la fois dans la mod lisation de l enzyme libre et dans celle du complexe micha lien 118 6 Reconnaissance et ancrage du substrat 6 1 Etat de protonation du site actif Le site actif de MsrA pr sente une faible proportion de r sidus poss dant des propri t s acido basiques Les travaux d Antoine et al 2 ont montr que deux d entre eux se r v lent tre fortement impliqu s dans le m canisme catalytique Cys51 cyst ine catalytique et Glu94 La connaissance de leur tat de protonation respectif la fois dans l enzyme libre et le complexe enzyme substrat est donc importante pour comprendre le m canisme de reconnaissance puis la r activit du syst me a Enzyme libre Par diff rentes titrations Antoine et al 9 ont obtenu une valeur de PK app de 9 5 pour Cys51 La d termination exp rimentale de la valeur de pK de Glu94 n a pas t possible dans les m mes app conditions Un
73. S est peu mobile comme le montre la variation de l angle di dre Hy C amp C5 S du r sidu Fig 6 5 c Nous constatons aussi que l extr mit de la chaine lat rale de Glu94 est peu mobile Fig 6 5 d Les atomes d hydrog ne Hy de Tyr82 et de Tyr134 forment une liaison hydrog ne assez faible avec Glu94 O Fig 6 5 e et 6 5 f La solvatation de ce r sidu est toujours relativement faible avec en moyenne 1 2 mol cules d eau proximit r sultats non montr s Dans cette simulation on observe une rigidification globale du syst me Cys51 forme une liai son hydrog ne stable avec Tyr197 Fig 6 5 b tandis que Glu94 reste en interaction quasi fixe Fig 6 5 d avec une mol cule d eau intercal e entre Cys51 et Glu94 Ainsi la protonation de Glu94 semble ad quate l int rieur du site actif car elle stabilise le mouvement de celui ci sans augmenter sa solvatation L augmentation de pK de Glu94 pr dite par PROPKA par rapport sa valeur en solution est ici confirm e par la d solvatation globale du r sidu observ e tout au long de la simulation Au contraire dans cette simulation Cys51 tend maximiser ses interactions avec des mol cules d eau ou avec Tyr197 Sa solvatation augmente Cela indique donc que Cys51 pr f re dans le site actif libre de l enzyme tre neutre plut t que d proton Ceci est en accord avec les r sultats exp rimentaux d Antoine ef al assignant a Cys51 un pK de 9 5 Les interaction
74. S37 et Osg provenant de la fonction sulfoxyde L or bitale LUMO Fig 7 5 b se pr sente comme une combinaison d orbitales atomiques p des atomes Ss S37 et Ogg de type o Pour comparaison nous avons trac les orbitales HOMO et LUMO de ce m me interm diaire sulfurane 2 en supprimant les atomes correspondant au r sidu Glu94 Fig 7 5 c et 7 5 d et i pour une structure de sulfurane optimis e en phase gazeuse Fig 7 5 e et 7 5 f La principale diff rence se situe au niveau de l orbitale HOMO En l absence du r sidu Glu94 nous n observons plus de d localisation de cette orbitale mol culaire sur les atomes S3 et Osg de la fonction sulfoxyde Notons que la suppression d un ou des deux r sidus tyrosine n a pas d influence sur la d localisation de cette orbitale mol culaire r sultats non montr s Enfin la figure 7 6 a pr sente l isosurface de densit lectronique p 0 05 de l interm diaire sulfurane 2 dans le mod le de site actif color e selon la valeur du potentiel lectrostatique rappe lons que la charge nette du syst me est 1 u a La couleur bleue correspond un potentiel n gatif de 0 2 V et la couleur rouge un potentiel positif de 0 2 V Le potentiel n gatif est essentiellement concentr au niveau des oxyg nes et en partie sur Ss En fait nous observons une distribution du potentiel en accord avec les charges ponctuelles calcul es L atome S37 q 0 56 u a pr sente 170 7 Activation du
75. SPWD toDir tmp tmpfs JOB_ID mkdir StoDir cp SPWD divcon in toDit cd toDir Run Divcon SHOME bin divcon mais Recupere le fichier divcon co StoDITdivooncout SfromDie rm fr StoDir t Tx quy divcon sub close Ecriture du fichier d entree DivCon divcon writeDivconFile concat Prot newLigand Soumission SGE import os osReturu os systemi gsub g juliet o bin sh cud divcon sub sh time sleep 1 Recuperation des evaluations IDLhist qj while len dirList time sleep 20 os system qstat u thiriot othList LOR es emp Dita AD and SEE print tmpDir Cey outFile open s divcon out tmpDir r except IOError othList append tmpDir ID else content outFile read outFile close if content indi TOTA TEME 100 IDList ID divcon readEnergy content Gec eraren a She s e ega else othList append tmpDir ID dirList othList for comp in couphist comp Result IDList comp CompID e La fonction prend en argument une liste d objets Computation compList Elle est four nie par l algorithme g n tique apr s l tape de d codage des individus Chaque objet de type Computation contient les valeurs d cod es dans la propri t Values et l valuation ren voyer l algorithme g n tique dans la propri t Result e Lalgorithme g n tique appelle la fonction ResultsGrabber lors de la demande des calculs d valuation et se met en attente de la fin d ex cution de
76. W Shao X et Maigret B J Mol Graph Model 20 313 328 2002 Morris R J Najmanovich R J Kahraman A et Thornton J M Bioinformatics 21 2347 2355 2005 Kahraman A Morris R J Laskowski R A et Thornton J M J Mol Biol 368 283 301 2007 Gabb H A Jackson R M et Sternberg M J E J Mol Biol 272 106 120 1997 Norel R Petrey D Wolfson H J et Nussinov R Proteins 36 307 317 1999 Inbar Y Schneidman Duhovny D Halperin 1 Oron A Nussinov R et Wolfson H J Proteins 60 217 223 2005 Feig M Onufriev A Lee M S Im W Case D A et Brooks III C L J Comput Chem 25 265 284 2004 Jain A N Curr Protein Pept Sc 7 407 420 2006 Lensink M F M ndez R et Wodak S J Proteins 69 704 718 2007 Robertson T A et Varani G Proteins 66 359 374 2007 B hm H J J Comput Aid Mol Des 12 309 323 1998 BIBLIOGRAPHIE 281 66 67 68 69 70 71 72 73 74 75 76 7T 78 79 80 Dixon S L et Merz K M J J Chem Phys 107 879 893 1997 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 Muegge l J Med Chem 49 5895 5902 2006 Strout D L et Scuseria G E J Chem Phys 102 8448 8452 1995 Goedecker S Rev Mod Phys 71 1085 1123 1999 Goedecker S et Scuseria G E Comp Sci Eng 5 14 21 2003 Shao Y Molnar L F Jung Y Kussmann J Ochsenfeld
77. al 20082 2 0 MsrB Neisseria gonorrhoeae 1L1D Lowther et al 2002250 1 85 Burkholderia pseudomallei 3CEZ Staker et al 2008 2 1 3CXK Lovell et al 2008 1 7 TAB 5 2 Structures de m thionine sulfoxyde r ductases d pos es la PDB En cours de publication 5 2 M thionine sulfoxyde r ductases 103 Dans les structures 3BQE 3CEZ et 3CXK les enzymes ont t cristallis es seules sous forme d enzyme libre Les autres structures pr sentent des ligands des modifications de l enzyme ou des interactions utiles la compr hension du m canisme catalytique de l enzyme 1FF3 Cysc51 a t modifi en S dim thylars nic cyst ine CAS 1FVA Un r sidu alanine appartenant un monom re voisin se retrouve l int rieur du site actif de l enzyme sous l effet de la cristallisation crystal packing 1FVG Une mol cule de dithiothr itol DTT est li e de fa on covalente Cysc51 et CysR198 1NWA Un r sidu m thionine appartenant un monom re voisin se retrouve l int rieur du site actif de l enzyme sous l effet de la cristallisation crystal packing 3BQF Oysc51 a t mut en s rine Un peptide MetSO est pr sent dans le site actif 3BQG Lacide sulf nique est form sur Cysc51 apr s diffusion de DMSO dans le cristal 3BQH Un pont disulfure est form entre Cysc51 et Cysp198 1L1D Une mol cule de cacodylate CAC est pr sente dans le site actif a Repliement et structure du site actif des MsrA La fi
78. avec la valeur de 21 2 kcal mol dans les travaux de Balta et al 6 Comme nous l avons d j dit cette structure est plus haute en nergie parce que l axe de la bipyramide n est pas occup e par les atomes les plus lectron gatifs L tat de transition TSA g se situe 25 4 kcal mol et traduit la difficult importante pour le r arrangement des orbitales de l atome de soufre central Sg Le deuxi me tat de transition TSg c permettant de former l interm diaire acide sulf nique C se situe 35 2 kcal mol 20 3 kcal mol relativement au sulfurane B Ces nergies d activation sug g rent que la formation de l acide sulf nique serait ventuellement possible partir d une structure sulfurane o le groupement S CH est en position quatoriale mais deviendrait inaccessible partir d une structure avec S CHs en position axiale Le r le que l environnement enzymatique peut jouer dans la diff rence d nergie entre les formes A et B du sulfurane va tre analys ensuite 196 8 R duction du substrat 8 1 3 Chemin de r action dans un environnement enzymatique mod le Cette seconde tude a pour but de transposer le chemin de r action dans l environnement enzy matique Nous discuterons de l existence ou pas des diff rents interm diaires ou tats de transition et de l influence ventuelle des r sidus du site actif Compte tenu des r sultats de l tude pr c dente nous voulons savoir principalement si l environnement enzy
79. avoir ac cept d tre ma tutrice de monitorat et de m avoir propos de poursuivre mon exp rience d enseignement par deux ann es a ATER Mes remerciements s adressent enfin mes amis et ma famille qui comme dans les coulisses d un th tre ont jou un r le tout aussi important que les autres dans la r alisation de mon travail de th se Je pense tout particuli re ment Nicolas aupr s duquel j ai trouv une pr sence plus que pr cieuse Je le remercie d avoir compris et apais mes angoisses et de m avoir montr un soutien ind niable J adresse un immense merci mes parents qui je d die ce manuscrit Ils n ont jamais h sit faire des sacrifices financiers pour me permettre de poursuivre mes tudes En acceptant et en soutenant mes choix durant mon parcours scolaire ils auront aussi su trouver la meilleure facon de m aider Pour tout cela je leur serai toujours reconnaissant Il est bien difficile de croire que tant de merveilles tant d astuces miraculeuses tant d ing niosit dans le monde soient l effet du hasard et de la chimie seulement La faim du tigre 1966 Ren Barjavel 1911 1985 Table des mati res Introduction objectifs 13 l D veloppement d un programme de docking mol culaire semi empirique croissance lin aire 19 1 Rappels bibliographiques et objectifs 21 1 1 Utilit des programmes de docking mol culaire 22 1 2 Principe de fonctionnement
80. avons crit 30 2 D veloppement d un algorithme g n tique de minimisation 2 1 M thodes de minimisation et atouts des algorithmes g n tiques Dans la litt rature il existe trois grandes cat gories de m thodes de recherche d un minimum i les m thodes n cessitant le calcul du gradient les m thodes num ratives et iii les m thodes al atoires Nous allons axer notre comparaison des m thodes de minimisation sur le crit re de la robustesse e l quilibre entre l efficacit rapport qualit du r sultat temps de calcul et la stabilit adaptation vis vis du probl me trait a M thodes avec gradient Ces m thodes tr s largement employ es sont r parties en deux sous cat gories les m thodes directes comme la m thode des gradients conjugu s ou BFGS99 qui recherchent le minimum en partant d un point initial et en se d pla ant dans la direction donn e par le gradient et les m thodes de type Newton Raphson indirectes qui recherchent le minimum en r solvant un syst me d quations non lin aires Bien que l efficacit de ces m thodes n ait plus besoin d tre d montr e elles ne peuvent convenir l utilisation souhait e dans le programme de docking D une part ces m thodes sont locales le minimum qu elles cherchent se situe dans le voisinage du point courant Elles ne permettent pas de v rifier que le minimum global a t atteint D autre part et plus particuli
81. celle ci pour poursuivre la minimisa tion L criture de cette fonction repose ainsi sur une boucle interne while une fois que tous les calculs d valuation ont t r alis s les r sultats peuvent tre retourn s B 4 6 D finition de la fonction de strat gie d volution La fonction de strat gie d volution SErategy indique le processus par lequel la population de la nouvelle g n ration est construite partir des individus s lectionn s Exemple D finition de la fonction unknownSurvivor issue de l objet ga permettant de r int grer les individus s lectionn s et d obtenir des individus originaux dans la nouvelle population def unknownSurvivor self def isReallyNew ind 260 B Manuel utilisateur d ALGOGEN for individual in ga Population if ind Chromosome BinaryCode individual Chromosome BinaryCode return False return True oldPopulationSize parameters PopulationSize selectedPopulation ga select self Population parameters PopulationSize oldPopulationSize parameters TournamentNumber newPopulation ga reproduce selectedPopulation ga Population selectedPopulation copy while parameters PopulationSize for individual in newPopulation if not ga History has key individual Chromosome BinaryCode and _isReallyNew individual ga Population append individual parameters PopulationSize 1 newPopulation ga reproduce selectedPopulation parameters PopulationSize oldPopulationSize e La
82. complexe de l enzyme avec les diff rents substrats inhibiteurs dont nous connaissons la structure tridimensionnelle Ces ligands sont la 8 azaxanthine AZA l acide oxonique OXC et l acide urique URA repr sent s dans la figure 4 5 La structure utilis e pour l urate oxydase est celle du complexe UOx AZA 21BA Nous avons effectu le docking de ces ligands selon une approche semi empirique croissance lin aire avec PM3 et PM3 PIF 72 4 Validation du programme ALGOGEN DIVCON Arg176 b FIG 4 4 Structure de l urate oxydase d Aspergillus flavus 2IBA et de son site actif a Structure tridimensionnelle de l urate oxydase Le t tram re de l urate oxydase forme une structure de type T fold Tunnelling fold 17 Les h lices sont color es en violet les feuillets B en jaune et les coudes B en cyan L inhibiteur 8 azaxanthine en bleu indique la position des quatre sites actifs du t tram re b Site actif de l enzyme en complexe avec la 8 azaxanthine Le site actif se situe l interface de deux monom res Il est constitu des r sidus de Phe159 Arg176 Val227 Gin228 et Asn254 pour la premi re cha ne et de Lys10 Thr57 et Asp58 pour la seconde Les principales liaisons hydrog ne entre l inhibiteur et les r sidus du site actif sont indiqu es en pointill s 4 2 Docking dans une prot ine 73 C C WK E n gf 7 P 1 H Og 8 azaxanthine 3 anion AZA o Acide oxonique 1 dianion OXC
83. conjonction avec Glu94 une double mutation du type Y82F E94Q ou Y134F E94Q devrait avoir un effet plus important sur la catalyse enzymatique keat que sur la reconnaissance Ky e marquage isotopique tudes d j r alis es compl ter pour identifier la provenance de l atome d oxyg ne sur l interm diaire acide sulf nique sulfoxyde ou solvant De mani re plus g n rale on peut remarquer qu un effort th orique cons quent est n cessaire si l on veut mieux comprendre la chimie du soufre au niveau biologique dont seulement quelques aspects ont t abord s ici Cet effort concerne la fois les approches dites classiques d veloppe ment de champs de forces adapt s et les m thodes quantiques dont relativement peu d applica tions de haut niveau ont t consacr es cet l ment aux propri t s lectroniques singuli res Troisi me partie Annexes Annexe A M thodologie Sommaire A 1 M thodes semi empiriques croissance lin aire 227 A 2 M canique et dynamique mol culaires 230 A 3 PROPKA Pr diction des valeurs de pKa des r sidus d une prot ine 239 Dans cette annexe nous pr sentons quelques d tails sur la m thodologie employ e dans nos calculs Nous parlerons essentiellement des approches semi empiriques croissance lin aire utili s es dans la partie de notre th se puis des m thodes de m canique et dynamique mol culaires
84. d environ 3 Cette interaction a pour cons quence d affaiblir de facon importante la liaison entre le soufre et l oxyg ne du DMSO L ordre de cette liaison vaut 0 88 compar la valeur de 1 28 dans le DMSO isol en phase gazeuse DMSO Au niveau g om trique l allongement de la distance S O de 1 51 1 63 respectivement entre DMSO et 1 est significative et confirme l affaiblissement de la liaison Par cons quent les atomes de soufre S37 et d oxyg ne Osg portent une charge relativement lev e passant de 0 28 0 74 u a pour S37 et de 0 42 0 54 u a pour Osg entre DMSO et 1 respectivement La forte liaison hydrog ne entre O38 du DMSO et Hag port par Glu94 se traduit par un ordre de liaison non n gligeable de 0 13 entre ces deux atomes La liaison de ce proton avec O42 de Glu94 est affaiblie en cons quence avec un ordre de liaison passant de 0 72 0 57 respectivement entre le mod le de glutamate proton GluH et le complexe micha lien 1 Une analyse de la fonction d onde du complexe micha lien 1 dans le mod le de site actif a t r alis e Le trac des orbitales HOMO et LUMO est pr sent dans la figure 7 3 L orbitale occup e de plus haute nergie HOMO Fig 7 3 b est port e principalement par l atome de soufre Ss cor respondant au r sidu Cys51 catalytique sous la forme d une orbitale de type p dirig e selon l axe S O du DMSO Une petite d localisation de cette orbitale mol culaire est observ e
85. de caract res correspondant au code hexad cimal du chromosome Chromosome HexCode string decode D codage du chromosome e La m thode decode retourne une liste contenant le d codage des variables cod es par le chromosome Chromosome decode list recode index newReal Recodage d un g ne du chromosome e La m thode recode recode un g ne du chromosome rep r par son index index avec une nouvelle valeur newReal lt Chromosome gt recode lt int gt lt float gt copy Copie du chromosome e La m thode copy retourne une copie du chromosome lt Chromosome gt copy gt Chromosome B 3 5 Propri t s et m thode des objets Gene BinaryCode Code binaire du g ne e La propri t BinaryCode retourne la cha ne de caract res correspondant au code binaire du g ne lt Gene gt BinaryCode gt lt string gt HexCode Code hexad cimal du g ne e La propri t HexCode retourne la chaine de caract res correspondant au code hexad cimal du g ne lt Gene gt HexCode gt lt string gt copy Copie du g ne e La m thode copy retourne une copie du g ne lt Gene gt copy gt Gene B 4 D finition de fonction 257 B 4 D finition de fonction B 4 1 D finition de la fonction d valuation La fonction d valuation EvaluationFunction doit prendre en argument un tuple des n variables cod es par le chromosome et renvoyer la valeur prise par
86. de leur valuation Population sort i copy Copie de la population e La m thode copy retourne une copie de la population lt Population gt copy gt Population B 3 3 Propri t s et m thodes des objets Individual Evaluation Evaluation de l individu e La propri t Evaluation retourne la valeur d valuation de l individu lt Individual gt Evaluation gt float Chromosome Chromosome de l individu e La propri t Chromosome retourne un objet Chromosome correspondant au chromosome de l individu Voir section B 3 4 lt Individual gt Chromosome gt Chromosome e On acc de un g ne du chromosome par l interm diaire de son index On obtient alors un objet Gene Voir section B 3 5 lt Individual gt Chromosome lt int gt gt Gene e Le nombre de g nes contenus dans le chromosome est obtenu par la fonction len len Individual Chromosome gt int copy Copie de l individu e La m thode copy retourne une copie de l individu lt Individual gt copy gt lt Individual gt 256 B Manuel utilisateur d ALGOGEN B 3 4 Propri t s et m thodes des objets Chromosome BinaryCode Code binaire du chromosome e La propri t BinaryCode renvoie la cha ne de caract res correspondant au code binaire du chromosome lt Chromosome gt BinaryCode gt lt string gt HexCode Code hexad cimal du chromosome e La propri t HexCode renvoie la chaine
87. demand que C et Cg d une part et que Hot Haz Has Hey Hga et Hg3 d autre part portent la m me charge Les charges port es par les atomes de soufre et d oxyg ne valent respectivement 0 27 et 0 47 u a Le moment dipolaire r sultant de la distribution de charge vaut 4 59 D un peu sup rieur la valeur de 4 00 D obtenue avec un calcul de haut niveau B3PW91 6 311 G 3df 3dp en phase gazeuse 8 b Pr paration des simulations La structure de l enzyme utilis e pour chacune des simulations est celle de MsrA d Escherichia coli d termin e par cristallographie X par T te Favier et al et d pos e la Protein Data Bank sous le code 1FF37 6 Cette structure a t obtenue une r solution de 1 9 partir d un seul cristal une temp rature de 100 K La cristallisation a t r alis e pH 7 tampon cacodylate 0 1 M en pr sence de 0 35 M de sulfate d ammonium et de 20 de PEG par diffusion de vapeur 277 K La cyst ine catalytique en position 51 de cet chantillon a t modifi e en S dimethylars nic cyst ine CAS Pour rappel ce r sidu permet de cr er une esp ce analogue au substrat sulfoxyde naturel 122 6 Reconnaissance et ancrage du substrat Atome Cx Hx S O Type CT H1 s4 O Masse a m u 12 0 1 0 32 1 16 0 Charge a u 0 2891 0 1301 0 2719 0 4742 o A 1 9080 1 3870 2 000 1 6612 E kcal mol 0 1094 0 0157 0 2500 0 2100 Liaison CT H1 SCT s4 O Constante de force kcal mol
88. des cellules au stress oxydant induit par H202210 Des travaux de m me type sur les cellules pith liales de la lentille humaine ont montr que la classe d enzyme MsrB joue le m me r le que la classe MsrA La r duction de l expression du g ne msrB par l utilisation de petits ARN interf rants conduisant une diminution de la viabilit des cellules et de leur r sistance au stress oxydant b R gulation de la fonction des prot ines L oxydation des r sidus m thionine en sulfoxydes de m thionine peut entra ner la modulation de l activit biologique d une prot ine La possibilit qu offrent les Msr de r duire ces r sidus oxyd s a conduit proposer que ce m canisme d oxydation r duction peut constituer dans une certaine mesure une voie de r gulation Dans une tude in vitro la r paration par MsrA ou MsrB d une calmoduline oxyd e a entrain la d sinhibition de la fonction activatrice de cette enzyme vis vis de la Ca ATPase Cet exemple illustre bien l implication du cycle Oxydation des Met par EOA R duction des MetSO par Msr dans des m canismes r dox r gulant le m tabolisme cellulaire i e une accumulation de calmoduline oxyd e lors d un stress oxydant s v re entraine une r pression du m tabolisme de la cellule afin de diminuer la g n ration d EOA c Vieillissement cellulaire Le vieillissement cellulaire est caract ris par l accumulation de prot ines oxyd es dans les cel lules
89. droite montrent la r partition des valeurs pour chacune des courbes 6 4 Complexe enzyme substrat sulfoxyde 153 180 T T T T T C51CB C51SG DMS212S DMS212CB S 90 2 E 5 0 E D 90 180 0 200 400 600 800 1000 180 90 0 90 180 Temps ps Angle di dre g Angle di dre Cys51 Cg Cys51 S DMSO S DMSO Cg 180 T T T T T S 90 e E o 0 2 4 9 90 C51HA C51CA C51CB C51SG J 180 0 200 400 600 800 1000 180 90 0 90 180 Temps ps Angle di dre h Angle di dre Cys51 Ho Cys51 Co Cys51 Cg Cys51 Sy 10 t E 8 2 o 6 TD D A 3 N oO o 2 0 0 200 400 600 800 1000 0 2 4 6 8 10 Temps ps Mol cules de solvant i Nombre de mol cules d eau proximit du r sidu Cys51 distance lt 3 4 FIG 6 9 suite Variation de l angle di dre Cys51 Cg Cys51 S DMSO S DMSO Cj g de l angle di dre Cys51 Ha Cys51 Ca Cys51Cp Cys51 Sy h et du nombre de mol cules d eau valeurs moyenn es sur 10 ps dans la solvatation de Cys51 i en fonction du temps dans la simulation DMSO Cys GIuH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 154 6 Reconnaissance et ancrage du substrat C51SG DMS212S DMS2120 0 200 400 600 800 1000 0 60 120 180 Temps ps Angle j Angle Cys51 Sy DMSO S DMSO O Distance Y82HH E940E1 Y134HH E940E1 0 200 400 600 800
90. du syst me et met jour les coordonn es des atomes e origin place l origine du rep re orthonorm du syst me sur un atome donn et met jour les coordonn es des atomes e rot effectue la rotation de tous les atomes du syst me par un quaternion donn e updateCoord effectue la translation de tous les atomes du syst me par rapport un nouveau centre g om trique du syst me e copy renvoie une copie du syst me La classe Docking permet la manipulation des syst mes mol culaires et le traitement du processus de docking Elle poss de un attribut Systems qui garde en m moire les structures des syst mes mol culaires Plusieurs fonctions ont t ajout es ce module dont les principales sont e dist calcule la distance entre deux atomes e concat fusionne deux syst mes d atomes e cut limine les atomes du syst me n tant pas contenu dans une sph re de coupure e rdPDB cr e un syst me d atomes partir d un fichier PDB e visualPDB et visualXYZ crit un fichier PDB ou XYZ correspondant un syst me d atomes e grabResults d crit la facon dont les calculs d nergie potentielle sont effectu s e controlDistance v rifie la structure des syst mes valuer e getCharge calcule la charge totale des syst mes Ce module importe un autre module Python appel quaternion py que nous avons crit pour g rer les transformations relatives aux syst mes d atomes 3 2
91. duction L analyse g om trique et lectronique des esp ces impliqu es montre qu elles sont relativement bien stabilis es par les r sidus du site actif notamment par plusieurs liaisons hydrog ne et par des interactions lectrostatiques Il peut para tre tonnant qu un r sidu tyrosine le ph nol dans notre mod le puisse jouer le r le de catalyseur acide c est dire de donneur de proton permettant la dissociation de la liaison S O compte tenu du pK de ce type de groupement PKatyr 10 9 Nos r sultats sugg rent que ce r le est possible gr ce deux facteurs sp cifiques au syst me consid r D une part on sait que le sulfurane a une relative facilit se dissocier en ions sulfuranyle S S et hydroxyle OH 6 condition de stabiliser convenablement les produits du processus solvant donneurs de proton D autre part le processus conduit la formation d une paire d ions sulfuranyl ph nolate s par s par une mol cule d eau dont l interaction coulombienne contribue notamment la stabilisation de l ensemble Comme nous l avons dit au chapitre 5 la mutation des deux r sidus Tyr82 et Tyr134 produit un effet majeur sur la cin tique de r duction la mutation d une seule conduisant un ef fet mod r On peut donc penser que l une ou l autre des tyrosines participe activement dans le processus et nos calculs fournissent une possible explication des ph nom nes observ s A partir de l interm diair
92. e7 209 8 3 M canisme Ill 2H 2e 8 3 1 Hypoth se de travail Dans les travaux de Balta et al 2 le m canisme de formation de l acide sulf nique partir d un interm diaire sulfurane en solution de DMSO a t d crit comme un processus assist par un donneur de proton qui implique protonation du groupement OH avec formation d une mol cule d eau et ji attaque de l ion sulfuranyle par cette mol cule d eau avec formation d un acide sulf nique et un sulfure Le processus est sch matis dans la figure 8 6 Globalement donc la r duction du DMSO selon ce m canisme peut tre d crit comme un processus deux protons et deux lectrons 2H 2e A i H HA j o OH S S OH S S we e 2 Zz z FIG 8 6 Hypoth se de travail envisag e pour la formation de l interm diaire acide sulf nique partir de l interm diaire sulfurane dans le site actif de enzyme M canisme III 2 H 2e La liaison S O du sulfurane est dissoci par protonation du groupement OH sous catalyse acide compos A H avec formation d une mol cule d eau Une mol cule d eau attaque ensuite l ion sulfuranyle hydrolyse pour conduire l acide sulf nique et le sulfure 8 3 2 Chemin de r action dans un environnement enzymatique mod le Afin d tudier un m canisme de ce type dans l enzyme nous allons consid rer nouveau le mo d le quantique de site actif voir page 160 utilis pr c demment pour d
93. es et les valeurs rapport es par Balta et al en solution l analyse de ce m canisme un niveau de th orie plus pouss ne nous a pas paru pertinent 198 8 R duction du substrat Fic 8 3 Structure de l interm diare 3 obtenu par optimisation d une structure sulfurane avec le groupement S CH3 en position quatoriale dans le mod le quantique de site actif au niveau B3LYP 6 31G d 8 1 M canisme Transfert d un groupement OH 199 Distance 3 B C4 S5 1 60 Oo27 Hog 1 82 O O 242 2 18 Ce C10o 4 83 C40 O12 1 00 mS C40 O11 0 99 0 97 Oiw His 2 79 2 07 O12 O3s 1 84 1 83 C20 O2 1 83 1 92 O21 H22 4 28 Angle 3 B C4 85 837 j 104 8 104 0 T j 126 6 S5 S37 O38 5 101 2 94 8 C20 021 H31 125 8 S 37 O3s H13 73 4 101 8 O21 H31 030 168 6 Os His O s 176 9 Hsi Oss Hss 102 2 C10 012 H13 j 128 0 S5 H32 O39 e 35 1 O441 C10 O12 y 127 5 Ci S5 H32 i 56 2 C20 021 H22 124 5 Ci S5 H30 j 50 3 O 24 H22 O3s y 167 8 O 7 O3s 837 124 4 Ordre de liaison 3 B C1 55 0 97 0 88 Ce C10o 1 50 C40 O11 0 66 0 80 O12 H13 0 04 0 38 937 C33 0 96 0 82 3 B Cy 0 84 S5 0 39 Ce 0 89 C40 0 46 O14 0 39 O12 0 59 0 38 H13 0 58 0 30 Co 0 76 0 71 Os 0 66 0 60 H22 E TAB 8 2 Valeurs des distances des angles des ordres de liaison et des charges de l interm diaire sulfu rane 3 dans le mod le quantique de site actif En co
94. est la seule alternative possible la structure A si l on se r f re aux travaux de Balta et al Un sulfurane dans lequel l atome d oxyg ne serait en position quatoriale conduirait la dissociation de la mol cule Dans la structure obtenue ici B l change du groupement S CH3 par un groupement moins lectron gatif CH3 induit des perturbations importantes dans la structure du syst me La distance S5 Sg vaut 2 18 A soit une diminution de 0 25 par rapport au sulfurane A La distance Sg O augmente de 1 87 2 07 L ordre de liaison augmente de 0 61 0 88 pour Ss Sg et diminue de 0 53 0 38 pour Sg O7 Ceci s explique par le fait que la liaison S5 Se situ e dans le plan quatorial est maintenant d crite par une orbitale mol culaire liante Les charges des deux atomes de soufre et de l atome d oxyg ne sont tr s diff rentes dans les sulfuranes A et B Respectivement ces charges sont pass es de 0 55 0 17 u a pour Ss de 0 55 0 30 u a pour Sg et de 0 66 0 71 u a pour O7 Un transfert de densit lectronique relativement important s est donc produit lors du passage de la position axiale la position quatoriale du groupement S CH3 Celui ci va tre accentu dans l tape suivante 8 1 M canisme Transfert d un groupement OH 195 d Etat de transition TSg c Le deuxi me tat de transition TSg c Fig 8 2 d de ce m canisme permet de passer du sulfu rane B l acide sulf nique C Il est
95. et de visualisation du docking sont crits en fin de chaque cycle de reproduction 10 Une fonctionnalit d velopp e dans ce programme permet d liminer lors de la phase de repro duction de l algorithme g n tique les individus nouvellement produits dont on sait qu il ne seront pas de bonnes solutions au probl me de docking Il s agit de la fonction cont rolDistance du module docking py Si l individu en question correspond un syst me dans lequel un atome du ligand se situe moins de 0 75 d un atome de la prot ine il est rejet et un nouvel individu est produit Cette technique permet de ne pas effectuer de calculs d nergie inutiles Plusieurs tests ont t r alis s afin de valider le d veloppement du logiciel de docking semi empirique croissance lin aire ALGOGEN DIVCON Les r sultats sont report s dans le chapitre suivant Un manuel d utilisation report en annexe C de ce manuscrit est fourni avec le logiciel Il regroupe la liste des fonctions et un exemple de script de lancement Chapitre 4 Validation du programme ALGOGEN DIVCON Sommaire 4 1 Structure du dim re de l eau 66 4 2 Docking dans une prot ine 70 4 3 CONCIUSIONS ae aua Da ss de E eine BS Al das Sec dm 82 Le programme ALGOGEN DIVCON a fait l objet d une phase de validation dont les r sultats sont pr sent s dans ce chapitre Nous avons effectu diff rents
96. et le solvant DMSO la liaison S S est pass e de 2 410 2 727 et S O de 1 905 1 717 112 5 Rappels bibliographiques et objectifs pr figurant une possible dissociation du sulfurane entre les deux atomes de soufre L analyse des ordres de liaison en solution montre que S S 0 22 est plus faible que S O 1 24 Ainsi pour les deux processus de dissociation suivants CH3S S CHg OH CH3S S CH3 OH CH3S S CHg OH CH3S7 S CH3 OH on obtient une nergie libre de r action en solution continuum DMSO de 16 9 kcal mol pour la premi re et 2 7 kcal mol pour la deuxi me Ces r sultats sont mettre en confrontation avec les m mes processus de dissociation en milieu acide Le sous l influence d un donneur de proton CH3S S CH3 OH H 5 CH5S S CH3 H20 CH3S S CH3 OH H CHg3SH S CH3 OH o les nergies libres de r action sont de 21 3 et 14 1 kcal mol respectivement inversant donc la nature de la liaison pr f rablement dissoci e De ces r sultats il est donc possible de conclure que la stabilit du sulfurane 3 est tr s largement influenc e par les conditions de pH Un milieu acide ou la pr sence d un donneur de proton favorise la rupture de la liaison S O du sulfurane La derni re tape du m canisme est la formation d un acide sulf nique partir de l interm diaire sulfurane Cette tape est plus complexe mettre en oeuvre B
97. exclus de la population alors que les autres sont combin s pour g n rer de nouveaux individus Le processus de minimisation est illustr par la figure 2 2 Une population initiale d individus est d abord valu e puis les meilleurs individus sont s lectionn s et enfin une nouvelle population est cr e par reproduction de ces derniers Cette population est de nouveau valu e pour recom mencer un autre cycle appel cycle de reproduction Ainsi en r p tant plusieurs fois les op ra tions de s lection et de reproduction nous obtenons successivement des populations d individus qui convergent vers la solution optimale du probl me trait Pour chaque nouvelle g n ration produite il est possible d extraire le meilleur individu repr sentant la meilleure solution actuelle au probl me 2 2 Principe des algorithmes g n tiques 33 Population initiale Evaluation D Population s lectionn e Y S lection Population valu e e Reproduction Evaluation Y 7 Nouvelle population Meilleur individu Fic 2 2 Sch ma illustrant le processus de minimisation dans les algorithmes g n tiques Une population d individus repr sente les solutions potentielles d un probl me Par it ration du cycle de reproduction s lection reproduction valuation la population converge vers la solution optimale du probl me Le mat riau de base des algorithmes g n tiques
98. exemple d S lection La s lection est un des l ments les plus importants de tous les algorithmes g n tiques Elle d termine si chaque individu d une population donn e va pouvoir l guer une partie de son patrimoine g n tique la prochaine g n ration d individus L objectif principal de toutes les m thodes deve lopp es dans les algorithmes g n tiques est de favoriser le passage de ce patrimoine partir des meilleurs individus Ce passage est affect d une probabilit proportionnelle l valuation propre de chaque individu En d autres termes plus cette valeur est consid r e comme bonne plus il aura de chance d tre choisi et de donner naissance un individu meilleur Cet op rateur traduit la s lection naturelle de la th orie de l volution des esp ces de Darwin Plus un individu est adapt l envi ronnement qui l entoure plus il a de chance de survivre et de p renniser l esp ce 36 2 D veloppement d un algorithme g n tique de minimisation L op rateur de s lection peut tre construit le plus simplement possible en effectuant une s lection du type roue de la fortune roulette wheel selection o chaque individu i de la population est associ une surface de la roue proportionnelle sa probabilit p d tre s lectionn telle que o f xj est l valuation de l individu ji et n le nombre d individus de la population La figure 2 4 illustre la r partition de la roulette w
99. fonction ne prend pas d argument et ne renvoie rien e La population est s lectionn e par l interm diaire de la primitive de s lection select etla nouvelle population est obtenue par la primitive de reproduction _reproduce B 4 7 D finition de la fonction d affichage La fonction d affichage OutputFunct ion doit renvoyer une cha ne de caract res format e enregistrer sur le media de sortie Exemple D finition de la fonction printString pour afficher le num ro de g n ration les diff rents compteurs la liste des individus de la g n ration en cours le meilleur individu et son d codage def printString S RIE Strang qe Mugs Aaa string Generation s n ga Index g ring EE aan string Current evaluations 6d n ga CurrentEvaluationNumber string Total evaluations 6d n ga TotalEvaluationNumber string Individual history length 6d n len ga History BI dep In denm Strong Population Nm ga Population sort for individual in ga Population String repri iandividual n Sicilian UNE ESRI dial string repr ga BestIndividual n string nBest solution n n string str ga BestIndividual Chromosome decode 4 str iga BestIndivyidual Evaluation PEN return string B 5 Exemple de script de minimisation Nous reprenons l exemple de la minimisation de la fonction de Schwefel 3 variables avec 0 lt x lt 500 o figurent la plupa
100. g n ration pr c dente et des individus totalement nouveaux obtenus par reproduction Nous appliquons galement pour chacune des m thodes semi empiriques l approche Divide amp Conquer en divisant le syst me total en sous syst mes chacun tant constitu d une mol cule d eau c ur et de son environnement tendu 6 Chaque c ur est ainsi entour de deux r gions tampons de taille 4 et 2 respectivement Il a t montr que ces param tres d finissant chaque 4 1 Structure du dim re de l eau 67 sous syst me permettent une d termination relativement correcte des nergies semi empiriques de syst mes mol culaires trait s par l approche Divide amp Conquer 111 b Construction des syst mes mol culaires La g om trie d une mol cule d eau est pleinement optimis e par la m thode des gradients conju gu s au niveau AM1 et PM3 Le tableau 4 1 reporte les valeurs de distance et d angle des g o m tries optimis es en fonction de la m thode semi empirique utilis e La g om trie optimis e AM1 sert d crire la g om trie interne de chacune des deux mol cules d eau du dim re trait en AM1 De m me le dim re trait en PM3 et PM3 PIF est construit partir de la g om trie optimis e PM3 Il n est pas n cessaire d optimiser la g om trie d une mol cule d eau en PM3 PIF puisque cette m thode ne modifie que les fonctions d interaction coeur coeur intermol culaires i e les g om tries
101. grande en valeur absolue celle en PM3 Ce r sultat n est pas surprenant vis vis de ce qui a pu tre constat pour le dim re de l eau Tab 4 2 Dans ce syst me une seule liaison hydrog ne est pr sente et implique une diff rence d nergie de 1 5 kcal mol soit environ 40 de l nergie d interaction totale Consid rant l existence d un grand nombre de liaisons hydrog ne dans le syst me UOx AZA il est acceptable de constater cette grande diff rence d nergie entre PM3 et PM3 PIF Sachant que le syst me enzyme inhibiteur est charg 1 u a pour UOx et 1 u a pour AZA l nergie d interaction inclut l nergie due une interaction lectrostatique charge charge au premier ordre attractive Ainsi une petite d viation du centre de masse dans la partie enzyme entre petit et grand syst me conduit a fortiori une variation de l nergie d interaction Elle est d autant plus grande que dans notre cas ce centre de masse se situe l int rieur d une poche correspondant au site actif de l enzyme 78 4 Validation du programme ALGOGEN DIVCON 4 2 2 Docking de l acide oxonique dans le site actif de l urate oxydase L acide oxonique OXC est un autre inhibiteur comp titif connu de l urate oxydase Une struc ture tridimensionnelle de son complexe dans l enzyme a t r solue par cristallographie X en 2004 par Retailleau et al et d pos e la Protein Data Bank sous le code 1R4U l acide oxonique a une structur
102. i Distance Trp53 Ne DMSOH C rouge et Trp53 Ne DMSOH Og bleu 180 s 120 o D c T 60 C51SG DMH212S DMH2120 0 L 0 200 400 600 800 1000 0 60 120 180 Temps ps Angle K Angle Cys51 S DMSOH S DMSOH O 360 S 270 B E 5 180 D E 90 C51CB C51SG DMH212S DMH212CB 0 200 400 600 800 1000 0 90 180 270 360 Temps ps Angle di dre I Angle di dre Cys51 Cg Cys51 Sy DMSOH S DMSOH Cg FIG 7 8 suite Variation des distances Trp53 Ne DMSOH C et Trp53 Ne DMSOH Cg j de l angle Cys51 S DMSOH S DMSOH O k et de l angle di dre Cys51 Cg Cys51 S DMSOH S DMSOH Cg I en fonction du temps dans la simulation DMSOH Cys Gu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 180 7 Activation du substrat Globalement nous remarquons donc que le DMSO proton plac dans le site actif de MsrA est relativement mobile Les interactions qui permettent de stabiliser le substrat sont plus faibles que dans le cas du DMSO non proton C est essentiellement la liaison hydrog ne forte de Glu94 avec le DMSO proton qui permet de maintenir celui ci dans le site actif ainsi que l interaction lectrostatique stabilisante entre les deux atomes de soufre 7 3 2 Simulation de l interm diaire sulfurane dans le site actif a Param tres de champ de forces du r sidu sulfurane Un r sidu sulfurane appel Sulf a t const
103. import parameters options ga import math D finition de la fonction a minimiser def schwefel x y z f lambda x x math sin math sqrt abs x return Ex NER zb D finition de l espace de recherche parameters Ranges 0 500 1 0 500 1 0 590 Fonction minimiser options EvaluationFunction schwefel Lancement de la proc dure de minimisation ga run Chaque script de minimisation utilisant l algorithme g n tique doit importer les trois objets du module genetic py parameters contient les informations propres au d roulement de la minimisation telles que le codage des g nes le mode de reproduction et le mode de s lection options contient les informations concernant tout ce qui est li au processus de minimi sation avec entre autres la d finition de la fonction d valuation le contr le de la minimisation ou la cr ation de fichiers de sortie ga contient les fonctions et les proc dures n cessaires la minimisation L importation du module math est n cessaire l criture de la fonction de Schwefel Lex cution de cette minimisation a t facilit e gr ce l existence de valeurs par d faut pour un certain nombre de param tres et options B 2 Param tres et options 247 B 2 Param tres et options B 2 1 Codage GeneSize Taille des g nes e Liste d entiers d finissant la longueur d un g ne en nombre de bits La taille de la liste doit tre gale au nombre de g
104. l e iN a 1 5 qo e d C P 4m H Acide urique 3 7 dianion URA FIG 4 5 Structures chimiques de la 8 azaxanthine de l acide oxonique et de l acide urique utilis s comme ligand dans le docking avec l urate oxydase La num rotation des atomes est indiqu e pour chaque compos b Construction des syst mes mol culaires Pour pr parer la structure de l enzyme nous sommes partis de la structure PDB 2IBA Ce fichier contient uniquement un monom re Dans un premier temps l inhibiteur AZA et les autres compos s de cristallisation sont retir s de la structure Les mol cules d eau sont toutefois conserv es Les hydrog nes ont t ensuite ajout s la structure en respectant l tat de protonation des r sidus par l interm diaire du programme TLEAP d AMBER 24 Ces atomes ont fait l objet d une premi re optimisation de g om trie via le programme SANDER d AMBER associ au champ de forces am ber99 Enfin le t tram re a t construit et les hydrog nes optimis s une nouvelle fois selon le m me proc d En fin de compte tous les atomes de l enzyme ont t conserv s leurs positions cristallographiques l exception des atomes d hydrog ne Pour les m mes raisons que celles mentionn es pour la 8 azaxanthine l tat de protonation des mol cules suivantes est impos par l enzyme L acide oxonique se trouve sous une forme de dianion oxonate 1 8 et l acide urique en dianion urate 3 7 La g om tr
105. loge M Margraaf chimiste d origine alle mande membre de l Acad mie Royale des Sciences Le philosophe et math maticien reconnait ainsi l norme espoir que repr sente la chimie science naissante pour la fois comprendre le fonc tionnement des corps vivants et gu rir la maladie Il d plore par ailleurs le manque d int r t de ses contemporains investir ce champ de recherche prometteur dont on peut imaginer l impact qu il aura sur l am lioration des conditions de vie des hommes De nos jours le d veloppement de la biochimie a fait progresser de mani re spectaculaire la connaissance g n rale des processus chimiques qui gouvernent le vivant notamment dans les do maines de l enzymologie et de la pharmacologie Le d veloppement des interfaces avec la physique et l informatique a donn lieu la naissance d autres disciplines telles que la biophysique ou la bio chimie th orique qui visent d terminer la structure et la r activit des syst mes biologiques par la mod lisation informatique des processus au niveau mol culaire 14 Introduction objectifs Cette th se s inscrit dans le cadre du projet SIRE Simulation Informatique de la R activit Enzy matique financ par le programme ACI IMPBio Informatique Math matiques Physique en Biologie mol culaire du Minist re de l Education Nationale de l Enseignement Sup rieur et de la Recherche Le projet SIRE comporte une partie m thodologique qui vise le d ve
106. mani re d terminante dans la valeur du pK de ces r sidus Cet effet induit un d pla cement de pK relativement important pour les r sidus enfouis ceux en surface sont peu affect s par cette interaction La relation empirique donnant le d placement de pK pour les r sidus enfouis en interaction charge charge APK geng ressemble celle tablie pr c demment pour les liaisons hydrog ne Cchgchg si D lt d Do ApkK chgchg Cchgchg X di d si d4 lt db A 48 0 si a lt D OU Congcng est le d placement de pK maximal d aux interactions charge charge et D la distance entre les centres g om triques des groupes ionisables Les param tres d4 et d sont respectivement les distances pour lesquelles cette interaction est maximale et nulle Comme il l a t mentionn pr c demment ce d placement ApKgrgchg n est appliqu que pour les r sidus enfouis On parle alors de paires enfouies Un crit re est donn afin de d terminer si deux r sidus 1 et 2 sont consid r s comme tant une paire enfouie Ni amp sA 1 2 400 et N 554 2 2400 ou NissA 1 Niss4 2 gt 900 A 49 Le but de ce crit re est de pouvoir prendre en compte les groupes qui ne seraient pas consid r s comme tant enfouis N 55 1 350 mais poss dant un voisin plus profondemment enfoui Nis 5 2 550 Prise en compte du ligand PROPKA permet d sormais de prendre en compte l effet des ligands pr sents dans une structure crista
107. mol cule est fixe et l autre mobile ayant donc les m mes six degr s de libert que l algorithme g n tique Il nous est possible alors de valider sp cifiquement l utilisation de notre logiciel pour la minimisation dans le cadre d un docking mol culaire a Param tres du docking Concernant l algorithme g n tique nous utilisons une population de 32 individus dont le chromo some est constitu de 3 g nes de longueur 10 pour les variables de translation et de 3 g nes de longueur 8 pour la rotation La taille de la bo te de docking est fix e 10 centr e sur la mol cule d eau fixe Compte tenu de la taille des g nes nous avons une pr cision de 0 01 pour chacune des trois dimensions du vecteur translation et de 1 4 pour chacun des angles d Euler Le croise ment est affect d une probabilit de 10096 Du fait de la taille relativement petite des g nes un seul croisement est r alis sur le g ne en entier Il en est de m me pour la mutation o la probabilit vaut 20 L inversion de g nes n est pas autoris e La s lection par litisme n est pas utilis e La population est s lectionn e par le biais de 16 tournois Nous interdisons l eug nisme des individus tous les individus sont donc diff rents dans chaque population La p riodicit est appliqu e aux variables de rotation La strat gie de reproduction utilis e est celle par laquelle la nouvelle g n ra tion contient les 16 individus s lectionn s de la
108. ne repr sent par une mol cule d eau e substrat sulfoxyde repr sent par une mol cule de dim thylsulfoxyde e H5O une mol cule explicite d eau solvant est incorpor e afin de stabiliser les ions pr sents dans le site actif Nous nous sommes limit un nombre d atomes relativement petit pour construire ce mod le de site actif afin de pouvoir explorer diff rentes possibilit s de m canisme avec des m thodes de chimie quantique Pour ces raisons en particulier les r sidus Phe52 et Trp53 formant une interaction de type hydrophobe avec un groupement CH du substrat ont t volontairement cart s de cette liste Nous sommes partis des structures cristallographiques afin de positionner correctement les dif f rents r sidus de ce mod le Les structures PDB 3BQE 3BQF et 3BQG ont t superpos es Elle correspondent respectivement la structure de l enzyme libre du complexe micha lien avec le substrat sulfoxyde et de l interm diaire acide sulf nique en fin d tape r ductase Il est remarquable de voir que les sites actifs des trois structures se superposent convenablement avec une faible d viation Le syst me mod le que nous avons utilis dans cette tude a t construit partir de la position moyenne des atomes de cette superposition La figure 7 2 illustre le mod le et pr cise la num rotation des atomes qui sera utilis e Dans les calculs qui seront pr sent s ci dessous nous avons t amen
109. peuvent servir de pi ges radicaux libres En d autres termes les m thionines prot geraient les autres r sidus de la prot ine essentiels son activit Pour exemple nous citerons le cas de la glutamine synth tase 9 5 1 Stress oxydant et oxydation des r sidus m thionine 93 d Adressage vers les voies de d gradation L oxydation des m thionines fait partie des signaux d adressage des prot ines suroxyd es vers les voies de d gradation Pour exemple nous savons que l oxydation des r sidus m thionine en sulfoxydes de m thionine peut conduire des changements de conformation entrainant une expo sition au milieu ext rieur de zones hydrophobes normalement enfouies au sein de la prot ine Ces prot ines sont d grad es par le prot asome 208 partir de la reconnaissance sp cifique de ces zones hydrophobes expos es Le ph nom ne d oxydation des m thionines est peut tre mettre en correspondance avec celui de d amidation des r sidus asparagine et glutamine dans le m canisme d adressage des sub strats biologiques vers les voies de d gradation En effet les r sidus Asn et Gln sont les deux seuls r sidus thermodynamiquement instables dans les conditions physiologiques 9 181 Ils tendent perdre la fonction amide l extr mit de leur cha ne lat rale par un processus de d gradation non enzymatique 9 qui a t caract ris comme tant un signal d adressage vers les voies de d gradation 85
110. plus pr s maintenant l tape r ductase du cycle cataly tique I pour la classe d enzyme MsrA et nous allons r sumer l tat de connaissances actuelles 5 3 1 Caract risation cin tique Les travaux exp rimentaux d Antoine et a 9 et d Olry et al 2 8 sur le m canisme catalytique de la MsrA et de la MsrB de N meningitidis respectivement ont montr que la cin tique de l tape r ductase I est limitante dans le processus de formation du pont disulfure I Il Rappelons que l tape limitante du processus catalytique global est l tape de r duction de ce pont disulfure par Trx III Des r sultats similaires ont t obtenus pour d autres Mer 5 3 2 Identification des r sidus impliqu s 232 Les travaux de Gand et a mettent en vidence les r sidus responsables de la reconnaissance du substrat MetSO par le site actif de la MsrA De plus les structures cristallographiques 6 de MsrA montrent que les r sidus invariants Glu94 Tyr82 et Tyr134 sont en interaction de type liaison hydrog ne avec une mol cule d eau mime de l oxyg ne de la fonction sulfoxyde Dans une tude men e par Antoine et al 34 les mutations E94A et E94D de la MsrA de N menin gitidis diminuent de facon drastique la constante cin tique relative l tape r ductase Ces r sultats sugg rent que Glu94 est impliqu dans la catalyse de la r duction du sulfoxyde kecat diff rent mais pas dans la formation du complexe micha lien
111. ps Distance b Distance Sulf HO Glu94 Oge 180 S 90 co KE 5 0 2 90 E94CB E94C0G E94CD E940E1 180 0 200 400 600 180 90 0 90 180 Temps ps Angle di dre c Angle di dre Clu94 Cg Glu94 C Glu94 Cs Glu94 Oe Fic 7 10 Variation de la distance Sulf HO Glu94 O a de la distance Sulf HO Glu94 Oc b et de l angle di dre Glu94 Cg Glu94 C Glu94 Cs Glu94 Oe c en fonction du temps dans la simu lation Sulf Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 186 7 Activation du substrat Y82HH SUA510H Distance A 0 200 400 600 0 2 4 6 8 Temps ps Distance A d Distance Sulf Og Tyr82 Hy YA34HH SUAS51OH o Distance A 0 200 400 600 0 2 4 6 8 Temps ps Distance e Distance Sulf Og Tyr134 Hn SUA51SG Y197HH Distance 0 200 400 600 0 2 4 6 8 Temps ps Distance f Distance Sulf Sy Tyr197 Hy Fic 7 10 suite Variation de la distance Sulf O Tyr82 Hh d de la distance Sulf O Tyr134 H e et de la distance Sulf S Tyr197 H f en fonction du temps dans la simulation Sulf Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 7 3 Dynamique mol culaire du substrat activ 187 Distance W53NE1 SUA51CE1 W53NE1 SUA51CE2 0 200
112. r sidus augmente au cours du temps Au d part 2 mol cules d eau se situent autour de Cys51 distance 3 4 En fin de simulation ce nombre a doubl Pour le r sidu Glu94 la solvatation augmente de fa on importante au cours des 200 premi res picosecondes de simulation passant de 0 2 mol cules de solvant distance 3 4 Cette simulation montre donc que l tat de protonation tudi CysH Glu ne convient pas l ancrage du substrat sulfoxyde dans le site actif Le substrat initialement plac dans le site actif s chappe comme cons quence d un bilan tr s d favorable des interactions la fois entre le substrat et l enzyme et entre les r sidus du site actif de l enzyme Le substrat interagit plus fortement avec le solvant qu avec les r sidus du site actif Une analyse des charges atomiques peut expliquer qualitativement ce comportement Tab 6 5 la liaison O H de la mol cule d eau tant beaucoup plus polaire que la liaison S H de la cyst ine Atomes DMSO O DMSO S Cys51 S Oys51 H WAT O WAT H Charge u a 0 47 0 27 0 31 0 19 0 83 0 42 TAB 6 5 Valeurs des charges atomiques DMSO O DMSO S Cys51 Sy Cys51 Hy WAT O et WAT H utili s es pour le calcul du terme d interaction coulombienne du champ de forces correspondant la simu lation DMSO CysH Glu D une mani re plus globale on peut dire que le grand moment dipolaire port par la mol cule de DMSO 4 59 D li une liaison S O
113. rateur de nombres al atoires e Entr e nombre liste chaine de caract res etc d terminant la racine du g n rateur Le le premier terme de la suite de r currence utilis e pour la production des nombres al atoires Si la racine du g n rateur RandomSeed est la m me lors du lancement de plusieurs mini misations les suites des nombres al atoires produites sont identiques Si RandomSeed vaut None le temps courant est pris comme racine du g n rateur options RandomSeed lt HashableType gt Valeur par d faut None Periodicity Application de l op rateur de mutation par addition e Liste d entiers indiquant les index des g nes sur lesquels il faut appliquer l op rateur de muta tion par addition L op rateur de mutation par addition remplace celui de mutation par permutation sur les g nes consid r s options Periodicity lt list gt Valeur par d faut 1 2 3 Strategy Strat gie d volution de l algorithme g n tique e Fonction externe d finie par l utilisateur Voir section B 4 6 L appel cette fonction se fait au d but de chaque cycle de reproduction avant les phases de s lection et de reproduction Elle permet de concevoir le processus d obtention de la nouvelle g n ration Cette fonction sert principalement d finir quelle part des individus s lectionn s est r int gr e la nouvelle g n ration et de quelle mani re les nouveaux sont form s partir des parents options Strateg
114. s Lors de la phase d valuation une grande quantit de calcul doit tre effectu e Il est alors astucieux de r partir ces calculs sur plusieurs processeurs en m me temps dans le but de gagner du temps L interface d valuation que nous venons de voir poss de l avantage de pouvoir facilement r partir plusieurs processus d valuation en simultan sur une plateforme de calcul distribu clusters de PC noeuds de processeurs sans que cela n interf re avec le processus de production des individus Il existe une grande diversit des plateformes informatiques et la gestion des calculs distribu s est souvent li e l architecture propre du syst me d exploitation Nous n avons donc pas int gr directement la distribution des calculs dans l interface d valuation Cette t che est d volue un pro gramme sp cialis externe Nous avons utilis SGE Sun Grid Engine pour les diff rents tests que nous avons r alis s Il s agit d un programme libre OpenSource en licence SISSL d ordonnan 2 4 Conclusion 53 cement de t ches informatiques batch queuing system soutenu par la soci t Sun Microsystems Il permet l ordonnancement la r partition et la gestion des t ches s quentielles parall les ou in teractives sur des clusters de PC L algorithme g n tique ne g re pas directement le programme SGE Une fonction Python externe r alisant cette t che est interfac e l algorithme g n tique par l interm diaire d
115. se Technical Report 95006 Department of General Engineering University of Illinois Urbana Champaign 1995 Kubota R Horio K et Yamakawa T nt Cong Ser 1291 169 172 2006 Jiao L et Wang L EEE Trans on Systems Man and Cybernetics A 30 552 561 2000 Ross B J ALamarckian Evolution Strategy for Genetic Algorithms In Practical Handbook of Genetic Algorithms Complex Coding Systems Vol 3 CRC Press ed Chambers L D Ed Boca Raton London 1999 Chapter 1 pages 1 16 http gridengine sunsource net Rinaldi D Hoggan P E Cartier A Baka K Monard G Loos M Reuter N Mokrane A Dillet V et Th ry V The GEOMOP Program 1989 Universit Henri Poincar Nancy I van der Vaart A Su rez D et Merz Jr K M J Chem Phys 113 10512 10523 2000 Dannenberg J J J Phys Chem 92 6869 6871 1988 Odutola J A et Dyke T R J Chem Phys 72 5062 5070 1980 Halkier A Koch H Jorgensen P Christiansen O Beck Nielsen M et Helgaker T Theor Chem Acc 97 150 157 1997 Kahn K Serfozo P et Tipton P A J Am Chem Soc 119 5435 5442 1997 Sarma A D Serfozo O Kahn K et Tipton P A J Biol Chem 274 33863 33865 1999 Tipton P A Nat Chem Biol 2 124 125 2006 Wu X W Muzny D M Lee C C et Caskey C T J Mol Evol 34 78 84 1992 Colloc h N EI Hajji M Bachet B L Hermite G Schiltz M Prang T Castro B et Mornon
116. structure de type sulfurane proche de celle d crite dans les travaux de Balta et al 2 Comme nous l avons dit la g om trie de 2 est tr s proche de celle de l tat de transition TS a Nous retrouvons les liaisons hydrog ne autour de l oxyg ne Osg du substrat sulfoxyde avec les r sidus mod le Tyr82 et Tyr134 Hog Ozg 1 82 A H22 Os 1 73 Le proton port par l oxyg ne du sulfoxyde cr e une liaison hydrog ne tr s forte avec un oxyg ne de Glu94 H 3 O42 1 44 La distance dg s 2 58 entre les deux atomes de soufre est interm diaire de celles obte nues par Balta et al pour un sulfurane en phase gazeuse ds s 2 41 et en solvant DMSO ds s 2 73 L ordre de la liaison S S37 vaut 0 49 montrant une certaine fragilit de cette liaison 0 63 en phase gazeuse et 0 22 en solvant DMSO dans les travaux de Balta et al La liaison S S du sulfurane 2 semble poss der un caract re ionique relativement important La principale diff rence de nos r sultats par rapport ceux de Balta et al concerne la liaison S37 O3g La distance obtenue 168 7 Activation du substrat a Etat de transition TS4 2 b Interm diaire sulfurane 2 Fic 7 4 Structure de l tat de transition TS _2 correspondant au transfert de proton entre Glu94 et le DMSO et de l interm diaire sulfurane 2 dans le mod le quantique de site actif apr s optimisation de g om trie au niveau B3LYP 6 31G d 7 2 M canisme de trans
117. tats de 8 3 M canisme Ill 2 H 2 e 215 transition les reliant au niveau B3LYP 6 311 G 2df 2p Dans ces conditions les esp ces TS4 2 et TS2_4 ont des nergies relatives tr s proches 9 1 9 0 et 6 9 kcal mol respectivement ce qui a tendance confirmer la possibilit d un m canisme concert asynchrone dans lequel l tat de transition correspondrait principalement au transfert de proton de Glu94 vers le substrat et aurait ainsi une g om trie proche de l esp ce sulfurane 2 H Tyr134 N NEC of Lo 0 d p SS EON CH T4 L EE 0 FIG 8 8 Hypoth se de m canisme concert imagin pour la formation de l interm diaire acide sulf nique partir de l interm diaire sulfurane dissoci dans le site actif de enzyme Le processus d hydrolyse de l ion sulfuranyle est assist par Tyr134 sous forme ph nolate Selon notre sch ma r actionnel l atome d oxyg ne de l interm diaire acide sulf nique ne serait pas celui pr sent initialement dans le substrat sulfoxyde ce qui contraste avec des hypoth ses propos es pr c demment Encourag e par nos travaux th oriques une tude exp rimentale de marquage isotopique a t r alis e par Antoine Les r sultats sont regroup s dans le tableau 8 9 Trois s ries d analyses ont t r alis es avec des substrats marqu s i AcMetSO 5NHMe ou AcMetSO NHMe en pr sence d H20 ii AcMetSO 5NHMe en pr sence d H20 8 ou d H2O et iii AcMetSO 5NHMe en pr
118. terminer la formation de l interm diaire sulfurane 2 Fig 7 4 b page 168 L optimisation de la g om trie a t r alis e au ni veau B3LYP 6 31G d L nergie du syst me a t recalcul e un niveau B3LYP 6 311 G 2df 2p L exploration de la surface d nergie potentielle partir de la structure de l interm diaire sulfu rane 2 a permis de localiser l tat de transition TS _4 correspondant au transfert de proton entre le r sidu Tyr134 ph nol et le groupement OH du sulfurane La figure 8 7 a montre la structure de cet tat de transition qui est caract ris par l existence d une seule fr quence imaginaire 532i cm dont le mode normal de vibration correspond l change du proton Hz entre les atomes d oxyg ne Oo et Ogg La protonation du groupement OH conduit a la dissociation de la liaison S37 O3g du sul furane sous la forme d un ion sulfuranyl et d une mol cule d eau 4 comme l illustre la figure 8 7 b 210 8 R duction du substrat Le tableau 8 6 regroupe les valeurs g om triques de ces deux esp ces Les ordres de liaison et les charges sont report s dans le tableau 8 7 Rappelons que les charges atomiques ont t obtenues partir du potentiel lectrostatique et que dans le mod le utilis la charge nette du syst me est 1 u a Nous nous int resserons donc la variation de charges dans le processus plut t qu aux valeurs absolues de celles ci Le bilan nerg tique est donn par le tableau 8 8
119. tests qui nous ont permis de v rifier le bon fonctionnement et l efficacit de ce programme l optimisation de la structure du dim re de l eau via diff rentes m thodes semi empiriques et ii le docking de diff rents ligands dans le site actif d une enzyme urate oxydase Ces tests permettent de valider diff rentes caract ristiques de notre programme telles que la description quantique d un syst me mol culaire ou l utilisation d un algorithme g n tique pour la minimisation Des comparaisons vis vis de structures cristallogra phiques connues de complexes enzyme ligand viendront valider les r sultats de docking obtenus pour l enzyme 66 4 Validation du programme ALGOGEN DIVCON 4 1 Structure du dim re de l eau Le premier test r alis permet de v rifier si le programme que nous venons de d velopper est capable d optimiser la g om trie d une structure simple comme celle du dim re de l eau Dans ce syst me une premi re mol cule d eau est fixe i e elle joue le r le de la prot ine et la deuxi me est mobile l optimisation de g om trie du dim re est r alis e en utilisant diff rents hamiltoniens semi empiriques AM1 PM3 et PM3 PIF En comparaison la m me optimisation de g om trie est r alis e par le programme GEoMoP au niveau AM1 et PM3 via une m thode des gradients conjugu s pour la minimisation Ici aussi les g om tries internes de chaque mol cule d eau sont gel es une
120. tiques Avant de voir en d tail le programme qui a t crit nous pr senterons ici de facon g n rale les algorithmes g n tiques Nous nous attacherons d finir les diff rents termes de vocabulaire et introduire les notions importantes au travers d un exemple simple de minimisation La lecture des ouvrages de Holland et de Goldberg pourra compl ter cette partie 32 2 D veloppement d un algorithme g n tique de minimisation 2 2 1 D finition et principe g n ral Un algorithme g n tique GA est un processus informatique mimant l volution biologique na turelle d une population d tres vivants o chaque individu repr sente une solution potentielle un probl me donn Comme l illustre la figure 2 1 ce processus cr e une nouvelle population d in dividus par une op ration de reproduction o chaque individu a h rit d une partie du patrimoine g n tique de ses parents e 010010 100011 000010 110011 FIG 2 1 Analogie entre volution biologique naturelle et algorithme g n tique La reproduction de deux indi vidus permet de cr er deux nouveaux individus o chacun a h rit d une partie du patrimoine g n tique des parents Pour mimer le principe de s lection naturelle le processus effectue une discrimination entre les individus Un crit re de s lection permet de distinguer ceux qui correspondent des solutions conve nables Les individus qui ne satisfont pas le crit re sont
121. toutes ces m thodes le hasard est utilis comme un outil dans l exploration et la recherche d un minimum Contrairement aux deux classes de m thodes pr c demment cit es les r gles de transition d un point de l espace de recherche un autre ne sont plus d terministes mais probabilistes Dans l optique du programme de docking envisag ici et pour les raisons signal es plus haut le choix du minimiseur s est port sur un algorithme g n tique Une des particularit s s duisantes des algorithmes g n tiques r side dans l absence d hypoth ses sp cifiques sur la r gularit de la fonction minimiser Par exemple aucune hypoth se sur la continuit de cette fonction n est re quise ses d riv es successives n tant pas n cessaires Selon Dorsey et Mayer le processus de minimisation est nettement plus simple et offre des performances plus importantes qu un recuit si 48 52 mul Les principaux logiciels de docking disponibles utilisent un algorithme g n tique comme algorithme de recherche conformationnelle Plusieurs codes d algorithme g n tique existent et sont disponibles Cependant nous avons re marqu qu ils ont souvent le d faut majeur d tre li s au probl me de minimisation pour lequel ils ont t cr s L interfacage d un de ces codes avec un autre programme semblait tre complexe Ainsi nous avons d cid d crire notre propre programme de minimisation 2 2 Principe des algorithmes g n
122. un g ne doit coder une valeur donn e contrainte b Code Gray Linconv nient majeur du codage pr c dent est que la modification d un seul bit 0 1 peut produire un changement important de la valeur de codage x exprim e Exemple Modification du troisi me bit d un g ne de longueur 6 G ne 100101 101101 x 1 15625 1 40625 La distance de Hamming est d finie comme tant la valeur absolue de la diff rence entre les deux valeurs exprim es avant et apr s modification d un bit Ce changement important provient du fait que tous les bits n ont pas le m me poids l int rieur du code binaire L influence de la modifica tion d un bit sur la distance de Hamming d pend donc du poids du bit consid r L utilisation d un code Gray 9 permet de rem dier en partie ce probl me Il s agit d un code bi naire totalement artificiel o la modification d un seul bit entra ne un changement plus petit de la va leur exprim e Ce code est obtenu par le r sultat de la somme de deux bits contig s du code binaire initial modulo 2 le premier bit du code Gray tant le premier bit du code binaire Plus concr tement soit un code binaire A tel que A aga1az a alors le code Gray G gog1g2s g correspondant sera tel que go ao g ao Pay G2 a1 Pag Jn An 1 Ha OU G est l op rateur logique ou exclusif Le passage d un code Gray un code binaire s effectue selon les m mes op rations Exemple
123. une prot ine Les r sidus ionisables jouent un r le important au niveau des propri t s physico chimiques de la prot ine notamment dans les interactions prot ine ligand ou dans les m canismes catalytiques La pr diction th orique de l tat de protonation d une prot ine est rendue n cessaire par le fait que les donn es cristallographiques ne contiennent pas d information sur les atomes d hydrog ne L utilisation de valeurs mod les de pK est fortement d conseill e car les variations peuvent tre importantes en fonction des interactions entre r sidus ll existe diff rentes m thodes permettant la pr diction de pK de prot ines La plupart d entre elles reposent sur des mod les de continuum lectrostatique qui r solvent num riquement l qua tion de Poisson Boltzmann lin aris e LPBE Sans entrer dans le d tail de ces m thodes nous pouvons dire que la prot ine est d crite par un ensemble d atomes repr sent s uniquement par des charges ponctuelles et ins r e dans un continuum di lectrique uniforme double constantes di lec triques diff rentes pour le solvant et le noyau de la prot ine Le d placement de pK d un r sidu est alors calcul par diff rence de l nergie lectrostatique entre sa forme charg e et sa forme neutre Ce d placement est ajout sa valeur mod le de ob Ces m thodes de pr diction ne sont pas compl ment satisfaisantes Bien qu elles donnent des valeurs pr dites relative
124. 0000 0 2500 0 1094 0 0157 0 2104 0 0000 Atome C O Type C O Masse a m u 12 0 16 0 Charge a u 0 5973 0 5679 ou A 1 9080 1 6612 kcal mol 0 0860 0 2100 Liaison ce H1 CT H1 oh ho N H C N Constante de force kcal mol A Distance d quilibre A 335 90 340 00 369 60 434 00 490 00 1 094 1 090 0 974 1 010 1 335 ss CT s6 oh s6 LP s6 ss CT CT 225 80 190 0 600 00 139 6 310 00 1 821 1 812 0 700 2 400 1 526 Liaison C O s6 ce CT C CT N Constante de force kcal mol A 570 00 254 00 317 00 337 00 Distance d quilibre 1 229 1 774 1 522 1 449 Liaison Constante de force kcal mol A Distance d quilibre A TAB 7 6 Param tres du champ de forces du r sidu sulfurane types charges masses param tres de Lennard Jones et potentiels de liaison en fonction du type de l atome Hg repr sente Hp et Hgs Ce repr sente Ce et Ceo Hex repr sente Hei1 He12 He13 Heo1 He22 et Hes 182 7 Activation du substrat Angle C N H Hi ce H1 s6 ce H1 s6 oh ho Constante de force kcal mol deg 30 000 39 200 43 900 45 500 Angle d quilibre deg 120 00 109 55 108 11 109 20 Angle H1 CT CT H1 CFC H N CT N CT H Constante de force kcal mol deg 50 000 50 000 30 000 50 000 Angle d quilibre deg 109 50 109 50 118 04 109 50 CT C N oh s6 LP ce s6 oh ce s6 LP 70 000 150 000 68 600 150 000 116 60 90 00 95 95 130 00 ss s6 oh ss s6 LP CT CT C CT ss s6 62 100 150 000 63 000 60 900 180 00 90 00 111 10 96 76
125. 027 1047 2000 Filman D J Bolin J T Matthews D A et Kraut J J Biol Chem 257 13663 13672 1982 H roux A White E L Ross L J Kuzin A P et Borhani D W Structure 8 1309 1318 2000 Zacharias N et Dougherty D A Trends Pharmacol Sci 23 281 287 2002 Manssour Fraga C A et Barreiro E J Curr Drug Ther 3 1 13 2008 Marco E et Gago F ChemMedChem 2 1388 1401 2007 Fox T Brennan D Austen D A Swalley S E Coll J T Raybuck S A et Chambers S P Curr Protein Pept Sc 8 439 445 2007 Vakser A Biopolymers 39 455 464 1996 Lengauer T et Rarey M Curr Opin Struct Biol 6 402 406 1996 Kitchen D B Decornez H Furr J R et Bajorath J Nat Rev Drug Discov 3 935 949 2004 Morris G M Goodsell D S Halliday R S Huey R Hart W E Belew R K et Olson A J J Comput Chem 19 1639 1662 1998 Rarey M Kramer B Lengauer T et Klebe G J Mol Biol 261 470 489 1996 Dominguez C Boelens R et Bonvin A M J Am Chem Soc 125 1731 1737 2003 Li H Li C Gui C Luo X Chen K Shen J Wang X et Jiang H Bioorg Med Chem Lett 14 4671 4676 2004 Jones G Willett P Glen R C Leach A R et Taylor R J Mol Biol 267 727 748 1997 Shoichet B K Kuntz D et Bodian D L J Comput Chem 13 380 397 2004 Meng E C Shoichet B K et Kuntz I D J Comput Chem 13 505 524 2004 Cai
126. 1 Module docking py 57 3 2 2 Module quaternion py 59 3 2 3 Module divcon py 2 s csse lo som S RS 3 60 3 3 D roulement du docking lt 60 10 4 Table des mati res Validation du programme ALGOGEN DIVCON 4 1 Structure du dim re de l eau 4 2 Docking dans une prot ine 4 2 1 Docking de la 8 azaxanthine dans le site actif de l urate oxydase 4 2 2 Docking de l acide oxonique dans le site actif de l urate oxydase 4 2 3 Docking de l acide urique dans le site actif de urate oxydase 4 3 Conclusions M canisme catalytique des m thionine sulfoxyde r ductases de classe A Rappels bibliographiques et objectifs 5 1 Stress oxydant et oxydation des r sidus m thionine 5 1 1 Oxydation des r sidus m thionine parles EOA 5 1 2 Cons quences de l oxydation des r sidus m thionine 5 1 3 Propri t s physico chimiques de la fonction sulfoxyde 5 2 M thionine sulfoxyde r ductases 5 2 1 Implication physiologique des m thionine sulfoxyde r ductases 5 2 2 M canisme catalytique ee 5 2 3 Structure primaire des m thionine sulfoxyde r ductases
127. 1000 0 2 4 6 8 Temps ps Distance k Distance Tyr82 Hy Glu94 O rouge et Tyr134 Hn Glu94 Oe bleu li 0 200 400 600 800 1000 0 2 4 Temps ps Distance A I Distance Tyr82 Hy Glu94 O e rouge et Tyr134 Hy Glu94 O ge bleu Distance A Y82HH E940E2 Y134HH E940E2 6 8 FIG 6 9 suite Variation de l angle Cys51 S DMSO S DMSO O j des distances Tyr82 H Glu94 Oc et Tyr134 Hn Glu94 Og k et des distances Tyr82 H Glu94 O 2 et Tyr134 Hn Glu94 Oe2 I en fonction du temps dans la simulation DMSO Cys GluH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 5 Conclusions 155 6 5 Conclusions Les diff rentes simulations que nous venons de pr senter nous ont permis d obtenir des rensei gnements pr cieux sur le fonctionnement de l enzyme tels que la reconnaissance et l ancrage du substrat sulfoxyde en identifiant les r sidus impliqu s et ii la structure du complexe micha lien enzyme substrat La pr sence d un proton sur le r sidu Glu94 est essentielle pour la reconnaissance et l ancrage du substrat La pr diction d une valeur de pK proche de 7 par le programme PROPKA indique la possibilit que la forme proton e de ce r sidu existe dans l enzyme libre Cet tat de protonation se rait la cons quence d une plut t faible ou tr s faible accessibilit de l eau au r sidu Glu94 constat e dans toutes le
128. 183 Nous avons mod lis la paire libre du soufre central Ss par un atome de type LP Elle est position n e de mani re optimale une distance de 0 7 de l atome de soufre comme propos dans les travaux de Dixon et Kollman 5 Les autres param tres du champ de forces pour ce type d atome sont une charge de 0 23 u a une masse de 3 0 a m u des param tres de Lennard Jones nuls comme pour les hydrog nes de groupements hydroxyles et des constantes de force valant respec tivement 600 kcal mol et 150 kcal mol pour les potentiels de liaison et d angle de valence Le champ de forces gaff ne poss de pas les types d atomes appropri s permettant de d crire une structure de type sulfurane Nous avons choisi d utiliser les types d atome ss et s6 pour d crire respectivement les atomes S et Ss Le premier type correspond un atome en liaison avec un autre soufre du type disulfure Le deuxi me correspond un soufre t travalent sym trie t tra drique du type sulfone Nous avons modifi les valeurs des distances et des angles d quilibre de ces deux types d atome afin de retrouver la structure bipyramidale base trigonale du sulfurane Les valeurs utilis es proviennent en majorit des travaux de Balta et al b Protocole de simulation Le protocole de simulation est identique celui pr sent dans le chapitre pr c dent protona tion de l enzyme ii solvatation de l enzyme et minimisations successives pour pl
129. 2S OH en fonction du solvant203 Potentiel r dox absolu des couples CHa S CHs S et CH3 2S OH CH3 2S OH en fonc tom du solvant s s ai i ANNE SES VO RENE ER ME MES MEN de Ram or au 205 Valeurs des distances et des angles pour les structures 1 T84 9 2 T852 46014 212 Valeurs des ordres de liaison et des charges pour les structures 1 T1 2 2 T82 4et4 213 Bilan nerg tique du transfert de proton dans le mod le de site actif 213 Exp rience de marquage isotopique du substrat sulfoxyde de m thionine 215 Valeur de pKyoder d finition du centre g om trique et rayon Ri oca utilis pour les effets de d solvatation pour chaque type de groupe ionisable 240 Bibliographie D N DO 0 P C 14 15 16 17 18 19 20 215 22 23 24 25 26 Voet D et Voet J G Biochemistry Wiley International Editions New York A ed 2004 Berman H M Westbrook J Feng Z Gilliland G Bhat T N Weissig H Shindyalov I N et Bourne P E Nucleic Acids Res 28 235 242 2000 Warshel A Acc Chem Res 14 284 290 1981 Bashford D et Karplus M Biochemistry 29 10219 10225 1990 Yang A S Gunner M R Sampogna R Sharp K et Honig B Proteins 15 252 265 1993 Yang A S et Honig B J Mol Biol 231 459 474 1993 Antosiewicz J Briggs J M Elcock A H Gilson M K et McCammon J A
130. 2df 2p sur les g om tries optimis es b R sum des r sultats et discussion La premi re partie du chemin r actionnel est illustr e par la figure 5 11 La structure 1 repr sente le r actif m thanethiol en interaction avec deux mol cules explicites du solvant DMSO Cette struc ture est prise comme r f rence des nergies La structure 2 repr sente un syst me o un transfert de proton a t r alis entre le m thanethiol et une mol cule de DMSO La deuxi me mol cule de DMSO vient former une liaison hydrog ne forte avec ce proton A partir du complexe ionique 2 la formation de l acide sulf nique 4 peut tre envisag e mais semble tr s difficile la barri re nerg tique pour atteindre l tat de transition TS 4 tant de 45 5 kcal mol Un autre chemin conduit une esp ce de type sulfurane 3 suite au r arrangement du complexe ionique 2 Cette tape implique une toute petite barri re nerg tique 20 kcal mol Signalons que les auteurs ont galement consid r le passage direct du syst me initial 1 l acide sulf nique 4 selon un m canisme concert mais il s av re peu probable L tat de transition correspondant se situe 46 3 kcal mol au dessus de 1 chemin non montr Le solvant joue un r le crucial dans l nerg tique de ce processus compte tenu du caract re polaire des esp ces en pr sence L existence d esp ces charg es dans le syst me implique la pr sence d interactions lectrost
131. 37 6580 1988 Paul I C Martin J C et Perozzi E F J Am Chem Soc 94 5010 5017 1972 Martin J C et Perozzi E F Science 191 154 159 1976 Downs A J McGrady G S Barnfield E A Rankin D W H Robertson H E Boggs J E et Dobbs K D Inorg Chem 28 3286 3292 1989 Kouteck V B et Musher J l Theor Chem Acc 33 227 238 1974 Schwenzer G M et Schaefer H F J Am Chem Soc 97 1388 1393 1975 Chen M M L et Hoffmann R J Am Chem Soc 98 1647 1653 1976 Case D Pearlman D Caldwell J Cheatham Ill T Ross W Simmerling C Darden T Merz K Stanton R Cheng A Vincent J Crowley M Tsui V Radmer R Duan Y Pitera J Massova l Seibel G Singh U Weiner P et Kollman P AMBER 6 University of California San Francisco 1999 Cornell W D Cieplak P Bayly C l Gould R Merz K M Ferguson D M Spellmeyer D C Fox T Caldwell J W et Kollman P A J Am Chem Soc 117 5179 5197 1995 Rao B G et Singh U C J Am Chem Soc 112 3803 3811 1990 Vaisman et Berkowitz M L J Am Chem Soc 114 7889 7896 1992 Luzar A et Chandler D J Chem Phys 98 8160 8173 1993 Liu H Mueller Plathe F et van Gunsteren W F J Am Chem Soc 117 4363 4366 1995 Skaf M S J Chem Phys 107 7996 8002 1997 Ryckaert J P Ciccotti G et Berendsen H J C J Comput Phys 23 327 341 1977 Wang J Wolf R M
132. 400 600 800 1000 0 2 4 6 Temps ps Distance f Distance Tyr82 Hn Glu94 Oe2 rouge et Tyr134 Hn Glu94 Oe2 bleu 177 360 FIG 7 8 suite Variation de l angle di dre Glu94 Cg Glu94 C Glu94 C5 Glu94 Oe d des distances Tyr82 Hn Glu94 Oc1 et Tyr134 H Glu94 Oe e et des distances Tyr82 Hy Glu94 O et Tyr134 Glu94 O f en fonction du temps dans la simulation DMSOH Cys Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 178 7 Activation du substrat Distance Y82HH DMH2120 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance g Distance Tyr82 H DMSOH O Distance Y134HH DMH2120 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance A h Distance Tyr134 Hy DMSOH O Distance A 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance A i Distance Tyr134 Hy Cys51 S FIG 7 8 suite Variation de la distance Tyr82 H DMSOH O g de la distance Tyr134 H DMSOH O h et de la distance Tyr134 Hq Cys51 S i en fonction du temps dans la simulation DMSOH Cys Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 7 3 Dynamique mol culaire du substrat activ 179 Distance W53NE1 DMH212CA W53NE1 DMH212CB 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance
133. 46 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 BIBLIOGRAPHIE Boschi Muller S Azza S et Branlant G Protein Sci 10 2272 2279 2001 Gand A Antoine M Boschi Muller S et Branlant G J Biol Chem 282 20484 20491 2007 Antoine M Boschi Muller S et Branlant G J Biol Chem 278 45352 45352 2003 Antoine M Gand A Boschi Muller S et Branlant G J Biol Chem 281 39062 39070 2006 Marchal S et Branlant G Biochemistry 38 12950 12958 1999 Balta B Monard G Ruiz L pez M F Antoine M Gand A Boschi Muller S et Branlant G J Phys Chem A 110 7628 7636 2006 Rivail J L et Rinaldi D Chem Phys 18 233 242 1976 Rinaldi D Ruiz L pez M F et Rivail J L J Chem Phys 78 834 838 1983 Dillet V Rinaldi D et Rivail J L J Phys Chem 98 5034 5039 1994 Rinaldi D Bouchy A Rivail J L et Dillet V J Chem Phys 120 2343 2350 2004 Tolles W M et Gwinn W D J Chem Phys 36 1119 1121 1962 Owsley D C Helmkamp G K et Rettig M F J Am Chem Soc 91 5239 5242 1969 Johnson C R et Rigau J J J Am Chem Soc 91 5398 5399 1969 Martin J C et Arhart R J J Am Chem Soc 93 2339 2341 1971 Martin J C et Arhart R J J Am Chem Soc 93 2341 2342 1971 Young P R et Hsieh L S J Am Chem Soc 100 7121 7122 1978 Madesclaire M Tetrahedron 44 65
134. 51 H dans DMSO CysH Glu 138 suite Distances Cys51 H Glu94 Oga Tyr82 Hy Glu94 Oe Tyr134 Hn Glu94 O Tyr82 Hy Glu9402 et Tyr134 Hy Glu94 Oge dans DMSO CysH Glu 139 suite Nombre de mol cules d eau dans la solvatation de DMSO Cys51 et Glu94 dans DMSO CYS GUS ees erp EE aute ver UV irent Se de E de Ge ee 140 Distances Glu94 He2 DMSO O Tyr82 Hy DMSO O et Tyr134 Hn DMSO O dans DMSO CYSH GIUH 5 5 sue Reta BOS Ewa BR eee wey Xeno Po Gu DELE Poe ER ex red 143 suite Distances Cys51 Hy DMSO O Cys51 Hy Tyr197 Oq et angle di dre Cys51 Co Cys51 Cg Cys51 S Cys51 Hy dans DMSO OysH GluH 144 suite Distances Cys51 S DMSO S Trp53 Ne1 DMSO Cq Trp53 Ne1 DMSO Cg et angle di dre Cys51 Cg Cys51 S DMSO S DMSO Cg dans DMSO CysH GluH 145 suite Distances Tyr82 Hy Glu94 Oc1 Tyr134 Hy Glu94 Oe Tyr82 Hy Glu94 Ogo Tyr134 Hy Glu94 Oge et angle Cys51 Sy DMSO S DMSO O dans DMSO CysH GluH 146 suite Nombre de mol cules d eau dans la solvatation de DMSO Cys51 et Glu94 dans DMSO ec Ex cae ea ae OE Be eee kw ee eae Se ewe wa a 147 Structure du complexe micha lien du DMSO dans le site actif de MsrA 149 Distances Glu94 He2 DMSO O Tyr82 Hy DMSO O et Tyr134 Hy DMSO O dans DMSO CyS GIUR ea et ce Su eee y Wurm PON eed st eee EE gue od us 151 suite Distances Cy
135. 6 Distance A N 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance f Distance Tyr134 Hn Glu940e FIG 6 5 suite Variation de l angle di dre Glu94 Cg Glu94 C Glu94 Cs Glu94 O 1 d de la distance Tyr82 Hn Glu94 O 1 e et de la distance Tyr134 H Glu94 O f en fonction du temps dans la si mulation Free Cys GluH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 4 Complexe enzyme substrat sulfoxyde 135 6 4 Complexe enzyme substrat sulfoxyde 6 4 1 Etat de protonation CysH Glu Dans une premi re trajectoire nous avons constat que le substrat DMSO est sorti du site actif au bout d environ 200 ps pour se retrouver dans le solvant Une deuxi me trajectoire a t simul e apr s avoir prolong la phase initiale d quilibration de 100 ps suppl mentaires voir page 124 en appliquant une contrainte entre les atomes de soufre Cys51 S et DMSO S sous la forme d un potentiel harmonique de 10 kcal mol A 3 5 A pour maintenir le substrat dans le site actif A la suite nous avons effectu notre simulation de 1 ns Ci dessous nous pr sentons l analyse de cette seconde simulation qui n a pas permis de maintenir davantage le sulfoxyde au sein du site actif Les r sultats sont pr sent s dans la figure 6 6 La visualisation de la trajectoire montre au d but de la simulation que le sulfoxyde est entour d une grande quantit
136. 6 11622 2004 Olry A Boschi Muller S Marraud M Sanglier Cianferani S van Dorsselear A et Branlant G J Biol Chem 277 12016 12022 2002 Rouhier N Vieira Dos Santos C Tarrago L et Rey P Photosynth Res 89 247 262 2006 Rouhier N Kauffmann B T te Favier F Palladino P Gans P Branlant G Jacquot J P et Boschi Muller S J Biol Chem 282 3367 3378 2007 Kim H Y Zhang Y Lee B C Kim J R et Gladyshev V N Proteins 74 1008 1017 2009 Lescure A Gautheret D Carbon P et Krol A J Biol Chem 274 38147 38154 1999 Kryukov G V Kumar R A Koc A Sun Z et Gladyshev V N Proc Natl Acad Sci USA 99 4245 4250 2002 Kumar R A Koc A Cerny R L et Gladyshev V N J Biol Chem 277 37527 87535 2002 T te Favier F Cobessi D Boschi Muller S Azza S Branlant G et Aubry A Structure Fold Des 8 1167 1178 2000 Lowther W T Brot N Weissbach H et Matthews B W Biochemistry 39 13307 13312 2000 Taylor A B David M Benglis J Dhandayuthapani S et Hart P J J Bacteriol 185 4119 4126 2003 Ranaivoson F M Antoine M Kauffmann B Boschi Muller S Aubry A Branlant G et Favier F J Mol Biol 377 268 280 2008 Lowther W T Weissbach H Etienne F Brot N et Matthews B W Nat Struct Biol 9 348 352 2002 286 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 2
137. 6 2 RMS de d viation de la cha ne principaledel enzyme 125 6 3 Distances Cys51 Hy Glu94 Oe Cys51 H Tyr197 Oy et angle di dre Cys51 Ca Cys51 Og Oys51 5 Cys51 H dans Free OysH GluP soccer ees 127 274 6 3 6 4 6 4 6 5 6 5 6 6 6 6 6 6 6 6 6 7 6 7 6 7 6 7 6 7 6 8 6 9 6 9 6 9 6 9 7 1 7 2 7 3 7 4 7 5 7 6 7 4 7 8 7 8 7 8 7 8 7 9 TABLE DES FIGURES suite Distances Glu94 O Tyr82 Hy Glu94 O Tyr134Hn Glu94 Oge Tyr82 Hq Glu94 Oeo Tyr134 Hy et angle di dre Glu94 Cg Glu94 C Glu94 Cs Glu94 Oe dans Free CC ES US RUN ES A oe te en 128 Distances Cys51 Hy Glu94 O 1 Cys51 Sy Glu94 He et Cys51 H Tyr197 On dans Free GYSHPGIUA 2 uuu meum e RR ke Ro oder OR E PEOR E Ree Ia Rien 130 suite Solvatation des r sidus Cys51 et Glu94 et distances Tyr82 Hy Glu94 O et Tyr134 Hy Glu94 Og dans Free CysH GluH 8 131 Interaction de Cys51 Sy avec Glu94 H2 et Tyr197 Hn dans Free Cys GluH 133 suite Interaction de Tyr82 Hy et Tyr134 Hy avec Glu94 O dans Free Cys GluH 134 Distances Tyr82 Hy DMSO O Tyr134 Hy DMSO O et Cys51 H DMSO O dans DMSO eB mM Seite td ae oh Be Sy Pew 137 suite Distances Cys51 S DMSO S et Trp53 Ne DMSO Cg et angle di dre Cys51 Co Cys51 Cg Cys51 S Cys
138. 80 Fig 7 8 k ll en est de m me pour l angle di dre Cys51 Cg Cys51 S DMSOH S DMSOH Og qui oscille entre 180 et 270 Fig 7 8 I 176 7 Activation du substrat E940E1 DMH212H E940E2 DMH212H Distance A 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance a Distance Glu94 O DMSOH H E 400 600 1000 0 Temps ps Eu b Distance Cys51 Sy DMSOH S Y197HH C51SG 0 200 400 600 800 MEAN 000 0 Temps ps Biens c Distance Cys51 S Tyr197 Hy Distance A Distance A Fic 7 8 Variation de la distance Glu94 O DMSOH H a de la distance Cys51 S DMSOH S b et de la distance Cys51 Sy Tyr197 Hy c en fonction du temps dans la simulation DMSOH Cys Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 7 3 Dynamique mol culaire du substrat activ 360 T T T T T T T 4 E94CB E94CG E94CD E940E1 270 o KE 9 180 2 P ol 90 i ji 0 l m ull n A d l 0 200 400 600 800 1000 0 90 180 270 Temps ps Angle di dre d Angle di dre Glu94 Cg Glu94 Cy Glu94 Cg Glu94 Oe o Distance A 2 Y82HH E940E1 Y134HH E940E1 0 200 400 600 800 1000 0 2 4 6 Temps ps Distance e Distance Tyr82 Hi Glu94 Oe rouge et Tyr134 H Glu94 Oe bleu Distance Y82HH E940E2 Y134HH E94O0E2 0 200
139. 800 1000 0 5 10 15 20 Temps ps Distance e Distance Trp53 Ne1 DMSO Cg 360 C51CA C51CB C51SG C51HG 270 g E 5 180 o D Z 90 0 0 200 400 600 800 1000 0 90 180 270 360 Temps ps Angle di dre 9 f Angle di dre Cys51 Ca Cys51 Cg Cys51 S Cys51 Hy FIG 6 6 suite Variation de la distance Cys51 Sy DMSO S d de la distance Trp53 Ne DMSO C e et de l angle di dre Cys51 Ca Cys51 Cg Cys51 S Cys51 H f en fonction du temps dans la simulation DMSO CysH Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 4 Complexe enzyme substrat sulfoxyde 139 C51HG E94O0E2 Distance 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance g Distance Cys51 H Glu94 Oe Y82HH E940E1 Y134HH E940E1 Distance A 0 200 400 600 800 10000 2 d 6 8 Temps ps Distance h Distance Tyr82 Hy Glu94 Oe rouge et Tyr134 Hy Glu94 Oe bleu j Il II adi 0 200 400 600 800 1000 0 2 4 6 Temps ps Distance i Distance Tyr82 Hy Glu94 O 2 rouge et Tyr134 Hy Glu94 O bleu Y82HH E940E2 Y134HH E94OE2 Distance FIG 6 6 suite Variation de la distance Cys51 H Glu94 Oc g des distances Tyr82 H Glu94 O et Tyr134 H Glu94 Oe h et des distances Tyr82 Hn Glu94 Oc et Tyr134 Hn Glu94 Oe2 f
140. 800 1000 0 2 4 6 8 Temps ps Distance d Distance Cys51 Hy DMSOO C51CA C51CB C518G C51HG Angle di dre 0 200 400 600 800 1000 0 90 180 270 360 Temps ps Angle di dre 3 e Angle di dre Cys51 Ca Cys51 Cg Cys51 S Cys51 Hy Distance 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance f Distance Cys51 Hy Tyr197 On FIG 6 7 suite Variation de la distance Cys51 H DMSO O d de l angle di dre Cys51 Ca Cys51 Cg Cys51 S Cys51 H e et de la distance Cys51 H Tyr197 O f en fonction du temps dans la simulation DMSO CysH GluH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 4 Complexe enzyme substrat sulfoxyde 145 ANN UN 400 600 1000 0 Temps ps men g Distance Cys51 Sy DMSO S Distance Distance W53NE1 DMS212CA W53NE1 DMS212CB A tm 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance h Distance Trp53 Ne1 DMSO C rouge et Trp53 Ne4 DMSO Og bleu C51CB C51SG DMS212S DMS212CB 0 200 400 600 1000 0 180 270 Temps ps diis di dre i Angle di dre Cys51 Cg Cys51 S DMSO S DMSO Cg Angle di dre FIG 6 7 suite Variation de la distance Cys51 Sy DMSO S g de la distance Trp53 Nz DMSO Ca et Trp53 Ne DMSO Cg h et de l angle di dre Cys51 Cg Cys51 S DMSO S DMSO C i
141. 85 1 03 1 04 1 03 1 04 1 01 1 01 S5 S86 0 49 0 61 0 79 0 88 0 78 0 00 Se O 0 59 0 53 0 46 0 38 0 31 0 02 O7 Hg 0 49 0 78 0 80 0 80 0 81 0 69 Se Cs 0 98 0 98 0 96 0 96 0 99 1 02 Se C13 0 99 0 98 0 86 0 82 0 89 1 02 S5 07 0 21 0 18 0 11 0 25 0 89 Charge u a 2 A TSag B TSgc C C 0 03 0 13 0 13 0 08 0 38 0 28 S5 0 61 0 55 0 24 0 17 0 09 0 09 Se 0 56 0 55 0 39 0 30 0 17 0 17 O7 0 55 0 66 0 69 0 71 0 66 0 40 Hg 0 40 0 35 0 31 0 32 0 33 0 36 Co 0 30 0 44 0 54 0 38 0 25 0 26 Cu 0 41 0 53 0 51 0 60 0 52 0 35 AXE kcal mol 2 A TSB B TSeg c C B3LYP 6 31G d 0 00 254 149 352 30 2 TAB 8 1 Valeurs des distances des angles des ordres de liaison des charges et bilan nerg tique de l interm diaire sulfurane A de l tat de transition TSA pg de l interm diaire sulfurane B de l tat de transition TSg c et de l interm diaire acide sulf nique C dans le syst me isol La g om trie est opti mis e au niveau B3LYP 6 31G d Les charges sont calcul es partir du potentiel lectrostatique En comparaison les valeurs correspondant l interm diaire sulfurane 2 dans le mod le quantique de site actif ont t report es 8 1 M canisme Transfert d un groupement OH 193 a Interm diaire sulfurane A b Etat de transition TSA p c Interm diaire sulfurane B d Etat de transition TSp c e Interm diaire acide sulf nique C Fic 8 2 Structures des interm diaires et tats
142. A Une analyse structurale des r sidus ionisables en interaction permet de compl ter cette identification Le tableau 6 4 regroupe les r sultats de ces analyses L ajout des hydrog nes est r alis par le programme TLEAP du package AMBER en appliquant les tats de protonation que nous avons d ter min s La position de ces hydrog nes est optimis e une premi re fois par minimisation dans le vide en utilisant le programme SANDER du package AMBER Lors de cette tape nous fixons la position de tous les atomes lourds pour conserver la structure globale de l enzyme 6 2 Simulations protocole op ratoire 123 R sidus et Positions Proton Type AMBER Arg 18 57 83 89 97 125 135 150 155 167 Non ARG Asp 4 19 40 101 119 129 146 164 165 166 184 185 Non ASP Cys 86 198 206 Oui CYS Glu 43 56 84 108 116 144 154 172 183 210 Non GLU His 33 118 130 Oui en Ng HID His 7 28 92 186 Oui en Ne HIE His 168 191 Oui en Ns et Ne HIP Lys 5 6 192 Oui LYS Tyr 66 72 76 82 100 107 134 139 180 181 189 195 197 Oui TYR TAB 6 4 Etat de protonation des r sidus ionisables de la MsrA 1FF3 On donne pour chaque r sidu de l enzyme l tat de protonation de sa cha ne lat rale et le type AMBER associ au r sidu partir d une analyse PROPKA compl t e par une analyse des r sidus en interaction c Mise en solution et minimisation La mise en solution est r alis e la suite de la premi re minimisation avec le programme TLEAP Nous ajouto
143. AE et distances des interactions du complexe entre l urate oxydase et l acide urique optimis par ALGOGEN DIVCON avec les m thodes semi empiriques PM3 et PM3 PIF Les distances de la structure cristallographique 3BJP sont report es dans ce tableau en comparaison FIG 4 8 Structure du complexe de l acide urique dans le site actif de l urate oxydase a Structure cristallo graphique SBJP et b Structure dock e par ALGOGEN DIVCON en PM3 PIF partir de la structure 2IBA 82 4 Validation du programme ALGOGEN DIVCON 4 3 Conclusions Nous avons d velopp ALGOGEN DIVCON un programme de docking mol culaire en combi nant un algorithme g n tique pour la recherche conformationnelle et une m thode semi empirique croissance lin aire pour le calcul des nergies d interaction Ce programme permet de r aliser le docking rigide d un syst me prot ine ligand de grande taille avec une description quantique de l nergie Les tests que nous venons de pr senter valident le programme AL GOGEN DIVCON dont les atouts et les limitations sont donn s pr sent a Atouts du programme ALGOGEN DIVCON Compar aux autres programmes de docking que l on peut trouver dans la litt rature le principal int r t l utilisation du programme ALGOGEN DIVCON r side dans le fait que l nergie d interaction entre la prot ine et le ligand est calcul e par une approche quantique semi empirique croissance lin aire Il n est plus n cessaire par
144. AZA 76 4 7 Structure du complexe UOx OXC 79 4 8 Structure du complexe UOx URA 81 5 1 Diff rentes voies d oxydation d une m thionine 89 5 2 Etat de transition de l oxydation d un sulfure par le peroxyde d hydrog ne 91 5 3 Formes limites de m som rie de la fonction sulfoxyde 94 5 4 R duction st r osp cifique de MetSO parles Mer de classe AouB 96 5 5 Cycle catalytique des m thionine sulfoxyder ductases 98 5 6 M canisme catalytique des m thionine sulfoxyder ductases 99 5 7 Alignement des s quences de diff rentes MsrA 100 5 8 Alignement des s quences de diff rentes MsrB 101 5 9 Structure cristallographique de MsrA 104 5 10 Structure cristallographique de MsrB 107 5 11 Chemin r actionnel de la r duction du DMSO par le m thanethiol 1 111 5 12 Chemin r actionnel de la r duction du DMSO par le m thanethiol 2 113 5 13 Chemin r actionnel de la r duction du DMSO par le m thanethiol 3 113 5 14 Chemin r actionnel de la r duction du DMSO par le m thanethiol 4 114 6 1 Nomenclature des atomes du substrat DMSO 121
145. CH3 Met Pd S S OH CyS51 CH NT S 51 CH Fic 8 4 Hypoth se de travail envisag e pour la formation de l interm diaire acide sulf nique partir de l in term diaire sulfurane dans le site actif de l enzyme M canisme Il 1 H 1 e Le transfert d lectron peut tre d crit formellement comme tel entre la cyst ine d proton e et le substrat sulfoxyde proton forme ionique S S ou comme une rupture homolytique de la liaison S S du sulfurane forme cova lente excitation HOMO LUMO La pr sence d esp ces radicalaires a t test e par les exp rimentateurs lors de la d termination du m canisme catalytique Un trappeur de radicaux libres 2 6 di tert butyl 4 methylphenol a t plac pour cela dans le milieu r actionnel Les r sultats ont montr qu il n y a pas modification de ce compos et donc que la formation de radicaux semble exclue Cependant nous ne pouvons pas exclure d embl e le m canisme d crit ci dessus En effet dans l hypoth se que nous formulons les radicaux sont form s in situ et se recombinent rapidement De plus l criture de la figure 8 4 est 8 2 M canisme Il 1 H 1 e7 201 formelle et chaque configuration correspond une r partition bien d termin e des lectrons tat valence bond du syst me chimique sulfurane dont le poids sera fonction principalement de la valeur de la distance S S consid r e et de l influence de l environnement plus ou moins polaire
146. F et Butterfield D A Brain Res Bull 50 133 141 1999 Hou L Kang l Marchant R E et Zagorski M G J Biol Chem 277 40173 40176 2002 Haghighi A Z et Maples K R J Neurosci 43 107 111 1996 Davies K J A Biochimie 83 301 310 2001 Charles C A et Gordon W R Biochem J 26 122 132 1932 Gilbert J B Price V E et Greenstein J P J Biol Chem 180 209 218 1949 Flatmark T et Sletten K J Biol Chem 243 1623 1629 1968 Patel K et Borchardt R T Pharm Res 7 787 798 1990 Lerm M Pop M Fritz G Aktories K et Schmidt G nfect Immun 70 4053 4058 2002 Robinson A B McKerrow J H et Cary P Proc Natl Acad Sci USA 66 753 757 1970 Robinson N E et Robinson A B Molecular Clocks Deamidation of Asparaginyl and Glutaminyl Residues in Peptides and Proteins Althouse Press Cave Junction OR USA CNRS Editions ed 2004 Calligaris M Coord Chem Rev 248 351 375 2004 Price C C et Oae S Sulfur Bonding In Ronald Press New York 1962 Kucsman A et Kapovits l In Organic Sulphur Chemistry Theoretical and Experimental Advances Bernardi F Csizmadia G et Mangini A Eds Elsevier 1985 Davies J A Adv Inorg Chem Radiochem 24 115 187 1981 Dreizler H et Dendle G Z Naturforsch 19a 512 1964 Cioslowski J et Mixon S T Inorg Chem 32 3209 3216 1993 Dobado J A Mart nez Garc a H Molina
147. I appel e tape r ductase le substrat sulfoxyde de m thionine est r duit en m thionine dans un rapport stoechiom trique 1 1 Une premi re cyst ine appel e cyst ine catalytique Cysc est oxyd e en acide sulf nique Les deux tapes suivantes sont d vou es la r g n ration de l enzyme Une deuxi me cyst ine appel e cyst ine de recyclage Cysp se lie avec Cysc par formation d un pont disulfure et limination d une mol cule d eau Il Finalement la Trx vient r duire le pont disulfure de la Msr oxyd e III La formation de l interm diaire 5 2 M thionine sulfoxyde r ductases 99 Cysc SH We Cysc S OH Luss SH Cysn SH H20 Cysc S Cysn S FIG 5 6 M canisme catalytique des Msr faisant intervenir deux r sidus cyst ine Le substrat MetSO est r duit en m thionine lors de l tape r ductase I avec oxydation de Cysc en interm diaire acide sul f nique La r g n ration de l enzyme s effectue par formation d un pont disulfure entre Cysc et Cysp avec l limination d une mol cule d eau Il et la r duction du pont disulfure par la Trx III d apr s Boschi Muller et al 7 et Olry et al acide sulf nique a t mise en vidence partir d une mutation de l enzyme La substitution de la cyst ine de recyclage par une s rine permet l arr t du m canisme apr s l tape r ductase et l accumulation de la forme oxyd e de la Mer dans le milieu 19 5 2 3 Structure primair
148. J M et Sundberg M R J Am Chem Soc 121 3156 3164 1999 Reed A E et von Ragu Schleyer P J Am Chem Soc 112 1434 1445 1990 Renault E et Le Questel J Y J Phys Chem A 108 7232 7240 2004 Landini D Modena G Scorrano G et Taddei F J Am Chem Soc 91 6703 6707 1969 Hansel A Kuschel L Hehl S Lemke C Agricola H J Hoshi T et Heinemann S H FASEB J 16 911 913 2002 Vougier S Mary J et Friguet B Biochem J 373 531 537 2003 Kim H Y et Gladyshev V N Mol Biol Cell 15 1055 1064 2004 Ejiri S I Weissbach H et Brot N J Bacteriol 139 161 164 1979 Olry A Boschi Muller S Yu H Burnel D et Branlant G Protein Sci 14 2828 2837 2005 BIBLIOGRAPHIE 285 202 208 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 Moskovitz J Rahman M A Strassman J Yancey S O Kushner S R Brot N et Weissbach H J Bacteriol 177 502 507 1995 St John G Brot N Ruan J Erdjument Bromage H Tempst P Weissbach H et Nathan C Proc Natl Acad Sci USA 98 9901 9906 2001 Alamuri P et Maier R J Mol Microbiol 53 1397 1406 2004 Douglas T Daniel D S Parida B K Jagannath C et Dhandayuthapani S J Bacteriol 186 3590 3598 2004 Moskovitz J Berlett B S Post
149. Ky identique Ce r sidu a t identifi comme tant le catalyseur acide du m canisme Cette conclusion est renforc e par le fait qu aucun autre r sidu caract re acide ne se situe proximit de la fonction sulfoxyde La mutation E94Q implique aussi une diminution de la constante cin tique mais dans une moindre mesure La substitution d une des deux tyrosines Tyr82 ou Tyr134 par une ph nylalanine a une influence mod r e sur le m canisme La constante cin tique diminue l g rement Par contre cette constante diminue de fa on importante lors de l absence des deux tyrosines Il a t avanc par Antoine et al que lorsqu une seule tyrosine est enlev e Glu94 est sollicit afin de compenser la perte de stabi lisation Le principal r le de ces tyrosines semble tre celui de stabiliser la formation du complexe 5 3 Etudes ant rieures sur l tape r ductase de MsrA 109 micha lien entre le substrat oxyd et l enzyme et par la suite de stabiliser les ventuels interm diaires de r action lors de leurs formations 5 3 3 Etat de protonation des r sidus du site actif Cette m me tude d Antoine et a a permis de d terminer la valeur de pK des diff rents app r sidus du site actif Dans l enzyme MsrA libre de N meningitidis les deux r sidus cyst ine Cysc51 et CysRk198 ont un pK d environ 9 5 Cette valeur se trouve tre l g rement sup rieure celle app g n ralement constat e d
150. Le transfert d lectron peut tre d crit de deux mani res diff rentes chacune li e la nature de liaison S S des deux formes limites ionique S S ou covalente S S Dans le premier cas il s agit du transfert effectif d un lectron de l atome de soufre de la cyst ine vers l atome de soufre du sulfoxyde Dans le deuxi me cas le transfert d lectron peut tre vu comme une ex citation HOMO LUMO Conform ment ce qui a t dit dans le chapitre pr c dent l orbitale LUMO Fig 7 5 se pr sente sous forme d une combinaison anti liante d orbitales atomiques des atomes S S O Le transfert d un lectron de l orbitale HOMO port e majoritairement par le soufre de Cys51 dans l orbitale LUMO conduit assur ment la dissociation des liaisons S S et S O 8 2 2 Propri t s redox des esp ces impliqu es Avant de poursuivre avec l tude de ce m canisme il est important de faire une description globale de la r action d oxydor duction selon laquelle un r sidu cyst ine est oxyd en acide sulf nique et un compos sulfoxyde de m thionine est r duit en m thionine Cette r action peut tre d crite formellement par deux demi quations lectroniques relatives chaque esp ce En consid rant la forme ionique du sulfurane S S le processus l mentaire de transfert d lectron est d crit par les deux demi quations suivantes HG RS e R2S OH e RoS OH Dans le but de d crire ces processus
151. Modification du troisi me bit d un g ne de longueur 6 utilisant un code Gray G ne 100101 101010 Code Gray 110111 gt 111111 x 1 15625 1 3125 L exemple pr c dent illustre bien l utilit de passer par un code Gray pour le codage des g nes Ainsi l op ration de mutation entra ne un plus petit changement de la valeur exprim e par le g ne 44 2 D veloppement d un algorithme g n tique de minimisation 2 3 3 S lection Dans la m thode de s lection pr sent e l origine par Goldberg la probabilit qu un individu Soit s lectionn est proportionnelle son valuation Bien que cette m thode soit tr s efficace elle peut tre consid r e comme insatisfaisante En se souvenant du fonctionnement de la roulette wheel il para t vident que si un individu poss de une probabilit de s lection p tr s grande par rapport celle de ses cong n res la population s lectionn e peut ne contenir que cet individu Ceci induirait sans doute une perte importante d information g n tique assez difficilement compen sable par mutation L op rateur de s lection doit donc tenir compte des deux principes suivants i permettre la convergence de la population vers la solution optimale du probl me et ii viter le ph nom ne d eug nisme reproduction de g notypes identiques en s lectionnant un maximum d individus diff rents La m thode de s lection choisie dans cet algorithme g n tique est la combinais
152. N DIVCON algorithme g n tique et GEOMOP gradients conjugu s avec les m thodes semi empiriques AM1 PM3 et PM3 PIF Les nombres de g n rations et d valuations r alis es par l algorithme g n tique sont indiqu s pour les diff rents cas La figure ci dessus donne la d finition de la distance R et des angles a et B dans le dim re de l eau 70 4 Validation du programme ALGOGEN DIVCON l nergie d interaction obtenue en PM3 passant de 3 43 4 94 kcal mol On se rapproche ainsi de la valeur expirimentale de 5 4 kcal mol et de la valeur consensus de plusieurs m thodes ab initio de haut niveau de 5 0 kcal mol Le nombre de g n rations de l algorithme g n tique indiqu dans le tableau 4 2 est celui partir duquel la structure d nergie minimale a t obtenue Il n est pas surprenant que cette valeur et le nombre d valuations correspondant soit grand pour chacun des cas Ceci est principalement d la taille relativement grande de la bo te de docking dans laquelle la deuxi me mol cule d eau peut se d placer Il est certain que pour ce syst me mol culaire de petite taille une minimisation par la m thode des gradients conjugu s sera toujours plus rapide et plus efficace qu un algorithme g n tique N anmoins ce test illustre la capacit du programme AL GOGEN DIVCON optimiser un syst me mol culaire simple form de deux mol cules en interaction 4 2 Docking dans une prot ine Apr s av
153. Nancy Universit Universit H enri Poincar AVERTISSEMENT Ce document est le fruit d un long travail approuv par le jury de soutenance et mis disposition de l ensemble de la communaut universitaire largie Il est soumis la propri t intellectuelle de l auteur Ceci implique une obligation de citation et de r f rencement lors de l utilisation de ce document D autre part toute contrefa on plagiat reproduction illicite encourt une poursuite p nale Contact SCD Nancy 1 theses sciences scd uhp nancy fr Code de la Propri t Intellectuelle articles L 122 4 Code de la Propri t Intellectuelle articles L 335 2 L 335 10 http www cfcopies com V2 leg leg_droi php http www culture gouv fr culture infos pratiques droits protection htm Nancy Universit universit H enri Poincar U F R Sciences et Techniques de la Mati re et des Proc d s Ecole Doctorale Lorraine de Chimie et Physique Mol culaires SESAMES D partement de Formation Doctorale en Chimie Informatique et Th orique TH SE pr sent e l Universit Henri Poincar Nancy I en vue de l obtention du grade de Docteur de l Universit Henri Poincar Nancy en Chimie Informatique et Th orique par Eddy THIRIOT Mod lisation de la reconnaissance et de la catalyse enzymatiques d veloppements m thodologiques et d termination du m canisme des M thionine Sulfoxyde R ductases de classe A soutenue publ
154. RIVYDPSVISYEOLLQV Q RSAIYPLIPEQDAMARASLE RFQAA B taurus VGFAGGYTPNP SGKTGH VRVVEFQPEHISFEELLKVFWENHDP TOGMRQG ve IRSAIYPTSAEHVGAALKSKEDYQKV II M tuberculosis VGYSGGNIPNA NHG TH VEIIFDPTVTDYRTLLEFFFQOIHDPTTKDRQOGNERGTS RSAIFYFDEQQKRIALDTIADVEAS N meningitidis SGYANGNTKNPOMEDVSYRHTGHAMTVKVTYDADKLSLDDILQYFFRVVDPTSLNKOGNETGTORSGVYYTDPAEKAVIAAALKREOOK III B subtilis SGYTGGHTENP EV SETTGH VQITFHPDVFPYEKLLELFWOQQIDPTDAGGOFABRGS SMRAAIF YHNDKQKELAEASKQRLAES D radiodurans SGYIGGTVPNP SV GGQTGH VRVTFDPNQISYRDLLGLFFATHDPTZLNRQGAMVGTOBRSALFPLTQEQEQTAREMIEQLGTE L esculentum VGYSQGNVHDPNEEKLIESGTTEH IRIQFDPN YSNLLSLFWSRHDPTTLNRQGNEVGKOBRSGIYYYNDAQAQLARESLEAKQKE 160 170 180 r 200 i I E coli MLAADDDRHITTEIANATP ee IGGIG TUA Er ESSE ERR een qui os B taurus LSEHGF GLITTDIREGQTFYYAEDYHOQYLSKDPD LGGIGVSBPLGIKK II M tuberculosis GLWP GKVVTEVSPAGDFWEAEPEHQDYLQRYPN HEF VRPGWRLPRRTAESALRASLSPELGT N meningitidis LPLVVENEPLKNFYDAEEYHQDYLIKNPN IHIDIRKADEPLPGKTKTAPQGKGFDAAT AEGYHOHFYKKNPAHYQRYRTGSGRAGFISEHWGAK AEDYHONYYKNNPGOGY MAVISPKVAKLRQYYGDKLR L esculentum FMD KKIVTEILPAKRFYRAEEYHOQQYLEKGGG R III B subtilis D radiodurans FIG 5 7 Alignement des s quences des MsrA de E coli B taurus M tuberculosis N meningitidis D ra diodurans B subtilis et L esculentum Les s quences sont regroup es par sous classe La premi re ligne indique la num rotation de s quence b
155. SO pr alable la r action d oxydor duction Sur la base des travaux de Balta et al cette activation pourrait avoir lieu par protonation du substrat sulfoxyde Plusieurs outils th oriques seront utilis s dans le cadre de cette tude La d termination du m canisme de protonation du sulfoxyde sera effectu e dans une approche quantique de type DFT qui permettra d valuer le co t nerg tique du processus Des simulations de dynamique mol culaire seront r alis es ensuite pour estimer la stabilit de la forme activ e du sulfoxyde dans le site actif Enfin nous traiterons du m canisme de r duction du substrat conduisant la formation de l inter m diaire acide sulf nique Les m thodes issues de la chimie quantique seront utilis es nouveau dans cette partie pour pouvoir rendre compte de la r activit du syst me mol culaire Apr s avoir tudi la r activit sur un syst me mod le isol nous d crirons le processus dans un mod le du site actif de l enzyme afin de prendre en compte les interactions avec l environnement prot inique Chapitre 6 Reconnaissance et ancrage du substrat Sommaire 6 1 Etat de protonation du site actif 118 6 2 Simulations protocole op ratoire 119 6 3 Enzyme be kao done min dom aie en nn 4 o munis nids 126 6 4 Complexe enzyme substrat sulfoxyde 135 6 5 Conclusions 2 24 zo o or ou a Eom se aus ee
156. SYFQPVDA S e cus senti MTKVVKTDAEWQAQLTPEQYYVTRKKGTERAFTGEYWNNKKPGLYS IPSFWOPLDP D melanogaster DKRYSGPAATMDNKSEKVIVNKEELRKRLTPVQYQVTQEAGTERPFTGEYNKHYEKGVY PAFNDVLDK crescentus MTDAATLSTAGFDLTPP TEAERERLEANLTAEEARVLLHHGTEAPF GGLLGEKSPGVY LPLFKHETKFESGTGPSFYAPFAE II N gonorrhoeae GKTKAAPQGKGFDAATYKKPSDAELKRTLTEEQYQVTQNSATEYAFSHEYDHLFKPGIYVDVVSGEPLFSSADKYDS IPSFTRPIDA V cholerae LROWIDEKNGQANVKAYVRPSDEOQIRAKLTSZLQYKVTORDGTERPFDNEYWDNKEEGIYVDIVSGEPLFSZZTDKYDSKTGPSFTOPLNS 80 90 100 110 120 130 coli ESIBRYINDLSHG 4 MQRIEI multocida EAIRYLDDYTLZ RPRTEI uginosa EAVRELDDFSHG MHRIEV gatus NNIRMERDLSHG MVRTEV melanogaster GKVTLHRDASIPGGNILLLIAHPERIRTEV crescentus DHVVGVRDTSYG MVRIET II N gonorrhoeae KSVTEHDDFSFN MRRTEVRSRAADSELGEV V cholerae SXYIVIKDDNSLE YTRTEVRSRFADS LGMVEPDGPOPTG LG DGPPPTG IMY LGNVEPDGPRPTG IMY VREDGPPPTG LE DGPKPTR ISASLRFTDGENGEEING ISVSMAFEDSETGELIEG ISASLKLVPRES ISAALAFVPESAASZ ISASIEFVNADPATSSPPVATPTAAPIAQQ SVSLQFVKAGAPLPDPLHRGDKIT IGASLKFIPLEOMDAAGYGALKGEVK SAAMRFIPKOEMAAQGYGEYLALFK aer SH VUE Y OA Hi ii Mi lt FIG 5 8 Alignement des s quences des MsrB de E coli P multocida P aeruginosa S elongatus D melano gaster C crescentus N gonorrhoeae et V chole
157. Structure du code 59 3 2 2 Module quaternion py Le formalisme utilis dans le programme pour effectuer la rotation du ligand est celui des qua ternions Il s agit d un type de nombres hypercomplexes quatre composantes constituant une extension des nombres complexes deux composantes Soit Q a ib jc kd un quaternion on appelle a le scalaire de Q et le triplet b c d le vecteur de Q o i j et k des nombres imaginaires tels que i j k ijk 1 Tout vecteur v x y z de l espace r el trois dimensions peut s crire sous la forme d un quater nion imaginaire pur tel que v ix jy kz Un quaternion Q est la repr sentation complexe d une matrice de rotation trois dimensions Donc la transform e v x y z d un vecteur v x y Z selon une rotation de quaternion Q est donn e par la multiplication de quaternions suivante v x y z 2 Q x V x y 2 x Q 3 1 o Q est un quaternion norm et Q le quaternion conjugu de Q Il est possible d crire le quaternion Q correspondant une rotation partir des angles d Euler 0 0 v d crivant cette rotation selon a cos 6 2 cos 0 2 cos w 2 sin 6 2 sin 6 2 sin v 2 b sin 0 2 cos 8 2 cos w 2 cos 6 2 sin 0 2 sin v 2 cos 6 2 sin 8 2 cos w 2 sin 0 2 cos 8 2 sin v 2 cos 0 2 cos 9 2 sin w 2 sin 2 sin 6 2 cos v 2 Le module quaternion py est un module Python d environ 200 lignes Il es
158. T 298 K AS la diff rence d entropie entre la forme oxyd e et la forme r duite en kcal mol K AGgov ox et Gsolv Rea l nergie de solvatation de la forme oxyd e et de la forme r duite en kcal mol Ces valeurs sont calcul es au niveau de th orie B3LYP 6 311 G 2df 2p sur 292 g om tries optimis es B3LYP 6 31 G d Fu et a proposent de corriger la valeur de potentiel d ionisation obtenue ce niveau d un facteur 0 28 eV Le potentiel r dox d un couple relativement 204 8 R duction du substrat l lectrode normale hydrog ne NHE est E Ox Red ue E Ox Red ps E H2 H abs o E H2 H gg est le potentiel r dox absolu associ la demi quation H e A Ho Il vaut 4 44 V dans un milieu aqueux Le tableau 8 5 donne le potentiel r dox absolu de chaque couple calcul en consid rant trois solvants diff rents Cyclohexane DMSO et Eau Le potentiel r dox relatif E Ox Red yug calcul dans l eau est de 0 57 V et 0 46 V respectivement pour les couples CH3 S CH3 S et CH3 2S OH CH3 2S OH En comparaison la d termination exp rimentale du potentiel r dox d un couple thiyl thiolate conduit une valeur comprise entre 0 7 et 1 0 V en milieu aqueux selon le thiol consid r 95 Une mesure exp rimentale du potentiel redox du couple DMSO DMS dans l eau donne une valeur de 0 574 V 96 Les potentiels que nous obtenons ont donc le bon ordre de grandeur La courbe dans la figure
159. Trx in vivo Toutes les MsrA et les MsrB pr sentent un m me m canisme catalytique de type ping pong assimilable aux deux quations suivantes Msrr g MetSO Msrx Met Msrox TrXr d E Msrr g TrXox La r duction des sulfoxydes de m thionine catalys e par les Msr appartient un cycle catalytique form de plusieurs r actions d oxydor duction comme l illustre la figure 5 5 La thior doxine oxyd e TrXox est r duite par le nicotinamide ad nine dinucl otide phosphate NADPH via la thior doxine r ductase TrxR MetSO Ver Im NADPH TD Met Msr Tx NADP FiG 5 5 Cycle catalytique des m thionine sulfoxyde r ductases La m thionine sulfoxyde MetSO est r duite en m thionine Met par la m thionine sulfoxyde r ductase r duite Msr gq La m thionine sulfoxyde r ductase oxyd e Msrox est r duite par la thior doxine r duite Trx 64 La thior doxine oxyd e Trxox est r duite par le nicotinamide ad nine dinucl otide phosphate NADPH catalys par la thior doxine r ductase TrxR Les travaux de Boschi Muller et a pour la classe MsrA et d Olry et a pour la classe MsrB ont montr que les Msr sont des enzymes cyst ines essentielles Plusieurs r sidus cyst ine sont impliqu s dans le m canisme catalytique La figure 5 6 tir e des travaux de Boschi Muller et al et d Olry et al pr sente un m canisme deux cyst ines Lors de la premi re tape du m canisme
160. Tyr82 et Tyr134 l une ou l autre sont impliqu es dans l ancrage liaisons hydrog ne et dans le m canisme de r duction deuxi me protonation Les r sidus Cys51 Glu94 Tyr134 ou Tyr82 sont donc n cessaires l activit de l enzyme MsrA et leur m canisme d action peut tre rapproch de celui d une triade catalytique Perspectives Les travaux pr sent s dans cette th se pourront se prolonger par un certain nombre d tudes Algorithmes de docking En perspective de ce travail de d veloppement et de validation du programme d ALGOGEN DIVCON on peut envisager la mise au point d une version qui permettrait la modification ventuelle de l tat de protonation des r sidus dans le complexe prot ine ligand lors du processus de docking Comme nous l avons vu cet aspect est rendu possible gr ce la description au niveau quantique du syst me mol culaire et pourrait tre incorpor facilement dans notre algorithme g n tique par la d finition d un g ne suppl mentaire dans le chromosome des individus 222 Conclusion g n rale Par ailleurs la m thode semi empirique utilis e pourra tre am lior e pour mieux d crire les inter actions mol culaires Pour ce faire on peut envisager l implantation de diverses approches parues ou para tre dans la litt rature dont celle propos e dans notre laboratoire PM3 MAIS7 75 M canisme des m thionine sulfoxyde r ductases Deux aspects semblent importants appr
161. USA 85 6465 6467 1988 LeDoux S P Driggers W J Hollensworth B S et Wilson G L Mutat Res 464 149 159 1999 Kaur H et Halliwell B FEBS Lett 350 9 12 1994 Dr ge W Physiol Rev 82 47 95 2002 Le Bras M Cl ment M V Pervaiz S et Brenner C Histol Hispathol 20 205 220 2005 Nakao N Kurokawa T Nonami T Tumurkhuu G Koide N et Yokochi T nnate Immunity 14 190 196 2008 Krinsky N I Free Rad Biol Med 7 617 635 1989 Bors W Heller W Michel C et Saran M Methods in Enzymology 186 343 355 1990 Zelko I N Mariani T J et Folz R J Free Rad Biol Med 33 337 349 2002 Davies K J J Biol Chem 262 9895 9901 1987 Sies H Oxidative stress introduction In Oxidative stress oxidants and antioxidants Sies H Ed London Academic Press London 1991 Shechter Y J Biol Chem 261 66 70 1986 Vogt W Free Rad Biol Med 18 93 105 1995 Musker W K Wolford T L et Roush P B J Am Chem Soc 100 6416 6421 1978 Honga J et Sch neich C Free Rad Biol Med 31 1432 1441 2001 Venkataramanan N S Rajagopal S et Vairamani M J Inorg Biochem 101 274 282 2007 Sch neich C Pogocki D Hug G L et Bobrowski K J Am Chem Soc 125 13700 13713 2003 Yamazaki et Piette L H J Biol Chem 265 13589 13594 1990 Bonifa i M M ckel H Bahnemann D et Asmus K D J Chem Soc Perkin Trans 2 675
162. _ init C Input Last select s Output reproduce os run pickle Computation Evaluation Data EvaluationRequired m Info EvaluationProcessed Queue start evaluate Fic 2 5 Diagramme UML simplifi du module genetic py 2 3 Programmation de l algorithme g n tique 41 luation r sultat de la fonction de score Une population est un objet structur comme tant une liste d individus et dot d une fonction sort pour trier les individus selon leur valuation croissante La classe Ga est la classe principale de ce module Pour fonctionner elle n cessite l importation de librairies Python standards telles que random pour la g n ration de nombres al atoires os et sys pour la communication avec le syst me d exploitation et pickle n cessaire la cr ation de points de sauvegarde Cette classe contient diff rents attributs comme Population pour la popu lation courante History pour l historique des individus etc Il y a aussi les fonctions n cessaires au processus de minimisation comme init pour l initialisation d une population select et reproduce pour la s lection et la reproduction des individus Dans le cadre que l on s est fix d s la conception du programme l valuation est totalement dissoci e du processus de minimisation Cette t che est d volue la fonction evaluate de la classe Evaluation Cette derni re est en fait une interface au processus d valuati
163. a chaine N terminale Les deux extr mit s de l enzyme ne poss dent aucun r sidu impliqu dans le m canisme catalytique Contrairement aux MsrA cette structure de MsrB poss de des homologues dans les bases de donn es structurales comme par exemple les prot ines Mss4 et TCTP Le site actif de MsrB est de la m me fa on que celui de MsrA structur autour de Cysc 117 loca lis e sur un brin D La cha ne lat rale de cette cyst ine n est pas orient e vers le tonneau p qui offre pourtant une large cavit accessible Elle se situe au fond d une poche secondaire la surface de l enzyme qui constitue le site actif L architecture du site actif des MsrA et MsrB ne pr sente aucune similarit La proportion de r sidus aromatiques est largement inf rieure Les r sidus conserv s Trp65 His100 His103 Arg115 et Asn120 sont pr sents dans le site actif Dans les conditions utilis es pour effectuer la cristallographie de rayons X de la MsrB de N me ningitidis une mol cule du tampon cacodylate AsO CH a t complex e dans le site actif de l enzyme Ce ligand peut jouer le r le de mime du substrat MetSO permettant de proposer quelques hypoth ses quant la reconnaissance du subtrat par le site actif e un azote du noyau imidazole de His100 d une part et une mol cule d eau en liaison hydrog ne avec Asn120 et His103 d autre part forment un r seau de liaisons hydrog ne avec l oxyg ne du sulfoxyde e le groupe
164. a lien l activation du substrat par protonation cr erait par cons quent une paire d ions dans le site actif qui pourrait servir de force motrice pour le processus de r duction rs m 2 yme BO S Suc 3 cH Al CySs Met Formation du complexe H Porc micha lien Met e Met 1 5 S S 0 S OS OH d Activation 7 CySs1 A du substrat Cyss I Fic 7 1 M canisme suppos de l tape r ductase La d protonation de la cyst ine catalytique est obtenue lors de l ancrage du substrat dans le site actif de l enzyme A On peut envisager ensuite une activation du substrat par protonation B facilitant la r duction du sulfoxyde de m thionine et la formation de l interm diaire acide sulf nique D En effet la protonation de la fonction sulfoxyde modifie fortement les propri t s physico chimiques de ce substrat et notamment sa structure lectronique Pour rappel la nature de la liaison S O dans 7 2 M canisme de transfert de proton 159 la fonction sulfoxyde est caract ris e de semi polaire Elle est la contribution d une liaison o cova lente fortement polaris e et d une liaison x fortement ionique La protonation entra ne la perte de la liaison x et la diminution de l ordre de liaison S O En ce qui concerne la structure g om trique la longueur de cette liaison augmente les donn es cristallographiques sont en moyenne de 1 492 pour le sulfoxyde et 1 524 pour le sul
165. a conformation obtenue du syst me prot ine ligand Cette valeur n est pas reli e directement une grandeur nerg tique du syst me sauf dans le cas de l utilisation d un champ de forces o le score est donn par les nergies d interac tion intermol culaire Des calculs suppl mentaires sont donc n cessaires partir des conformations optimales pour d terminer la valeur de l enthalpie libre de formation 1 2 2 Algorithme de recherche Le deuxi me l ment d importance d un programme de docking mol culaire est l algorithme de recherche Comme nous l avons vu pr c demment l espace de recherche est constitu de toutes les conformations possibles du ligand par rapport la prot ine augment par toutes les conformations internes du ligand et ventuellement de la prot ine pour un docking flexible Malgr les avanc es technologiques actuelles du mat riel informatique il reste impossible d explorer de mani re exhaus tive cet espace de recherche et plusieurs strat gies ont d tre d velopp es pour l chantillonner efficacement e simulations de dynamique mol culaire gros grains pour sugg rer des conformations conve nables de syst mes prot ine ligand e analyse de plusieurs structures connues de la m me prot ine pour conna tre sa flexibilit e utilisation d algorithmes dits volutionnaires comme les algorithmes g n tiques pour per mettre le passage d une conformation une autre repr sentan
166. ableau pour com paraison FiG 4 7 Structure du complexe de l acide oxonique dans le site actif de l urate oxydase a Structure cristal lographique 1R4U et b Structure dock e par ALGOGEN DIVCON en PM3 PIF partir de la structure 2IBA 80 4 Validation du programme ALGOGEN DIVCON Nous observons sur la figure 4 7 que le ligand OXC se trouve l g rement inclin dans la structure dock e avec ALGOGEN DIVCON en comparaison avec la structure 1R4U L analyse des diff rentes interactions pr sentes dans la structure dock e montre une forte interaction st rique et lectrosta tique entre le groupe carboxylate de l acide oxonique et la mol cule d eau W2 Dans 2IBA et 1R4U cette mol cule est toujours plac e dans le plan des interactions d fini par la chaine lat rale des r sidus Arg176 et Gln228 et l atome d azote de la cha ne principale de Thr57 Les sites actifs 2IBA et 1R4U se r v lent tre grandement similaires sauf au niveau de cette mol cule W2 Elle est loign e du centre du site actif d environ 0 5 dans 1R4U par rapport 2IBA donnant ainsi assez d espace la formation du complexe avec OXC La mol cule d eau W2 fait partie de la partie enzyme et sa po sition est fixe dans le processus de docking rigide Il n existe donc pas de relaxation de g om trie au niveau de cette mol cule emp chant ainsi le positionnement correct du ligand OXC comme dans la structure 1R4U D un point de vue nerg tique la forte intera
167. acer les mol cules de solvant et iii quilibration thermodynamique du syst me Il s en suit une phase de production d une dur e de 650 ps dans l ensemble NPT P 1 atm T 300 K avec un pas de temps de 0 5 fs La trajectoire n a pas pu tre poursuivie au del car partir de 650 ps nous remarquons une augmentation brutale de l nergie cin tique du r sidu Sulf L origine de ce ph nom ne n a pas t lucid e Des tests ont t r alis s en utilisant d autres param tres notamment en y incorporant un potentiel de Lennard Jones pour les atomes HO et LP mais sans r sultats probants Une simulation de ce r sidu Sulf seul dans une bo te d eau a reproduit le m me ph nom ne c Analyse de la trajectoire Les r sultats de la simulation nomm e Sulf Glu sont regroup s dans la figure 7 10 Nous ob servons une interaction par liaison hydrog ne de l hydrog ne HO de Sulf avec les oxyg nes O et Oe de Glu94 Cette interaction est partag e la fois par les deux atomes Fig 7 10 a et 7 10 b L atome d hydrog ne se trouve quidistance de 2 L extr mit de la chaine lat rale de Glu94 est peu mobile comme on peut le constater sur la variation de l angle di dre autour de la liaison 184 7 Activation du substrat Cy Cs Fig 7 10 c L oxyg ne Oe du sulfurane forme des liaisons hydrog ne fortes avec Tyr82 H et Tyr134 H Fig 7 10 d et 7 10 e une distance fluctuant principalement autour de 1 8 A Lin
168. alta et al proposent le m canisme d crit dans la figure 5 12 Le complexe 5 form partir du sulfurane 3 et d une mol cule de m thanethiol additionnelle se dissocie pour former le complexe 6 o sont pr sents les ions sulfuranyle CHsS S CH3 2 7 et thiolate CH3S 8 Une mol cule d eau o l atome d oxyg ne est celui initialement port par la fonction sulfoxyde a t form e L nergie d activation correspondant cette dissociation vaut 13 3 kcal mol Suite cette dissociation plusieurs produits de r action ont t envisag s Nous ne pr senterons ici que le chemin r actionnel conduisant la formation de l acide sulf nique illustr par la figure 5 13 Le complexe 6 m ne la formation de l acide sulf nique 10 et du dim thylsulfure 12 produit de la r duction du DMSO Dans le m me temps la mol cule de m thanethiol additionnelle est reprotonn e Le calcul de l IRC de l tat de transition TSg un vers les r actifs montre que cette transformation n est pas directe Elle n cessite la r organisation du syst me r actif La mol cule d eau initiale ment pr sente au milieu des ions 7 et 8 et permettant d assurer la s paration de charge dans le complexe 6 doit migrer proximit de l atome de soufre conduisant l acide sulf nique L nergie n cessaire cette transformation est de 0 9 kcal mol 5 3 Etudes ant rieures sur l tape r ductase de MsrA 113 uo 5s H Ps gt
169. aque individu ne poss de qu un seul chromosome contenant tous les g nes 34 2 D veloppement d un algorithme g n tique de minimisation 2 2 2 Exemple de minimisation Nous allons voir d autres notions importantes des algorithmes g n tiques travers un exemple inspir du livre de Goldberg Nous nous proposons de trouver le minimum de la fonction f x x sur l intervalle entier 0 31 Fig 2 3 1000 800 600 400 F 200 0 10 20 30 x FIG 2 3 Fonction f x x minimiser d finie dans l intervalle entier 0 31 a Fonction de score Dans un algorithme g n tique il nous faut discerner les individus correspondant des solutions potentiellement bonnes de ceux rejeter Le moyen utilis pour cela est de donner une valeur num rique d valuation chaque individu Cette valeur aussi appel e score ou fitness est le r sultat d une fonction appel e fonction de score appliqu e au d codage du chromosome de l individu Elle mesure le potentiel de chaque individu tre une bonne solution au probl me donn Ici dans notre exemple la fonction de score est consid r e comme tant la fonction f minimiser b Codage Chaque variable x que nous souhaitons exprimer doit tre cod e de mani re unique dans un g ne de taille finie Il existe plusieurs fa ons de coder cette variable x comme nous le verrons par la suite Mais pour le moment utilisons un codage simple le co
170. as e sur E coli Les cyst ines impliqu es dans le m ca nisme catalytique sont surlign es en bleu les autres en vert et les r sidus du site actif en rouge Tir de Kauffmann et al 1 MsrA Cette sous classe est caract ris e par la pr sence de deux Cysg en position 198 et 206 ou 207 La premi re appartient au motif conserv 59 GYCG 9 et est s par e de la seconde par une s quence riche en Gly Lors de l tape de r g n ration de l enzyme deux ponts disulfure sont form s cons cutivement 51 198 puis 198 206 Ce dernier est r duit pr f rentiellement par la Trx Les MsrA dE coli humaine et bovine Bos taurus sont repr sentatives de cette sous classe MsrA Cette sous classe est caract ris e par la pr sence d une Cysg en position 198 Pour la plupart des MsrA cette Cys appartient au motif conserv 495 GY CH19o tel est le cas de la MsrA de Neisseria meningitidis Certains organismes comme Mycobacterium tuberculosis pr sentent l inser tion d un r sidu avant Cysg selon le motif GYxCH MsrA Cette sous classe est caract ris e par la pr sence d une Cysg en position 54 Le motif soGCFWGs4 commun aux autres sous classes devient donc 55GCFWOs pour celle ci La MsrA de Bacillus subtilis est repr sentative de cette sous classe On remarque aussi que certaines MsrA de cette sous classe comme celle de Deinococcus radiodurans poss dent une autre cyst ine en position 198 L implication de celle ci dans le proce
171. ation peut aussi tre repr sent par e un potentiel de Morse 2 V longation K longation e r red A 12 e un potentiel anharmonique Vater pff a betr n A 13 longation 5 e r ra ta a r ra ui a r ra A 13 Flexion Le terme de flexion d crit la force r sultant de la d formation des angles de valence entre trois atomes li s 2 Vilexion Kilexion 0 m Beq A 14 o 0 est l angle de valence entre les atomes 6 l angle d quilibre et kiexion la constante de force Les constantes de force de flexion sont nettement plus faibles que celles d longation conform ment ce que l on peut observer lors d tudes de spectroscopie IR ou de calculs de fr quences en chimie quantique Torsion Les termes de torsion ou di draux propres sont g n ralement plus faibles que ceux d longation et de flexion Ils d crivent les barri res de rotation existantes entre quatre atomes li s et sont d crits par une fonction p riodique Viorsion Ktorsion 1 cos mp 9 avec m 1 2 6 A 15 o est l angle di dre form par les deux plans d atomes participant la rotation consid r e Trois param tres caract risent ce potentiel 6 l angle de phase ktorsion la constante d interaction et m la multiplicit du potentiel de torsion A 2 M canique et dynamique mol culaires 233 Torsion impropre D autres termes di draux dits impropres sont parfois utilis s pour maintenir la chiralit o
172. atiques importantes La deuxi me mol cule explicite de solvant inter vient dans une grande proportion dans la stabilisation des diff rents interm diaires de r action comme on peut le voir pour les structures 2 4 La cr ation de liaisons hydrog ne entre les diff rentes esp ces du syst me est tr s importante dans l abaissement des barri res nerg tiques Tout au long du chemin r actionnel la mol cule de DMSO se repositionne afin de stabiliser la s paration de charge 5 3 Etudes ant rieures sur l tape r ductase de MsrA 111 Gi a amp eo s 169 D 1 1 06 gt S E amp amp A 20 Ov amp S a amp e 9 e C bk l m Em d 1717 d T a m d CM E s e AE 20 0 3 e S f i g j TS _2 C rn H WE gt AE 204 a D rcm yt 1 P 0 2 lt L AE 0 0 e amp AE 18 0 A Sai vw D Le RK m amp e 4 688 S 908 R rt 3076 s 244 sx W Ss in P Eo iw ias ee ey eu FY am 4 AE 58 amp rad amp 138 amp D Oh eg LC amp AE 45 5 Fig 5 11 Chemin r actionnel de la r duction du DMSO par le m thanethiol formation de l interm diaire sulfurane Les g om tries sont optimis es au niveau B3LYP 6 311G d p et les nergies calcul es au niveau MP2 6 311 G 3d2f 2df 2p Le terme AE inclut l nergie libre lectrostatique de solvatation dans le continuum di lectrique relativement au complexe 1 Les valeurs do
173. bits modifi s par cette op ration Ceci implique qu aucun bit ne soit modifi lors de l tape de mutation Une fois l tape de repro duction effectu e la nouvelle population d individus est valu e Les r sultats sont report s dans le tableau 2 3 Individu Parents Position Enfants x f x 1 01010 2 01111 15 225 3 00111 00010 2 4 2 01100 4 01101 13 169 3 00111 00110 6 36 Total 434 Moyen 108 5 Minimum 4 Maximum 225 TAB 2 3 Cr ation d une nouvelle population d individus Les chromosomes de chaque couple d individus subissent un croisement pour former les individus de la nouvelle g n ration Apr s un seul cycle de reproduction nous observons que le minimum de la fonction f x est pass de 49 4 De m me la valeur moyenne a diminu de 194 25 108 5 Bien que la recherche du minimum n ait t en fait qu un tirage de nombres al atoires nous remarquons que l ensemble de la population converge vers le minimum de la fonction Les fondements th oriques des algorithmes g n tiques ont t mis en quations par J Holland 6 sous le nom de Schema theorem Ce th or me permet de d montrer qu il est possible d atteindre la solution optimale de tout probl me par un tel processus 2 3 Programmation de l algorithme g n tique 39 2 3 Programmation de l algorithme g n tique Bien que con u initialement dans le cadre du d veloppement du programme de docking nous avions le souhait que l algorithme g n t
174. caract ris par une fr quence imaginaire de 391i cm dont le mode normal de vibration correspond au transfert du groupement OH du soufre Sg au soufre Ss Cet tat de transition a un caract re relativement pr coce avec une distance Sg O de 2 20 et S5 O de 2 40 ordre de liaison de 0 31 et 0 25 respectivement Langle S5 S6 O l tat de transition vaut 64 8 L analyse des charges atomiques montre une continuit du transfert lectronique d j observ au niveau du sulfurane B La charge atomique passe de 0 17 0 09 u a pour le soufre Ss et diminue de 0 30 0 17 u a pour le soufre Se e Interm diaire acide sulf nique C Le chemin de r action aboutit au produit de la r action C illustr dans la figure 8 2 e constitu par l interm diaire acide sulf nique et le dim thylsulfure On peut noter la valeur de l angle di dre C4 85 0 Hg de 91 3 similaire celle observ e dans les peroxydes et les disulfures et dont l origine se trouve dans un effet d hyperconjugaison f Bilan nerg tique Les valeurs d nergie de chacune des esp ces pr sent es pr c demment sont regroup es dans le tableau 8 1 Elles ont t calcul es relativement l interm diaire sulfurane A pris comme r f rence des nergies Les variations d nergie mises en jeu dans ce chemin r actionnel sont relati vement importantes L interm diaire sulfurane B se situe 14 9 kcal mol au dessus de son homo logue A comparer
175. ce biais de poss der les param tres sp cifiques la description du ligand et de ses interaction avec la prot ine Le programme ALGOGEN DIVCON optimise l orientation et la position d un ligand par rapport une prot ine par l interm diaire d un algorithme g n tique Nos deux premiers exemples la structure du dim re de l eau et le docking de la 8 azaxanthine dans le site actif de l urate oxydase Petit sys t me montrent l aptitude du programme dans l obtention d un minimum global ALGOGEN DIVCON converge vers la m me g om trie que celle obtenue par la m thode des gradients conjugu s du programme GEOMOP Les structures dock es en PM3 correspondent la m me nergie d interac tion Tous les tests de docking de ligand dans le site actif de l urate oxydase petit et grand syst me ont montr que les structures dock es sont tr s proches des structures cristallographiques connues Les m thodes semi empiriques PM3 et PM3 PIF ont t utilis es dans le cadre de cette tude Aucune conclusion concernant les performances relatives d une approche par rapport l autre ne peut tre extraite des diff rents tests Il semblerait que l hamiltonien PM3 PIF permette une conver gence plus rapide vers la structure optimale que PM3 mais des tests compl mentaires sur d autres syst mes mol culaires doivent tre r alis s pour v rifier cette affirmation D apr s nos tests de docking mol culaire de petits ligands dans le site a
176. cela une posi tion k appel e point de croisement est choisie al atoirement dans l intervalle 1 L 1 o L est la longueur du g ne Deux nouveaux g nes sont alors cr s en permutant tous les bits entre les positions k 4 1 et L inclu Par exemple consid rons les individus 1 et 2 de notre population s lectionn e Supposons que nous obtenons k 3 par tirage al atoire d un nombre entre 1 et 4 Nous rep rons par une barre verticale rouge cette position dans chaque g ne Le r sultat du croisement est la formation de deux nouveaux g nes 1 et 2 1 010 10 010100 1 2 011 00 01110 2 Nous remarquons qu avec un croisement en un seul point un morceau l extr mit des deux g nes est chang Il est vident que si nous effectuons une nouvelle fois le croisement de ces deux g nes une position diff rente un morceau l int rieur est alors chang tout en conservant les extr mit s initiales des g nes Cette op ration est appel e 2 points crossover La mutation est une op ration unaire qui ne prend en compte qu un seul g ne Elle transforme un bit de celui ci en tout autre bit de l alohabet de codage une position k appel e point de mutation choisie al atoirement dans l intervalle 1 L L tant toujours la longueur du g ne Par exemple consid rons l individu 2 obtenu pr c demment et un point de mutation k 4 choisi au hasard Nous rep rons par un soulignement rouge cette positi
177. cette fonction pour les n variables consid r es Exemple D finition de la fonction carre r alisant le calcul de f x y x y def carre x y return x 2 ae B 4 2 D finition de la fonction d arr t La fonction d arr t StopF unct ion doit renvoyer True si les crit res d arr t sont atteints sinon elle doit renvoyer False Exemple D finition de la fonction stop pour arr ter le cycle de reproduction de l algorithme si le chromosome du meilleur individu de la g n ration en cours est pr sent dans au moins 90 des individus de la population et pendant au moins 5 g n rations successives def stop def individualtountisndividual population count 0 for ind in population if repr ind repr individual count 1 return count if ga Index ga User StopFlag 0 if individualCount ga BestIndividual ga Population gt int parameters Populationsize 9 ga User StopFlag 1 else ga User StopFlag 0 if ga User StopFlag 5 return True else return False Remarque Nous avons utilis une variable nomm e StopFlag de l espace de nom r serv aux utilisateurs pour cr er un compteur propre cette fonction d arr t B 4 3 D finition de la fonction de contr le La fonction de contr le Cont rolFunction ex cute des instructions propres l utilisateur l int rieur m me du cycle de reproduction des individus Cette fonction ne doit rien retourner au programme
178. cha ne principale atomes lourds de l enzyme en fonction du temps de simulation pour les six syst mes simul s 126 6 Reconnaissance et ancrage du substrat 6 3 Enzyme libre 6 3 1 Etat de protonation CysH Glu Quelques r sultats de la simulation sont pr sent s dans la figure 6 3 Nous observons une in teraction relativement forte entre l hydrog ne Hy de Cys51 et l oxyg ne Oe de Glu94 Fig 6 3 a L histogramme montre deux maxima de probabilit autour de 2 et 5 En fait on observe des chan gements fr quents entre ces deux distances au cours de la simulation Par ailleurs la figure 6 3 b montre que la distance Cys51 Hy Tyr197 Oq oscille autour de 4 et de 6 Ces interactions s expliquent par une variation de l angle di dre de Cys51 autour de la liaison Cg Sy Fig 6 3 c Lorsque cet angle est autour de 60 il y a une liaison hydrog ne forte entre CysH et Glu Lorsque cet angle augmente 180 cette liaison est rompue et Cys51 interagit avec Tyr197 par l interm diaire d une mol cule d eau La simulation montre aussi une interaction importante entre Tyr134 et Glu94 Les distances Glu94 Oe2 Tyr134 Hy et Glu94 O Tyr134 Hq valent entre 2 et 3 sur toute la simulation partir de 150 ps Fig 6 3 d et 6 3 e Auparavant on remarque une rotation libre de l extr mit de la cha ne lat rale de Glu94 autour de la liaison Cy Cs Fig 6 3 f Nous n avons pas observ ce type d intera
179. chniques cristallographie par diffraction de rayons X spectroscopie par r sonance magn tique nucl aire etc La Protein Data Bank PDB est une source de donn es fondamentale dans ce sens Cependant les structures d termin es exp rimentalement sont fr quemment incompl tes C est le cas notamment de celles obtenues par diffraction de rayons X donnant uniquement la position des atomes lourds et rendant n cessaire l ajout des atomes d hydrog ne Cette tape est relativement facile mettre en oeuvre pour la plupart des r sidus mais un probl me peut toutefois se poser pour 4l es m thodes d homologie de s quences n cessitent aussi la connaissance de structures exp rimentales pour propo ser une structure mod le Introduction objectifs 15 S Non catalys Enthalpie libre E S Catalyse enzymatique E P E P Fig Li Sch ma du bilan nerg tique d une catalyse enzymatique La formation du complexe enzyme substrat E S permet de diminuer l nergie d activation de la r action AG Tir du livre Biochemistry de Voet et al les r sidus ionisables dont les propri t s acido basiques conditionnent la r activit de l enzyme Ces r sidus peuvent parfois tre enfouis profond ment au sein de l enzyme ou tre en interaction avec d autres r sidus leur valeur de pK peut ainsi subir de fortes modifications Il existe diff rentes m thodes permettant la pr diction du pK des r sidus da
180. ctif de l urate oxydase Grand syst me 700 atomes l utilisation de la croissance lin aire permet un speed up sup rieur 4 par rapport aux calculs semi empiriques standards avec diagonalisations compl tes de la matrice de Fock De plus comme le programme ALGOGEN DIVCON requiert l valuation simulta EEE E n e de chaque individu de la population chaque g n ration l ensemble des valuations peut tre r partie sur un cluster de PC Afin de gagner encore plus en efficacit il est possible d utiliser les propri t s intrins ques de parall lisme de la m thode Divide amp Conquer en r alisant un calcul pa rall le de l valuation de chaque individu sur plusieurs processeurs cette propri t n a pas t mise en uvre dans le cadre de cette tude Bien que certaines techniques de traitement partiellement quantique soient apparues r cemment 128 130 AL GOGEN DIVCON reste notre connaissance le premier en vue de r aliser un docking programme r alisant un docking mol culaire rigide avec une description totalement quantique d un syst me prot ine ligand de grande taille Dans les tests que nous avons pr sent s l tat de protonation du syst me prot ine ligand tait connu par avance car celui de l urate oxydase impose celui du ligand Malheureusement ce n est pas toujours le cas et plusieurs tats de protonation doivent souvent tre pris en compte pour les diff rentes simulations de docking C
181. ctifs angle C S C de 100 Une statistique faite sur 119 structures de sulfoxydes non coordin s conduit une longueur de liaison S O r f rence de 1 492 97 b Nature de la liaison S O La nature de la liaison entre les atomes de soufre et d oxyg ne des compos s sulfoxyde est un sujet majeur de controverse En effet l criture formelle de la double liaison S O covalente de la fonction sulfoxyde est en violation avec la r gle de l octet en faisant passer le nombre d lectrons de valence de l atome de soufre de 8 10 Pour cette raison une structure a t propos e dans laquelle l oxyg ne n est li au soufre que par une seule paire d lectrons partag s et provenant de l atome de soufre Ce type de liaison implique la perte d un lectron par le soufre et le gain d un lectron par l oxyg ne Il en r sulte alors une charge positive port e par le soufre et une charge n gative port e par l oxyg ne Ainsi cette liaison pourrait tre d crite comme la combinaison d une liaison covalente simple et d une liaison ionique Ce type de liaison est appel liaison semi polaire Un quilibre de r sonance entre les structures double liaison covalente et liaison semi polaire peut tre consid r Fig 5 3 o oi 0 AN s N A lt N Fig 5 3 Formes limites de m som rie de la fonction sulfoxyde La liaison entre le soufre et l oxyg ne peut tre d crite sous deux formes limites une double liaison gauche ou
182. ction lectrostatique existante implique une nergie d interaction plus faible en valeur absolue que celle obtenue pour le ligand AZA 4 2 3 Docking de l acide urique dans le site actif de l urate oxydase L acide urique URA est le substrat naturel de l urate oxydase R cemment une structure cristal lographique de son complexe avec l enzyme a t publi e sous le code PDB 3BJP Ce compos poss de une structure analogue celle de la 8 azaxanthine o l azote en position 8 est remplac par un groupement carbonyle Figure 4 5 La structure anionique de l acide urique est impos e par la composition et la structure du site actif de l urate oxydase Le ligand se pr sente donc sous la forme d un dianion 3 2178 Nous avons r alis le docking de l acide urique dans le site actif de l urate oxydase avec les m thodes PM3 et PM3 PIF et l approche Divide amp Conquer Le syst me enzymatique est construit en prenant tous les atomes l int rieur d une bo te cubique de 12 de c t plac e au centre du site actif partir de la structure pr par e 21BA La partie enzyme est identique celle du docking des ligands AZA et OXC La structure dock e du complexe UOx URA a t obtenue apr s 228 g n rations en PM3 et 97 g n rations en PM3 PIF soit 3568 et 1584 valuations respectivement Les r sultats sont regroup s dans le tableau 4 5 Les structures dock es sont toutes les deux tr s proches de la structure cris ta
183. ction entre Tyr82 et Glu94 Fig 6 3 d et 6 3 e La solvatation des r sidus du site actif a t analys e Les r sultats montrent que le r sidu Cys51 est solvat par 4 5 mol cules de solvant mol cules une distance inf rieure 3 4 et Glu94 par 2 3 mol cules r sultats non montr s D apr s cette simulation donc un tat de protonation CysH Glu pour l enzyme libre conduirait une interaction stabilisante entre l hydrog ne Hy port par Cys51 catalytique et l oxyg ne Oc de Glu94 et l existence de liaisons hydrog ne entre les oxyg nes de Glu94 et l hydrog ne de Tyr134 Un sch ma des interactions entre les r sidus du site actif est illustr dans la figure ci dessous Tyri34 Tyr 97 O O Tyrg2 Ne a O H H Fe K H s H 0 Glug 6 3 Enzyme libre 127 C51HG E940E2 Distance 0 200 400 600 800 1000 2 4 6 8 10 Temps ps Distance a Distance Cys51 Hy Glu94 Og2 Distance A 0 200 400 600 800 1000 0 2 4 6 8 10 Temps ps Distance b Distance Cys51 H Tyr197 Oq C51CA C51CB C51SG C51HG Angle di dre 0 200 400 600 800 10000 90 180 270 360 Temps ps Angle di dre c Angle di dre Cys51 Ca Cys51 Cg Cys51 Sy Cys51 Hy FIG 6 3 Variation de la distance Cys51 H Glu94 Oz2 a de la distance Cys51 H Tyr197 Oy b et de l angle di dre Cys51 Co Cys51 Cg Cys51 S Cys51 Hy c en foncti
184. ctrostatique globale Les r sidus du site actif ont une charge globale de 1 u a petit et grand syst me et le ligand AZA une charge de 1 u a Ceci implique une interaction inter mol culaire n gative stabilis e davantage par l tablissement de plusieurs liaisons hydrog ne dans le complexe L tat de protonation particulier du ligand AZA oriente correctement celui ci dans le site actif de l enzyme comme on peut le voir sur la figure 4 6 L urate oxydase poss de la propri t de s lectionner l tat de protonation appropri de son substrat 9 Tout autre tat de protonation conduirait un r sultat de docking totalement diff rent correspondant une nergie d interaction plus lev e r sultats non pr sent s Nous constatons aussi qu il n y a pas de grandes diff rences entre le petit et le grand syst me concernant la structure dock e Avec l hamiltonien PMS les structures dock es sont tr s similaires Les RMS de d viation du ligand AZA entre 2IBA et ALGOGEN DIVCON sont de 0 12 et 0 14 dans le petit et le grand syst me respectivement Avec PM3 PIF ces RMS sont de 0 30 et 0 23 respectivement Ce dernier cas semble nous indiquer que l augmentation de la taille du syst me tend am liorer le r sultat du docking Les nergies d interaction sont tr s diff rentes d une part entre PM3 et PM3 PIF et d autre part entre le petit et le grand syst me L nergie d interaction en PM3 PIF est toujours plus
185. d un complexe stabilis par l existence d in teractions diverses liaison hydrog ne lectrostatique van der Waals etc Ce complexe appel complexe micha lien ou complexe de Michaelis conditionne la r activit de l enzyme et la d ter mination de sa structure est primordiale pour comprendre le m canisme r actionnel En principe les simulations de dynamique mol culaire ou de Monte Carlo peuvent rendre compte de la structure du complexe prot ine ligand et de la valeur nerg tique d affinit 17 Cependant l utilisation de ce type d approche dans le cadre de la reconnaissance mol culaire est relativement r cente cause de certaines limitations D une part les champs de forces utilis s ne permettent pas toujours d obtenir une valeur pr cise de l affinit et d autre part la proc dure n cessite la produc tion de trajectoires tr s longues pour avoir un chantillonage suffisament complet Les m thodes de docking mol culaire ont t d velopp es pour traiter plus sp cifiquement de l ancrage d un li gand Elles reposent pour certaines sur une approche de m canique mol culaire comme pour les simulations avec quelques modifications pour simplifier le traitement Le chapitre 1 de ce manuscrit traite plus en d tail de ces m thodes c M canisme de r action Pour la d termination du m canisme r actionnel l utilisation des m thodes de la chimie quantique s av re indispensable car il s agit de d
186. dage entier en base 2 De cette facon chaque valeur enti re de l intervalle 0 31 est repr sent e de mani re unique par un g ne de cing bits Par exemple la valeur 13 sera cod e par 01101 car 0x2 1x2 1 2 5 0x2 41x2 13 2 2 Principe des algorithmes g n tiques 35 Le probl me de minimisation que nous avons traiter ici ne poss de qu une seule dimension Le chromosome de chaque individu est donc constitu d un seul et unique g ne Ce dernier est suffisant l expression d une solution potentielle c Population initiale Avant de d marrer le processus de minimisation il faut se munir d une population initiale d indivi dus G n rons une population al atoire de quatre individus Pour cela tirons pile ou face cing fois de suite pour construire le chromosome de chaque individu pile 1 face 0 Le tableau 2 1 montre la population de quatre individus ainsi obtenue et leur valuation respective Individu Chromosome x f x 1 01010 10 100 2 01100 12 144 3 00111 7 49 4 10110 22 484 TAB 2 1 Population initiale de quatre individus obtenus al atoirement et leur valuation D finissons maintenant les trois op rateurs de base qui permettront de g n rer les populations successives la s lection ii le croisement et iii la mutation Nous verrons par la suite qu il existe diff rentes mani res de r aliser ces op rations mais nous n utiliserons que la plus simple dans le cadre de cet
187. de 5 Compte tenu de la taille r duite de la partie enzyme nous avons utilis un processus de docking en deux tapes successives Par la premi re nous voulons explorer grossi rement l espace de recherche pour localiser la zone du minimum global Les param tres de l algorithme g n tique sont alors volontairement importants 20 individus s lectionn s uniquement par tournois une probabilit de croisement de 10096 et une probabilit de mutation et d inversion de 2096 Apr s une centaine de g n rations produites de cette mani re la solution optimale est d j proche du minimum global Les param tres de l algorithme g n tique sont alors modifi s pour permettre une recherche plus fine de ce minimum 16 individus s lectionn s par tournois une probabilit de croisement et de mutation inchang e et une probabilit d inversion r duite 096 Le docking de ce syst me est r alis en plusieurs vagues successives de minimisation de 50 g n rations Nous arr tons le docking apr s 50 g n rations produites sans changement de l ner gie d interaction de la meilleure solution potentielle Avec les hamiltoniens semi empiriques PM3 et PM3 PIF le complexe dock est obtenu apr s 538 et 149 g n rations correspondant 6476 et 4 2 Docking dans une prot ine 75 1808 valuations respectivement Les r sultats sont report s dans le tableau 4 3 dans la colonne Petit syst me Les distances en PMG sont identiques entr
188. de g om trie au niveau B3LYP 6 31G d 212 8 R duction du substrat o Distance A 1 TS 2 2 TSo 4 4 C4 S5 1 85 1 84 1 84 1 83 1 84 O57 H8 0 99 0 99 0 99 0 99 0 99 O27 Og 2 80 2 80 2 79 2 78 2 70 Ce C40 1 51 1 53 1 53 1 55 1 53 Ci0 O12 1 33 1 33 1 28 1 27 1 27 C19 O 4 1 22 1 28 1 25 1 26 1 26 O12 H13 1 02 1 25 144 1 68 1 51 O12 Og 2 62 2 48 2 51 2 65 2 55 C29 O21 1 36 1 37 1 37 1 34 1 32 O21 H22 1 00 1 00 1 00 1 10 1 62 O21 Osg 2 71 2 72 2 72 2 41 2 62 Oe1 H31 2 58 2 07 2 05 1 76 1 61 H28 O38 1 83 1 83 1 82 1 81 1 73 S5 S 37 2 97 2 61 2 58 2 31 2 18 S5 H32 2 39 2 64 2 67 4 69 4 94 H22 Osg 1 71 1 73 173 1 31 1 02 H13 Osg 1 61 1 10 1 08 1 02 1 04 S37 O38 1 63 1 79 1 82 2 15 2 39 S37 C33 1 83 1 83 1 83 1 83 1 83 S 37 C39 1 82 1 88 1 83 1 83 1 83 Angle 1 TS 2 TS2 4 4 C1 85 837 88 1 933 93 7 982 964 Ss S37 Ozg 166 2 170 5 170 9 177 4 173 1 Sa7 Ose Hig 117 5 111 0 110 1 1041 99 2 Osg Hig Oys 172 0 1725 1726 177 3 1780 C4o O42 H43 109 8 112 2 112 2 113 9 115 6 O11 C10 012 124 9 1262 126 3 127 1 127 6 og Om Has 112 1 111 6 111 5 115 8 117 3 Ogi Ho2 Oss 172 4 169 7 169 7 172 3 166 0 og Oni Ou 116 4 116 2 116 1 1191 119 Hoo O38 S37 102 0 95 6 95 6 997 90 7 Ca5 S37 Oag 99 4 91 9 91 3 6854 844 Ca9 S37 Osg 110 8 95 1 94 5 862 87 6 Cas Sa7 Cso 99 1 1009 101 1 1016 99 3 O7 Hog Oss 169 6 165 8 165 5 165 6 168 0 Hag O3s S3 119 8 123 4 123 0 118 6 120 7 Co0 O21 Har 96 9 108
189. de transition obtenus le long du chemin r actionnel relatif au M canisme Transfert d un groupement OH dans un syst me isol apr s optimisation de g om trie au niveau B3LYP 6 31G d 194 8 R duction du substrat respectivement 0 55 0 55 et 0 66 u a comparer avec 0 61 0 56 et 0 55 u a dans le mod le de site actif L environnement entrainerait ainsi une augmentation de la charge n gative port e par l atome de soufre de Cys51 au d triment de l atome d oxyg ne b Etat de transition TSA g L tat de transition TS4 g Fig 8 2 b est caract ris par l existence d une fr quence imaginaire de 187i cm dont le mode normal de vibration correspond la pseudorotation avec changement de position axiale quatoriale de l atome de soufre Ss Par rapport A la distance S5 Sg rac courcit de 2 43 2 26 A et la distance Sg O s allonge de 1 87 2 03 Ceci est mettre en correspondance avec la variation des ordres de liaison pour Ss Sg de 0 61 0 79 et Sg O de 0 53 0 46 On peut noter une perte importante de charge n gative environ 0 3 u a sur l atome de soufre S5 au niveau de cet tat de transition c Interm diaire sulfurane B Dans cet interm diaire sulfurane l axe de la bipyramide est occup par l atome d oxyg ne O7 et un groupement m thyle C43 et le plan quatorial par l atome de soufre Ss l autre groupement m thyle Cg et la paire libre de Sg Fig 8 2 c Cette structure
190. des fr quences La recherche de l tat de transition pour 162 7 Activation du substrat le transfert de proton entre Glu94 et le substrat sulfoxyde a t effectu e selon le protocole suivant i scan relax de la surface d nergie potentielle selon une variable interne au syst me ii re cherche d une fr quence imaginaire dont le mode normal de vibration correspond au transfert de proton iii optimisation de la g om trie de l tat de transition partir de cette fr quence et iv cal cul des fr quences de l tat de transition optimis Le calcul du chemin de r action intrins que IRC partir de l tat de transition vers les r actifs ou les produits n a pas pu tre possible techniquement cause du gel de la position de certains atomes dans le mod le de site actif N anmoins deux optimisations de g om trie partir de la structure de l tat de transition ont permis de montrer la connexion de celui ci avec les r actifs ou les produits 7 2 3 Chemin de r action L exploration de la surface d nergie potentielle au moyen du scan relax de la distance H Oq partir du complexe micha lien 1 montre que l esp ce sulfoxyde proton n est pas form e Lorsque le proton est transfer sur le sulfoxyde une liaison S S avec la cyst ine est cr e spontan ment conduisant un interm diaire sulfurane 2 Nous avons localis l tat de transition TS4 2 reliant ces deux structures Le tableau 7 1 regroupe les val
191. des individus e La propri t History retourne un dictionnaire qui contient l ensemble des chromosomes ainsi que leur valuation g n r s depuis le d but du cycle de reproduction ter IL rb ee gt lt chiet gt e La cl d acc s ce dictionnaire est la propri t BinaryCode d un chromosome On obtient en retour l valuation correspondante celui ci ga History Chromosome BinaryCode gt float e On acc de la taille de l historique par la fonction len len ga History gt int 254 B Manuel utilisateur d ALGOGEN RunFlag Drapeau de minimisation en cours e La propri t RunF lag retourne True si la minimisation est en cours d ex cution sinon elle retourne False ga RunFlag gt boolean EvaluationFlag Drapeau d valuation de la population e La propri t EvaluationFlag retourne True si la population a t enti rement valu e sinon elle retourne False ga EvaluationFlag gt boolean e La propri t EvaluationFlag doit tre mentionn e lors de la d finition de la fonction de contr le voir section B 4 3 User Espace utilisateur e La propri t User retourne un dictionnaire initialement vide ga User edicto e C est un espace de nom r serv l utilisateur Il sert stocker des variables de diff rents types On peut y affecter ou r cup rer les donn es par l interm diaire d une chaine de caract res ga User lt string gt lt UserType gt ga User lt st
192. dification de la structure du complexe du substrat DMSO dans le site actif comme nous pouvons le constater sur les autres courbes L angle Cys51 S DMSO S DMSO O s quilibre autour de la valeur de 120 Fig 6 9 j Cette valeur est inf rieure celle de 160 obte nue dans l tat de protonation pr c dent et dans l analyse des structures cristallographiques Nous montrerons par la suite que la g om trie optimis e au niveau quantique de ce syst me donne un angle proche aussi de 160 Concernant la solvatation du site actif nous retrouvons des valeurs proches pour le substrat DMSO et les r sidus Cys51 et Glu94 par rapport la simulation pr c dente Le substrat est entour de 5 mol cules de solvant en moyenne distance 3 4 courbe non pr sent e Les r sidus Cys51 6 4 Complexe enzyme substrat sulfoxyde 149 et Glu94 sont relativement peu solvat s La pr sence d une charge n gative sur Cys51 entra ne une plus grande solvatation de ce r sidu par rapport la simulation pr c dente dans laquelle il est proton avec 3 mol cules de solvant Fig 6 9 i A nouveau aucune mol cule d eau n interagit directement avec Glu94 courbe non pr sent e La faible solvatation globale du site actif traduit la stabilit de la configuration Cys DMSO GluH du complexe enzyme substrat L tat de protonation consid r ici est donc celui qui permet de stabiliser le substrat sulfoxyde dans le site actif de la
193. drolys pour former un interm diaire acide sulf nique et le substrat r duit D apr s le profil d nergie ce chemin pourrait tre simplement d crit par un m canisme concert et asynchrone impliquant deux transferts de proton Mots cl s Catalyse enzymatique Reconnaissance mol culaire Dynamique mol culaire Chimie quantique M thio nine sulfoxyde r ductases M canisme r actionnel Algorithme g n tique Acide sulf nique Abstract The modeling of enzymatic recognition and catalysis has been examined in this work In the first part a docking software ALGOGEN DIVCON to determine the optimal structure of a protein ligand System has been developed The molecular system has been described using a semiempirical method com bined with a linear scaling algorithm Divide amp Conquer while the conformational search has been performed by a genetic algorithm ALGOGEN Tests on different systems including enzyme substrate complexes have been conducted to validate the approach The second part concerns the study of the mechanism reductase phase of class A methionine sulfoxide reductases MsrA which catalyzes the reduction of oxidized methionine residues MetSO By means of molecular dynamics simulations for different protonation states of the enzyme active site we have shown that the substrate docking is particulary favourable for a Glu94H and Cys519 protonation state The quantum chemistry study of the reduction mechan
194. du RMS est proche de 1 pour chaque simulation comme le montre la figure 6 2 Cette valeur indique une d formation relativement faible de la structure de l en zyme La visualisation de chaque trajectoire ne montre pas de modification notable de la structure globale de l enzyme Toutes ces trajectoires ont t r alis es en utilisant l algorithme Particule Mesh Ewald 6 270 PME pour le traitement des interactions lectrostatiques longue port e La bo te de simulation de chaque syst me est ainsi divis e en 96 fragments selon chaque direction i e on obtient un d coupage en 96 x 96 x 96 sous boites Ceci permet de convenir la r gle d un atome par sous boite pour une utilisation optimale de la m thode 6 2 Simulations protocole op ratoire 125 2 lt T 5 5 1 5 E S E 1 TD D p o o D D Ra op S S 0 5 oc oc 0 0 200 400 600 800 1000 0 200 400 600 800 1000 Temps ps Temps ps a Simulation Free CysH Glu b Simulation Free CysH GluH RMS de d viation e o o er o D RMS de d viation 0 200 400 600 800 1000 0 200 400 600 800 1000 Temps ps Temps ps c Simulation Free Cys GluH d Simulation DMSO CysH Glu 2 2 T T 5 1 5 5 1 5 y E S gt 1L 1 o L D I D o ao ao 2 0 5 2 0 5 am tc 0 0 0 200 400 600 800 1000 0 200 400 600 800 1000 Temps ps Temps ps e Simulation DMSO CysH GluH f Simulation DMSO Cys GIuH FiG 6 2 Variation du RMS atomique de d viation de la
195. du tableau 8 5 montre la variation de la diff rence de potentiel associ la r action d oxydor duction CHsa S CH3 2S OH CHs S CH3 5S OH AE E CH3 S OH CH3 S OH E CHs S CHs S en fonction de la constante di lectrique du solvant Cette diff rence devient rapidement n gative partir d une constante di lectrique d environ 5 et on peut donc penser que dans le contexte du site actif de l enzyme cette r action d oxydor duction sera thermodynamiquement d favorable Cepen dant cette estimation ne tient pas compte de l nergie coulombienne d interaction entre les ions qui est pr sente dans l enzyme Nous allons donc discuter de ce cas maintenant 8 2 3 Transfert d lectron dans l environnement enzymatique Dans l enzyme l nerg tique li e au processus de transfert d lectron a t estim e en d termi nant l nergie de deux tats lectroniques un tat singulet couche ferm e Wion correspondant une forme ionique ou partiellement ionique du syst me mol culaire et un tat singulet couche ouverte caract re diradicalaire W 44 correspondant formellement au transfert d un lectron de la cyst ine vers le sulfoxyde Cette tude a t r alis e sur deux g om tries du syst me mol cu laire sulfurane une structure une distance d quilibre ds s 2 5 A et une structure dissoci e ds s 4 0 Le deuxi me cas nous permet d envisager la possibilit d un m canisme de r
196. dus Tyr82 et Tyr134 dans la stabilisation et le maintien du substrat sulfoxyde est compatible avec les r sultats exp rimentaux de mutag n se dirig e mentionnant que l absence des deux tyrosines conduit une perte totale de l activit alors que l enzyme reste active en l ab sence d une seule tyrosine Les diff rentes interactions observ es entre les r sidus du site actif et le substrat sulfoxyde sont r sum es dans le sch ma ci dessous ter Iria O H P Tyrg2 H H S 5 D CySsi PE TE Met CH Glug4 Phes2 Trpss O Nous poursuivrons la description du r le de ces tyrosines dans le chapitre 8 6 4 Complexe enzyme substrat sulfoxyde 143 E94HE2 DMS2120 Distance A 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance A a Distance Glu94 Hg2 DMSO O Y82HH DMS2120 Distance A 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance b Distance Tyr82 H DMSO O Y134HH DMS2120 Distance 0 200 400 600 800 1000 0 2 4 8 Temps ps Distance c Distance Tyr134 Hy DMSO O FIG 6 7 Variation de la distance Glu94 He2 DMSO O a de la distance Tyr82 H DMSO O b et de la distance Tyr134 H DMSO O c en fonction du temps dans la simulation DMSO CysH GIuH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 144 6 Reconnaissance et ancrage du substrat Distance 0 200 400 600
197. e Les diff rents bits du code g n tique d un individu sont d termin s de mani re quiprobable Cette op ration est r p t e jusqu atteindre la taille du chromosome somme de la taille des g nes qu il contient Nous construisons ainsi autant d individus qu il est n cessaire pour former la popula tion initiale 2 3 Programmation de l algorithme g n tique 51 b Solution approch e Cette deuxi me possibilit d initier une population est contraire au principe qui veut que la popu lation initiale repr sente la plus grande diversit g n tique possible Nous connaissons parfois une solution approch e un probl me solution qui peut provenir par exemple d un pr c dent calcul de minimisation Il devient donc inutile de chercher une solution dans des r gions potentiellement mauvaises de l espace de recherche La finalit de cette d marche est donc de cr er une popula tion d individus localis s dans une r gion de l espace de recherche et de trouver la solution optimale pr s de ces points Une solution possible serait de restreindre le domaine de variation de chaque variable du probl me et de g n rer une population al atoire dans cet espace de recherche Cette solution ne peut tre satisfaisante car l exploration de l espace est elle aussi limit e La m thode que nous proposons consiste coder la solution approch e au probl me dans le chromosome d un individu Les autres individus de la population initial
198. e 8 8 dans d autres prot ines En phase r ductase la plus grande constante cin tique est observ e un pH de 8 La valeur du pK de Cysc51 passe d environ 9 5 moins de 7 La d pendance de la constante cin tique vis vis du pH fait appara tre un pK de 5 7 Cependant les mutations E94Q et Y82F Y134F E94Q de app cette m me enzyme montrent toujours la contribution d un seul pK de 8 et 9 5 respectivement Ces r sultats permettent d attribuer la valeur pK de 5 7 Cysc51 et non Glu94 De ce fait la for app mation du complexe micha lien MsrA MetSO permet l activation de Cysc51 en abaissant son pK app de 3 8 unit s La cyst ine catalytique est ainsi activ e par d protonation afin d initier la r duction du sulfoxyde 5 3 4 Travaux th oriques sur la r duction d un sulfoxyde par un thiol Balta et al 2 ont publi une tude th orique du m canisme de r duction d un sulfoxyde par un thiol en solution Cette tude fournit un m canisme r actionnel potentiellement transf rable la ca talyse enzymatique de r duction des MetSO Parmi les diff rents chemins r actionnels consid r s Balta et al d crivent un chemin conduisant la formation d un acide sulf nique comme il a t d crit par Boschi Muller et a 2 Ce travail apporte des informations concernant la structure et l nergie relative des diff rentes esp ces caract ris es le long du chemin Les r sultats de cette tude seront
199. e QR EDS Conclusion g n rale Docking mol culaire semi empirique croissance lin aire M canisme catalytique des m thionine sulfoxyde r ductases de classe A PerspectiVeS xoxo ede cx eom Re RUE Te ECC IX AR Re FA A A Ill Annexes A M thodologie A 1 M thodes semi empiriques croissance lin aire A 2 M canique et dynamique mol culaires A 2 1 Champs de forces A 2 2 Conditions aux limites p riodiques A 2 3 Traitement des interactions lectrostatiques longue port e A 2 4 Dynamique mol culaire A 3 PROPKA Pr diction des valeurs de pK des r sidus d une prot ine B Manuel utilisateur d ALGOGEN C Manuel utilisateur d ALGOGEN DIVCON Lexique Table des figures Liste des tableaux Bibliographie 11 189 190 190 190 196 200 200 201 204 209 209 209 216 216 219 219 220 221 223 225 227 230 230 234 234 236 239 245 263 269 273 277 279 Introduction objectifs les connaissances qui r sulteront un jour de l application de la chimie l tude des corps vivants et de leurs fonctions nous offriront peut tre contre nos maux des ressources que nous n oserions pr voir aujourd hui Eloge M Margraaf 1776 Marie Jean Antoine Nicolas de Caritat Marquis de Condorcet 1743 1794 En 1776 Condorcet crivait ces mots dans une
200. e codage C i e celui des variables cod es par le chromosome En d autres termes les valeurs cod es par les g nes ne sont pas directement les variables du probl me Nous passons de l une l autre par une simple quation lin aire La repr sentation choisie pour les variables de codage est la somme des puissances de 1 2 Soit la variable de codage x C repr sent e par le g ne aga1a a de longueur n avec a 0 1 alors 4 X y x 1 x x L x a a ta a a Za 0 1 2 2 4 n on Cette criture nous permet d obtenir des variables de codage x toujours comprises entre 0 et 2 exclu Ce principe de codage a aussi l avantage d tre extensible l infini En effet la variable de codage est toujours comprise entre 0 et 2 exclu quelle que soit la valeur de n la longueur du g ne Nous avons donc de fait un moyen simple et pratique de modifier la pr cision des solutions dans l espace de recherche Apr s le d codage de la variable de codage x C la variable r elle y IR est obtenue par une homoth tie selon T Fm C R y ax B avec 2 o R y vil B y Le programme r alise principalement des proc dures de d codage C R essentiellement lors de l tape d valuation de la population Le codage IR C se d roule selon une proc dure inverse et 2 3 Programmation de l algorithme g n tique 43 a t d velopp dans le code du programme II est utilis uniquement dans le cas o
201. e de l isosurface rendant la comparaison difficile On peut noter cependant l augmentation de densit selon la liaison S S lorsque l effet des r sidus n est pas pris en compte d Bilan nerg tique Les valeurs d nergie de chacune des trois esp ces que nous venons de pr senter sont regrou p es dans le tableau 7 3 L tat de transition TS _2 se situe 5 6 kcal mol au dessus du complexe micha lien 1 et nous constatons que l nergie de l interm diaire sulfurane 2 est tr s proche de celle de l tat de transition diff rence inf rieure 0 1 kcal mol Ceci est en accord avec le fait que les structures de ces deux esp ces sont similaires L nergie d activation n cessaire la protonation du substrat est d apr s ces calculs relativement faible Ce r sultat n tait pas n cessairement attendu compte tenu des propri t s acido basiques du sulfoxyde comparable un acide fort Le principal facteur expliquant cette valeur est l intervention de la cyst ine catalytique dans le m canisme de transfert de proton D une certaine mani re la for mation de la liaison S S et le transfert de proton sont deux processus coop ratifs et indissociables l un impliquant l autre Nous avons d j dit que l esp ce DMSOH n est pas stable en pr sence de CH3S7 formation spontan e de la liaison S S De m me la d protonation du sulfurane conduit la dissociation h t rolytique de la liaison S S r sultats non pr sent s L
202. e des m thionine sulfoxyde r ductases L alignement des s quences de diff rentes MsrA et MsrB montre que la cyst ine catalytique Cysc est strictement conserv e au sein de ces enzymes Cependant le nombre de cyst ines de recyclage Cysg et leurs positions respectives peut varier d un organisme l autre Certaines Maer pr sentent des cyst ines additionnelles dans leurs structures primaires Ceci a permis de d finir des sous classes au sein des MsrA et MsrB d apr s la revue de Kauffmann et al 199 a Sous classes de MsrA L alignement des s quences de diff rentes MsrA est report dans la figure 5 7 Pour chacune d entre elles Cysc est localis e la position 51 au sein du motif conserv 59GCFWhss Cette s quence est caract ristique des MsrA La num rotation des r sidus des MsrA est bas e sur la s quence r f rence de la MsrA d Escherichia coli 100 5 Rappels bibliographiques et objectifs 1 10 20 30 40 50 60 l l l I Be CO ee MSLFDKKHLVSPADALPGRNTPMPVATLHAVNGHSMTNVPDGMEIAIFAM SVERGEWODEGVYS TA B taurus M is PRMGDSAAKIVS EPLVVAAKHHVNGN G 4 AERKFWTLKGV tuberculosis meningitidis subtilis lI I I KKE JKPFDEQPG L radliodurang mn mn mn mm mm mm WH I d EQAI EAVMQDLRGV e esculentum me tm m mm m i i M STT S EF VELAFQRVGGVVKTE 79 99 100 de 0 1 Om 150 I E col RER 5GDTGH V
203. e distributions radiales l nergie libre etc a Int gration des trajectoires La trajectoire de chaque atome du syst me est obtenue partir de l int gration des quations du mouvement de Newton qui s crivent or t ot Vi t ml f t i 1 N A 23 av r f t ES t ri o rj Vj m et f sont respectivement la position la vitesse la masse et la force agissant sur l atome i et V r la fonctionnelle d nergie potentielle champ de forces du syst me contenant N atomes A partir de la connaissance des positions et des vitesses des atomes l instant t l int gration des quations du mouvement A 23 permet de d terminer les positions et les vitesses de ceux ci l ins tant t dt Les algorithmes d int gration utilisent une m thode des diff rences finies La modification des positions de l ensemble des atomes est obtenue partir d un d veloppement en s rie de Taylor de la position au temps t rj tt r t 6tv t S alt ds 2 f t i A 24 PI tv t dt l o r V a et f sont les vecteurs position vitesse acc l ration et force de la particule i A 2 M canique et dynamique mol culaires 237 Divers algorithmes d int gration existent et diff rent par la mani re dont l expansion de Taylor est effectu e Les int grateurs les plus couramment employ s en dynamique mol culaire sont e Verlet f t rj t t 2
204. e fait apr s l valuation des individus pour permettre de stopper la minimisation La fonction fournie StopFunction doit retourner False tant que les crit res d arr t que l on se donne ne sont pas atteints Si ces crit res sont atteints la fonction doit retourner True Le cycle de reproduction est arr t et le programme ex cute les proc dures de terminaison options StopFunction function Valeur par d faut False ControlFunction Fonction de contr le e Fonction externe d finie par l utilisateur Voir section B 4 3 L appel cette fonction se fait avant et apr s l valuation des individus chaque g n ration selon la valeur prise par la propri t EvaluationFlag de l algorithme g n tique L option Cont rolFunction introduit une fonction externe que l utilisateur d finit comme il le souhaite l int rieur du cycle de reproduction pour contr ler les populations g n r es Selon la d finition qu on lui donne cette fonction de contr le peut servir au calcul de statistiques sur une population valu e ou placer des contraintes de certaines variables avant l valuation La fonction ne retourne rien options ControlFunction function Valeur par d faut pass ReproductionControl Fonction de contr le de reproduction e Fonction externe d finie par l utilisateur B 4 4 L appel cette fonction se fait pendant les op rations de reproduction chaque fois qu un individu est cr Voir s
205. e l attribut ResultsGrabber c Historique des individus Pour diminuer au maximum le nombre d valuations effectuer lors des cycles de reproduction il peut tre utile de stocker les calculs d j r alis s De cette mani re si nous avons valuer un individu dont le chromosome est connu il suffit de rechercher l valuation correspondante dans une base de donn es Cette base de donn es est impl ment e dans notre algorithme g n tique et prend le nom d histo rique des individus II contient l ensemble des chromosomes produits par l algorithme et l valuation correspondante Cette recherche est effectu e la cr ation de l individu la fin des op rations de reproduction Lors de la pr paration de la queue de calcul les individus d j valu s r cup r s dans l histo rique sont stock s dans une structure temporaire On les ajoute ensuite aux individus fraichement valu s en fin de processus d valuation 2 4 Conclusion Toutes les fonctionalit s d crites ci dessus ont t programm es et int gr es dans le logiciel que nous avons cr ALGOGEN L criture de celui ci en Python est suffisament g n rale pour tre utilis e dans d autres cadres que celui de l optimisation de ligands dans le site actif d enzymes Le manuel d utilisation du programme est report en annexe B Chapitre 3 Interface ALGOGEN DIVCON Sommaire 3 1 Pr sentation g n rale
206. e les r sultats de ALGOGEN DIVCON et de GEOMOP et tr s proches de la structure cristallographique Les RMS de d viation de la position de la 8 azaxanthine dans le site actif entre la structure 2IBA et ALGOGEN DIVCON sont de 0 12 en PM3 et de 0 30 en PM3 PIF respectivement Petit syst me Grand syst me ALGOGEN DIVCON GEOMOP ALGOGEN DIVCON PDB Distances PM3 PIF PM3 PM3 PM3 PIF PM3 21BA Aza N GIn228 O 2 97 Aza Og GIn228 Neo 2 91 Aza O Val227 N 2 91 Aza Os Arg176 Ny2 2 81 Aza Ns Arg176 Ny 2 99 Aza N Thr57 N 2 75 Aza N Thr57 O 3 21 Aza Ng Wat2 O 2 69 AXE kcal mol 138 7 85 7 85 7 171 5 74 5 TAB 4 3 Energies d interaction AE et distances des interactions du complexe entre l urate oxydase et la 8 azaxanthine optimis par ALGOGEN DIVCON algorithme g n tique et GEOMOP gradients conju gu s avec les m thodes semi empiriques PM3 et PM3 PIF Les valeurs sont donn es pour le petit et le grand syst me Les distances de la structure cristallographique 2IBA sont report es dans ce tableau pour comparaison b Docking dans le grand systeme Le m me docking a t r alis en prenant en compte un plus grand syst me pour tester les aptitudes en croissance lin aire du programme ALGOGEN DIVCON Le grand syst me est toujours construit partir de la structure pr par e de l enzyme mais en prenant tous les atomes compris dans une bo te cubique de 12 de c t plac e au ce
207. e pour repr senter les interactions du syst me prot ine ligand moins d une centaine g n ralement La taille minimale d un syst me prot ine ligand en consid rant uniquement le ligand et les quelques r sidus qui interagissent avec lui d passe fr quemment cette limite Cependant depuis ces quinze derni res ann es de nouveaux algorithmes de chimie quantique ont vu le jour Leur objectif est d aboutir une croissance lin aire 977 du temps de calcul en mo difiant les algorithmes standards au niveau de leurs parties non lin aires Ces nouvelles m thodes permettent de mod liser de tr s grands syst mes tout en conservant un temps CPU raisonnable Parmi ces m thodes nous citerons l exemple de Divide amp Conquer MOZYME ou Density Matrix Minimization Sans entrer dans les d tails rappelons que la m thode Divide amp Conquer d rive du caract re local de la densit lectronique dans un syst me mol culaire A partir de ce constat il est alors possible de diviser l ensemble du syst me en plusieurs sous syst mes de taille plus petite La r solution des quations de Roothaan Hall de chaque sous syst me permet de revenir l nergie du syst me entier apr s reconstruction de la matrice densit totale voir annexe A page 228 Malgr tout l utilisation de ces algorithmes croissance lin aire dans le cadre des m thodes ab initio ou DFT est tr s peu r pandue cause d un besoin en temps CPU toujours cons que
208. e pr diction des valeurs de pK a t r alis e dans le cadre de cette th se en uti lisant le programme PRoPKkA 0 Les valeurs de pK pr dites pour les r sidus Cys51 et Glu94 sont regroup es dans le tableau 6 1 pour diff rentes structures PDB d une MsrA dE coli L adduit S dim thylars niate cyst ine dans 1FF3 et le r sidu s rine dans 3BQF tous les deux la po sition 51 ont t modifi s en un r sidu cyst ine pour le calcul Les valeurs pr dites pour Cys51 entre 8 7 et 9 6 sont en accord avec la valeur de 9 5 obtenue exp rimentalement La valeur de pK pr dite pour Glu94 est environ de 6 4 qui est sup rieure la valeur de r f rence 4 5 Structure PDB 1FF3 SBQE 3BQF Cys51 8 75 9 36 9 66 Glu94 6 48 6 41 5 75 TAB 6 1 Analyse PROPKA des r sidus Cys51 et Glu94 de MsrA Les trois structures correspondent des MsrA dE coli Les r sidus S dim thylars nic Cys51 dans 1FF3 et Ser51 dans 3BQF ont t modifi s en Cys51 b Complexe enzyme substrat sulfoxyde Durant l tape r ductase du m canisme catalytique i e lorsque l enzyme est en interaction avec le substrat sulfoxyde Antoine et al 2 en prenant en compte la d pendance au pH de la constante cin tique ont montr que la valeur de pK de Cys51 diminue drastiquement jusqu une valeur de PK app de 5 7 La valeur de pK de Glu94 n a pas pu tre d termin e exp rimentalement L analyse app A226 229 des structures cristallographiq
209. e relativement diff rente de celle de la 8 azaxanthine Fig 4 5 Il pr sente seulement un cycle h t roatomique six atomes tandis que le ligand AZA est la fusion de deux cycles h t roatomiques cinq et six atomes Les interactions entre le ligand OXC et l enzyme sont donc assez diff rentes Cependant l observation de la structure 1R4U indique la pr sence de quelques interac tions similaires celles rencontr es pour le ligand AZA essentiellement port es par le cycle six atomes La composition et la structure du site actif impliquent que l acide oxonique se pr sente sous la forme d un dianion dans le site actif de l enzyme Il est uniquement proton en position 3 Le docking mol culaire de l acide oxonique a t r alis dans le site actif de l urate oxydase en PMG et PM3 PIF La structure de l enzyme est celle pr par e auparavant partir de la structure cristallographique 2IBA La bo te de docking est toujours une bo te cubique de 12 de c t plac e au centre g om trique du site actif De cette mani re nous disposons des m mes r sidus et mo l cules de solvant que le grand syst me pr sent dans le docking avec le ligand AZA soit environ 700 atomes Les structures dock es sont obtenues apr s 205 g n rations en PMG et 160 g n rations en PM3 PIF correspondant 3296 et 2512 valuations respectivement Les r sultats sont r sum s dans le tableau 4 4 en comparaison avec la structure 1R4U Nou
210. e sont g n r s par une l g re mutation des g nes de ce premier individu Nous construisons de cette mani re une population d individus localis s autour d un point tout en s assurant de l exploration de l espace de recherche en entier c Sauvegarde de la population Durant le processus de minimisation un fichier de sauvegarde est cr intervalles r guliers Ce fichier contient la population en cours d existence au moment de la sauvegarde ll suffit alors d indiquer le nom du fichier de sauvegarde pour reprendre une minimisation partir de la population sauvegard e 2 3 7 Evaluation Dans le but de rendre cet algorithme g n tique de minimisation totalement ind pendant du pro bl me trait nous avons opt pour un processus d valuation s par du processus de production des individus En d autres termes l valuation d un individu s effectue dans un autre processus sans lien direct avec l individu concern Cette partie pr sente l interface d valuation qui a t d velop p e et diff rentes fonctionnalit s ajout es au programme concernant l valuation 52 2 D veloppement d un algorithme g n tique de minimisation a Interface d valuation Le module d valuation de l algorithme g n tique est concu pour permettre l valuation de la po pulation par un programme externe Lors de l tape de d codage du chromosome de chaque indi vidu de la population les valeurs d cod es sont plac es dans u
211. e sulfurane dissoci 4 ion sulfuranyle la poursuite du chemin r action nel devrait conduire sans difficult la formation de l interm diaire acide sulf nique En effet selon les travaux de Balta et al l hydrolyse en solution d un ion sulfuranyle conduit la dissociation de la liaison S S en formant l acide sulf nique et le sulfure avec une nergie d activation extr mement faible de 0 9 kcal mol Nous admettons ici que le devenir de l ion sulfuranyle form dans le site actif de l enzyme lors de notre tude sera celui ci puisque d apr s l analyse des structures cristallogra phiques cette zone du site actif est assez bien solvat e On peut raisonnablement penser qu une mol cule d eau du solvant puisse ais ment hydrolyser l ion sulfuranyle et finisse ainsi le processus de r duction du substrat sulfoxyde Le m canisme devrait impliquer galement l ion ph nolate selon un processus assist comme celui sch matis dans la figure 8 8 Bien entendu un m canisme concert de l ensemble des transferts de proton peut tre imagin mais d autres calculs seront n cessaires pour v rifier cette hypoth se qui en outre devront prendre en compte la modification du profil nerg tique obtenu ici sous l influence de l interaction avec le reste de l enzyme Une estimation de l influence de l environnement a t faite en r alisant un calcul nerg tique en solution aqueuse mod le du continuum pour les structures 1 2 4 et les
212. ection L option ReproductionControlintroduit une fonction externe que l utilisateur d finit comme ille souhaite afin de contr ler les op rations de reproduction Cette fonction de contr le sert essentiellement supprimer les nouveaux individus produits avant la phase d valuation Elle renvoie True si l individu est conserv False sinon options ReproductionControl function Valeur par d faut True ResultsGrabber Fonction de calcul distribu e Fonction externe d finie par l utilisateur Voir section B 4 5 L appel cette fonction se fait au moment de l valuation des individus chaque g n ration de l algorithme g n tique L option Result sGrabber introduit une fonction externe que l utilisateur d finit comme il le souhaite pour permettre la distribution des calculs d valuation sur plusieurs machines d un cluster options ResultsGrabber function Valeur par d faut Utilisation de EvaluationFunction Unicity Unicit des individus e Bool en conditionnant le ph nom ne d eug nisme au sein d une population B 2 Param tres et options 251 SiUnicity vaut True alors dans une g n ration donn e les chromosomes de chaque indi vidu sont tous distincts Si Unicity vaut False alors une m me g n ration peut comporter des individus de m me chromosome ils sont alors identiques en terme de g notype options Unicity boolean Valeur par d faut True RandomSeed Racine du g n
213. er J Cramer Essentials of Computational Chemistry Theories and Models Wiley 2006 Frank Jensen Introduction to Computational Chemistry Wiley 1999 John A Pople and David L Beveridge Approximate Molecular Orbital Theory McGraw Hill 1986 Attila Szabo and Neil S Ostlund Modern Quantum Chemistry Courier Dover Publications 1989 A 1 M thodes semi empiriques croissance lin aire 227 A 1 M thodes semi empiriques croissance lin aire Les m thodes ab initio et DFT ont une demande tr s importante en temps de calcul qui de plus augmente tr s rapidement avec le nombre d atomes ou plus exactement avec le nombre de fonctions de base Afin de r duire de facon drastique ce temps de calcul la strat gie commune employ e par les m thodes semi empiriques 99 repose sur les approximations suivantes e utiliser une base d orbitales atomiques minimale e n gliger les int grales de recouvrement dans la r solution des quations de Roothaan Hall e n gliger un grand nombre d int grales bi lectroniques approximation ZDO ou Zero Differential Overlap e mettre les autres int grales sous forme param tr e et ajuster les param tres avec des donn es exp rimentales ou des calculs ab initio e limiter la description du syst me aux lectrons de valence Dans le formalisme ZDO les int grales bi lectroniques faisant intervenir le recouvrement diff ren tiel de deux orbitales atomiques diff rentes s
214. er s oxyde spontan ment pour former une s rie de d riv s des degr s d oxy dation divers comme les sulfoxydes ou les sulfones Selon la nature de l esp ce oxydante un r sidu m thionine peut subir une oxydation un ou deux lectrons pour conduire la formation d un sul foxyde de m thionine MetSO L oxydation deux lectrons d un sulfure organique ReS conduit la formation d un dication sulfure RoS Fig 5 1 1 En milieu aqueux celui ci se transforme en sulfoxyde R2SO Fig 5 1 2 Plusieurs esp ces oxydantes telles que des complexes m tallo bioorganiques 7 155 oxygent directement un r sidu m thionine en sulfoxyde de m thionine par un transfert formel d oxyg ne Fig 5 1 3 L oxydation un lectron d une m thionine conduit un radical cation sulfure R5S Fig 5 1 4 C est une esp ce chimique extr mement instable qui peut se convertir en une s rie d interm diaires et de produits parmi lesquels plusieurs amenent terme la d gradation du sulfure initial et la perte de la fonction biologique de la prot ine Fig 5 1 5 Une deuxi me oxydation du radical cation sulfure R2S en dication sulfure R2S est possible Fig 5 1 6 On revient alors la formation d un sulfoxyde de m thionine par hydratation E E ANNPN C Cnnr CH2 H20 2e IT 2 H O l 1 Bx 2 H H H H Lens CH TT VA Oxydation 2 lectrons par transfert d oxyg ne de l oxydant ii
215. ermi est d termin e en utilisant une technique de bisection it rative sur les valeurs propres du sous syst me sous la contrainte que le nombre d lectrons soit conserv La matrice de Fock locale est construite partir de la matrice de Fock globale selon p E siles fonctions de base et Xy sont dans le m me sous syst me R AA uv 0 sinon Par analogie avec les m thodes semi empiriques traditionnelles la matrice de Fock globale est construite partir de la matrice H un lectron des int grales coulombiennes et d change et de A 1 M thodes semi empiriques croissance lin aire 229 la matrice densit globale P E Hu A A ul Ao 5 uo Av Puy A 5 A 9 Chaque sous syst me est constitu d un coeur entour par une9 ou deux r gions tampons Ces r gions tampons d terminent quelle information doit tre utilis e pour construire la matrice densit globale partir des matrices densit locales sub Pw DLP A 6 La valeur de D est donn e selon le nombre de tampons e Un tampon 1 Si X et Xy sont dans le c ur D luy A 7 0 sinon e Deux tampons 1 SI X est dans le c ur et x dans le c ur ou le tampon interne et inversement D luv UN 0 sinon A 8 o Da est le nombre total de sous syst mes se recouvrant et ayant une contribution non nulle la matrice densit globale P Il a t constat que la proc dure avec deux tamp
216. ers TournamentNumber 8 Population initiale aleatoire options Initialization random Maximum de 200 generations et de 1000 evaluations options MaxGenerations 200 options MaxEvaluations 1000 Minimisation de la fonction de Schwefel options EvaluationFunction schwefel Arret par la fonction stop et controle par la fonction control options StopFunction stop options ControlFunction control Eugenisme interdit et pas de code Gray options Unicity False options Gray False Mutation par addition sur le 3eme gene options Periodicity 2 Strategie d evolution newUnknown options Strategy ga newUnknown Pas de racine sp cifique au g n rateur al atoire options RandomSeed None Ecriture de la cha ne de caract res produite par la fonction schPrint dans le fichier schwefel out toutes les g n rations 262 B Manuel utilisateur d ALGOGEN options OutputFile schwefel out options OutputPrint schPrint options OutputFrequency 1 Sauvegarde de la population dans le fichier schwefel bkp toutes les 20 g n rations options BackupFile schwefel bkp options BackupFrequency 20 Lancement de la minimisation ga run Annexe C Manuel utilisateur d ALGOGEN DIVCON Table des mati res C 1 C 2 C 3 D P Exemple de script de docking 264 Importation des modules 266 Fonctions et attributs de docking
217. es Msr sont connues pour r duire le DMSO bien qu elles aient une moins bonne affinit pour ce sub strat Les simulations de dynamique mol culaire ont t r alis es avec les programmes SANDER AMBER6 9 et PMEMD AMBER9 Nom de la simulation Cys51 Glu94 Substrat Free CysH Glu Proton D proton Non Free CysH GluH Proton Proton Non Free Cys GluH D proton Proton Non DMSO CysH Glu Proton D proton Oui DMSO CysH GluH Proton Proton Oui DMSO Cys GluH D proton Proton Oui TAB 6 2 R sum des simulations r alis es pour l tude de la reconnaissance par l enzyme de son substrat Les informations concernent l tat de protonation des r sidus Cys51 et Glu94 et la pr sence ou non du substrat DMSO a Champ de forces L ensemble des atomes de l enzyme et du solvant a t trait par l interm diaire du champ de forces amber94 Pour la mol cule de DMSO plusieurs champs de forces sont disponibles dans la litt rature 6 260 Toutefois les param tres existants ont t ajust s afin de reproduire le com portement du DMSO en tant que solvant Quelques uns d entre eux ont t d velopp s pour une utilisation avec l algorithme SHAKE ou avec une approche United Atoms Ces diff rents jeux de param tres ne sont pas adapt s la description de la mol cule de DMSO dans notre tude Ceci nous a conduit d velopper nos propres param tres selon le protocole de param trisation habituel li
218. es individus sont enregistr es dans un fichier dont on donne le nom sous la forme d une chaine de caract res options BackupFile string Valeur par d faut ga bkp BackupFrequency Fr quence d criture en sauvegarde e Entier d finissant la fr quence en terme de g n rations laquelle un point de sauvegarde est cr par le programme options BackupFrequency int Valeur par d faut 5 B 3 Propri t s et m thodes de l algorithme g n tique Pour l criture de quelques fonctions pr sent es dans la section pr c dente il est n cessaire d avoir acc s certaines propri t s contenues dans l algorithme g n tique Ces propri t s sont accessibles depuis l objet ga qui contient l int gralit du processus de minimisation du programme Nous voyons maintenant les diff rentes propri t s et m thodes qu il est possible d obtenir B 3 1 Propri t s et m thodes de ga Population Population courante e La propri t Population retourne un objet Population qui contient le liste des individus de la population courante Voir section B 3 2 ga Population gt Population e On acc de un individu de la population par l interm diaire de son index On r cup re ainsi un individu de type Individual Voir section B 3 3 ga Population int Individual e On obtient la taille de la population par la fonction len len ga Population int History Historique
219. esp ce sulfurane apparait donc comme un interm diaire extr mement labile du m canisme catalytique Sa faible stabilit par rapport l tat de transition TS4 2 ne permet pas d envisager une mise en vidence exp rimentale la cin tique de retour l tat initial 1 complexe micha lien tant particuli rement rapide Insistons sur le caract re relativement ionique de ce sulfurane en pr sence notamment du r sidu Glu94 dans le site actif Notons enfin que dans ces calculs nous n avons pas pris en compte l effet ventuel de la prot ine au del des r sidus dans le site actif Ce point sera voqu dans le chapitre suivant lorsque nous ferons une discussion du m canisme de r duction global 7 3 Dynamique mol culaire du substrat activ 173 7 3 Dynamique mol culaire du substrat activ Nous allons analyser maintenant en d tail les diff rentes interactions du substrat activ dans le site actif par une simulation de dynamique mol culaire Les calculs quantiques pr sent s dans la section pr c dente ont montr que le transfert de proton Glu DMSO conduit l esp ce sulfurane avec la formation spontan e d une liaison S S entre Cys51 et DMSO Cette liaison n est cepen dant pas tr s forte et la dissociation peut se produire facilement d apr s les r sultats en solution de Balta et al Donc m me si formellement DMSOH ne peut pas tre consid r comme un interm diaire r actionnel il nous a paru interessan
220. est le g ne C est une s quence de symboles qui exprime une caract ristique apr s lecture de ce code Ceci conduit d finir deux termes impor tants le g notype et le ph notype Le premier constitue le code g n tique lui m me Le deuxi me est l expression des caract ristiques ainsi cod es Le passage de l un l autre par une tape es sentielle qui est le d codage Chaque ph notype que l on souhaite exprimer doit tre cod de mani re unique par l interm diaire d une suite de symboles connus L ensemble de ces symboles est appel alphabet Prenons l exemple du codage de l ADN dans le noyau des cellules vivantes L alohabet 4 est constitu de quatres symboles 4 A T C G Ces symboles repr sentent en fait les quatres nucl otides ou bases nucl iques constituant l ADN Ad nine Thymine Cytosine Guanine Par la suite et pour plus de simplicit nous appelerons bits les symboles d un alphabet Dans la grande majorit des cas les caract ristiques d un individu proviennent de l expression de plusieurs g nes la fois La collection de g nes d un individu est appel e g n me Ce dernier est repr sent physiquement par des entit s que l on appelle chromosomes Un individu peut tre constitu d un grand nombre de chromosomes l ensemble des g nes se r partissant sur l ensemble des chromosomes Pour des facilit s de traitement l algorithme g n tique que nous consid rons dans notre cas suppose que ch
221. et LIG par la suite 3 3 D roulement du docking 61 0 AlgoGen Docking Divcon SGE Input 1 1 Give PDB 1 2 Give systems specifications 2 Prepare systems 3 1 Give GA parameters 3 2 Give DivCon parameters 4 Launch minimization 5 Initialize a population 6 1 Give variables l 6 2 Make systems 6 3 Write input files 6 4 Compute 6 5 Read output files 6 6 Give evaluations 7 Write log file visual 8 1 Make selection 8 2 Make reproduction 9 1 Give variables 9 2 Make systems 9 3 Write input files 9 4 Compute 9 5 Read ouput files 9 6 Give evaluations 10 Write log file visual LOOP Fic 3 2 Diagramme UML de s quence des proc dures du programme ALGOGEN DIVCON 62 3 Interface ALGOGEN DIVCON respectivement pour la prot ine et le ligand L origine du syst me PROT est red finie le cas ch ant comme tant le centre g om trique des r sidus d int r t et le centre de la boite de docking est plac cette origine Les r sidus du syst me PROT dont au moins un atome se situe l int rieur de la sph re circonscrite la bo te de docking sont conserv s et pris en compte dans le calcul de l nergie potentielle Il y a un traitement automatique des ventuelles liaisons peptidiques rompues
222. et m thodes des objets lt Individual gt 255 B 3 4 Propri t s et m thodes des objets Chromosome 256 B 3 5 Propri t s et m thode des objets Gene 256 BA D finition de fonction 257 B 4 1 D finition de la fonction d valuation 257 B 4 2 D finition de la fonction d arr t 257 B 4 3 D finition de la fonction de contr le 257 B 4 4 D finition de la fonction de contr le de reproduction 258 B 4 5 D finition de la fonction de calcul distribu 258 BAG D finition de la fonction de strat gie d volution 259 B 4 7 D finition de la fonction d affichage 260 Bb Exemple de script de minimisation 260 246 B Manuel utilisateur d ALGOGEN B 1 Lancer une minimisation Cette partie pr sente le script Python minimal n cessaire pour lancer la minimisation de la fonc tion de Schwefel trois variables avec 0 lt x 500 3 f X1 Xo X3 xisin v bs i 1 Pour cela il suffit d affecter EvaluationFunction la fonction minimiser et de donner Ranges une liste des domaines de d finition de chacune des variables comme il est crit dans le script La commande ga run lance la minimisation Importation du module genetic py et math py from genetic
223. eters M B Kim H Westerhoff L M Wollacott A M van der Vaart A Gogonea V Suarez D Dixon S L Vincent J J Brothers E N et K M Merz J DivCon QuantumBio Inc State College PA 16803 2005 Lee T S York D M et Yang W J Chem Phys 105 2744 2750 1996 Dixon S L et Merz K M J J Chem Phys 104 6643 6649 1996 Dewar M J S Zoebisch E G Healy E F et Stewart J J P J Am Chem Soc 107 3902 3909 1985 Stewart J J P J Comput Chem 10 209 220 1989 Stewart J J P J Comput Chem 10 221 264 1989 Stewart J J P J Comput Chem 12 320 341 1989 Harb W M thodes de mod lisation en synth se asym trique Etude de la r duction d alpha c toesters glycosyl s Ph D thesis Universit Henri Poincar Nancy France 2003 Hestenes M R et Stiefel E J Res Nat Bur Stand 49 409 436 1952 Broyden C G MA J Appl Math 6 76 90 1970 Fletcher R Comput J 13 317 322 1970 Goldfarb D Math Comp 24 23 26 1970 Shanno D F Math Comp 24 647 656 1970 Press W H Teukolsky S A Vetterling W T et Flannery B P Numerical Recipes The Art of Scientific Computing Cambridge University Press Cambridge Third ed 2007 J gou P et Terrioux C Artif Intel 146 43 75 2003 Kirkpatrick S C D Gelatt J et Vecchi M P Science 220 671 680 1983 Kirkpatrick S J Stat Phys 34 975 986 1984 Holla
224. ette caract ristique est commune tous les programmes de docking Nous ne l avons pas montr ici mais notre programme par son traitement quantique du syst me prot ine ligand permet de consid rer diff rents tats de protonation en cours de docking Le d veloppement de ce point en fera un atout majeur de notre logiciel b Limitations du programme ALGOGEN DIVCON Le programme ALGOGEN DIVCON souffre aussi de certaines limitations que nous avons mention n es lors de nos tests La premi re est li e au co t des calculs Bien qu une m thode croissance lin aire ait t utilis e le calcul de l nergie d interaction avec DIVCON est bien plus long que ce qu il serait avec une approche de type empirique ou champ de forces C est le co t de la description quan tique L am lioration de ce point r side dans l utilisation des propri t s de calcul parall le distribu du programme Dans nos tests le nombre d valuations effectu es par ALGOGEN DIVCON est relativement lev Ceci est la contre partie de l utilisation d un algorithme g n tique pour la recherche conformation nelle Ce type d outil a besoin d valuer un nombre important d individus avant de trouver la solution optimale Cette caract ristique est pr sente aussi dans les autres programmes de docking utilisant un algorithme g n tique mais repr sente cependant un inconv nient mineur car l valuation des individus est un processus rapide Sachant que dans not
225. eurs g om triques de ces esp ces qui sont repr sent es dans les figures 7 3 a et 7 4 Les ordres de liaison et les charges sont report es dans le tableau 7 2 et le bilan nerg tique du chemin de r action dans le tableau 7 3 a Complexe micha lien 1 L optimisation de g om trie de la mol cule de DMSO dans le mod le de site actif a conduit une structure de complexe micha lien proche de celle d crite dans le chapitre pr c dent Nous retrouvons la grande majorit des interactions que nous avons d crit pr c demment Une r seau important de liaisons hydrog ne se forme autour de l oxyg ne du sulfoxyde avec les r sidus Tyr82 Glu94 et Tyr134 Les distances O H sont respectivement de 1 83 A pour Tyr134 O35 H2 1 61 pour Glu94 Osg H 3 et 1 71 pour Tyr82 Osg H2g Cet oxyg ne Ogg porte une charge n gative relativement importante de 0 54 u a Les deux atomes de soufre S5 et S37 portent des charges oppos es importantes respectivement de 0 79 et 0 74 u a Il y a donc une forte interaction lectro statique entre ces deux atomes une distance de 2 97 La mol cule d eau du solvant se positionne proximit du substrat sulfoxyde et forme un pont entre les r sidus mod le Tyr134 et Cys51 7 2 M canisme de transfert de proton 163 o Distance A 1 TS 2 DMSOH C1 S5 1 85 1 84 1 84 O27 H28 0 99 0 99 0 99 O27 O38 2 80 2 80 2 79 Dau 1 51 1 53 1 53 C107O12 1 33 33 128 Ci9 O44 1 22 1
226. fert de proton 169 ici 1 82 est interm diaire entre celle du sulfurane en phase gazeuse ds o 1 91 et celle en solution de DMSO ds o 1 72 En revanche l ordre de la liaison 0 59 est bien plus faible que la valeur de 0 93 en phase gazeuse et de 1 24 en solution de DMSO Ceci impliquerait que l ins tar de la liaison S S la liaison S O du sulfurane pr sente un caract re ionique important dans le site actif de l enzyme probablement comme cons quence de l tablissement d une interaction forte entre l atome d hydrog ne H43 du sulfurane et l atome d oxyg ne O12 de Glu94 Les commentaires ci dessus sont galement coh rents avec le calcul des charges atomiques Nous observons une variation de 0 79 0 61 u a pour Ss de 0 74 0 56 u a pour S37 et de 0 54 0 55 u a pour Oss entre 1 et 2 respectivement De mani re g n rale l influence de Cys51 et de Glu94 sur le DMSO a fait diminuer de pr s d une unit l ordre de liaison S O de 1 28 pour DMSO 0 59 pour 2 Une analyse de la fonction d onde de l interm diaire sulfurane 2 dans le mod le quantique de site actif a t r alis e Le trac des orbitales HOMO et LUMO est pr sent dans la figure 7 5 Comme dans 1 l orbitale HOMO Fig 7 5 a est port e majoritairement par l atome de soufre S5 du r sidu Cys51 sous la forme d une orbitale de type p paire libre Une petite d localisation de cette orbitale mol culaire est observ e sur les atomes
227. fort caract re ionique S O n est pas ais ment stabilis dans le site actif avec un tat de protonation CysH Glu La charge n gative port e par Glu implique certainement une r pulsion importante vis vis de l atome d oxyg ne du DMSO qui tend r orienter la mol cule de substrat d une facon peu favorable la reconnaissance par les autres r sidus soit polaires Cys51 Tyr82 et Tyr134 soit hydrophobes Phe52 et Trp53 6 4 Complexe enzyme substrat sulfoxyde 137 Distance Distance Distance FIG 20 15 10 5 lie Y82HH DMS2120 0 OCH Ko d 0 200 400 600 800 10000 5 10 15 20 Temps ps Distance a Distance Tyr82 H DMSO O Y184HH DMS2120 0 200 400 600 800 10000 5 40 15 20 Temps ps Distance b Distance Tyr134 Hn DMSO O 0 200 400 600 800 10000 5 up 15 20 Temps ps Distance c Distance Cys51 Hy DMSO O 6 6 Variation de la distance Tyr82 H DMSO O a de la distance Tyr134 H DMSO O b et de la distance Cys51 Hy DMSO O c en fonction du temps dans la simulation DMSO CysH Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 138 6 Reconnaissance et ancrage du substrat 20 l KA 10 Distance 0 200 400 600 800 1000 0 5 10 15 20 Temps ps Distance d Distance Cys51 Sy DMSO S Distance _ W53NE1 DMS212CB 0 200 400 600
228. foxyde proton Formellement la r duction d une esp ce sulfoxyde par un thiol peut tre d crite comme le bilan des deux demi quations lectroniques suivantes R2820 2e 4 2H RS HO 2H 2e RSH H20 RSOH 2e 2H RoS O RSH RoS RSOH Cette r action d oxydor duction m di e par une mol cule d eau qui joue le r le d oxydant inter m diaire correspond au m canisme d crit dans les travaux de Balta et a Un m canisme de r duction mettant en jeu le transfert d un seul lectron peut galement tre envisag l criture des deux demi quations lectroniques tant modifi e selon RoS O e H RS HO 1H 16 RSH HO RSOH e H R2S 0O RSH RoS RSOH La r action est ici m di e par un radical HO jouant le r le d agent oxydant de la cyst ine Quel que soit le type de m canisme consid r la protonation du substrat sulfoxyde devrait tre le facteur d clencheur de la r action d oxydor duction Bien que les sulfoxydes soient connus pour avoir une tr s grande affinit protique en phase gazeuse 90 la protonation du substrat sulfoxyde est quasiment impossible en solution aqueuse compte tenu de sa valeur de pK d environ 2 Selon le m canisme propos par Balta et a la protonation en solution de DMSO est possible gr ce la formation d un interm diaire sulfurane avec cr ation d une liaison S S entre l atome de soufre d un thiolate et l atome de soufre du sul
229. gt ia 3 jk 1e I H H 6 PAIN C Can ie CH CH3 4 CH 2H H2O CH Perte irr versible de la fonction de st 5 la prot ine CH3 FIG 5 1 Diff rentes voies d oxydation d un r sidu m thionine 1 Oxydation deux lectrons et formation d un dication m thionine 2 Hyaratation du dication m thionine et formation du sulfoxyde 3 Oxydation deux lectrons par transfert de l oxyg ne de l oxydant 4 Oxydation un lectron et formation d un radical cation m thionine 5 Transformation irr versible du sulfure et perte de la fonction biologique de la prot ine 6 Deuxi me oxydation un lectron et formation du sulfoxyde par hydratation 90 5 Rappels bibliographiques et objectifs L ensemble des m canismes d oxydation d une m thionine par les EOA ne sera pas d taill Nous verrons simplement une br ve description de la r activit des oxydants les plus fr quents L oxydation d une m thionine en sulfone R SO ne sera pas trait e Cette r action est possible mais n cessite des conditions drastiques La lecture de la revue de Sch neich 9 pourra compl ter cette partie a Oxydation par le radical hydroxyl HO In vivo les radicaux hydroxyl sont produits de diff rentes mani res La principale source pro vient n anmoins de la rupture homolytique de la liaison O O de H20 sous la catalyse d un centre m tallique comme Fe ou Cu 160 La premi re tape de la r action en
230. gure 5 9 repr sente la structure tridimensionnelle de la MsrA d E coli La partie centrale est compos e de 140 r sidus entre les positions 42 et 192 chez E coli Elle adopte un repliement mixte o B unique 6 Le ne partageant aucune similarit avec les repliements d j r pertori s dans les banques de donn es structurales Ce repliement est constitu d un feuillet B antiparall le cinq brins flanqu de quatres h lices amp et d un petit feuillet B antiparall le 2 brins L extr mit N terminale ne pr sente aucun l ment de structure secondaire Cependant son po sitionnement est fortement stabilis par la formation de nombreuses liaisons hydrog ne ou de type van der Waals avec la partie centrale Pour s en convaincre les structures de la PDB se superposent remarquablement bien au niveau de cette extr mit La longueur de cette extr mit est tr s variable de 5 r sidus chez N meningitidis une quarantaine chez E coli Peu de r sidus sont conserv s dans cette partie et aucun r le catalytique sp cifique n a t attribu cette partie mis part de diminuer l g rement la cin tique de r duction L extr mit C terminale ne pr sente pas non plus d l ment de structure secondaire Par contre la diff rence de la partie N terminale sa conformation varie l g rement selon les structures consi d r es Les cyst ines de recyclage aux positions 198 et 206 se situent sur cette extr mit
231. haque atome lourd de la prot ine telle que donn e dans l quation suivante ANpK ocalbes NL ocal X Ci ocal A 45 La relation A 45 combin e avec la relation A 43 permet de donner des pr dictions en accord avec l exp rience pour les r sidus proches de la surface mais il n en est pas de m me pour ceux enfouis plus profondemment dans la prot ine Un second effet de d solvatation plus longue port e doit alors tre pris en compte De facon empirique un groupe ionisable est consid r comme enfoui si le nombre d atomes N45 l entourant dans une distance de 15 5 est sup rieur ou gal 400 il est d finit comme tant en surface dans le cas contraire De la m me mani re que pour la d solvatation locale il est possible de d terminer le d placement de pK d cette d solvatation globale ApKGobalbes La relation empirique est la suivante APKGiobaDes N15 400 x Co obai A 46 o Ne si 400 est le nombre d atomes de la prot ine en exc s et CGiobai est la constante de d placement de pK d finie pour chaque r sidu enfoui L effet de d solvatation sur le d placement de pK est la somme des d placements dus aux d solvatations locales et globales ApKpes APKGiobaiDes APKLocalDes A 47 A 3 PROPKA Pr diction des valeurs de pK des r sidus d une prot ine 243 Interactions charge charge Les interactions charge charge entre les groupes ionisables inter viennent de
232. heel pour les valeurs calcul es dans le tableau 2 2 S lectionnons trois individus de la population initiale en lan ant trois fois cette roue Les r sultats dans le tableau 2 2 sont donn s en nombre de fois o l individu a t tir La population s lectionn e est donc constitu e des individus 1 2 et 3 Fic 2 4 Roulette wheel Chaque individu de la population est repr sent sur la roue par une surface pro portionnelle sa probabilit d tre s lectionn La s lection des individus reproduire s effectue en tournant la roue Individu Chromosome x f x p R sultat de la s lection par roulette wheel 1 01010 10 100 0 29 1 2 01100 12 144 0 27 1 3 00111 7 49 0 31 1 4 10110 22 484 0 13 0 Total 777 1 00 Moyen 194 25 0 25 Minimum 49 0 13 Maximum 484 0 31 TAB 2 2 Evaluation de la population initiale probabilit p pour un individu d tre s lectionn et r sultat de la roulette wheel 2 2 Principe des algorithmes g n tiques 37 e Reproduction La seconde tape importante de tout algorithme g n tique est la reproduction Durant celle ci les individus s lectionn s pr c demment engendrent des nouveaux individus Cette op ration se fait en deux sous tapes le croisement et la mutation la plupart du temps combin es Durant la phase de croisement deux individus de la population s lectionn e sont d abord choisis de facon al atoire puis leurs g nes sont copi s et subissent un croisement Pour
233. i les r sultats obtenus dans cette th se ayant soulign l importance de l interaction Glu Substrat la fois sur la reconnaissance et la r action enzymatique 8 4 Devenir du substrat m thionine r duit Nous allons discuter maintenant le processus de lib ration du substrat m thionine du site actif de l enzyme une fois la r duction effectu e Sur la base des simulations de dynamique mol cu laires que nous avons effectu es pr c demment on peut tenter de d crire un sc nario plausible de l jection de la m thionine r duite du site actif Nous savons que l ancrage du substrat oxyd de la m thionine s effectue essentiellement gr ce l interaction sp cifique par liaison hydrog ne d un proton port par Glu94 et l atome d oxyg ne de la fonction sulfoxyde Cette interaction permet l ta blissement d autres interactions entre le substrat et les r sidus du site actif liaisons hydrog ne avec Tyr82 et Tyr134 interaction hydrophobe avec Phe52 et Trp53 assurant la stabilit du complexe micha lien de m me que celle de l interm diaire sulfurane La r duction du sulfoxyde entraine une dissociation des liaisons S S et S O Le substrat m thionine se trouve alors entour d un acide sulf nique qui potentiellement peut former une liaison hydrog ne et un Glu qui devrait aussi avoir un effet r pulsif significatif La m thionine est donc vraisemblablement en d faut de stabilisation et est ject e naturellement du si
234. i cation de la bo te de dimension Lx Ly Lz rj le vecteur dont Irj est la distance entre les particules i et j de charges respectives q et qj Cette somme converge lentement et conditionnellement Elle peut tre d compos e en une somme de deux termes 1 LEGS alri N qiq 1 S alr nl VCoulomb 7 LA A 20 TT Ange LL Ir n DE Ir n SE o S est une fonction qui d croit rapidement par exemple S x erfc x Um le et Oo un coefficient d crantage choisi de sorte que la premi re somme converge dans un rayon r tel que r min Lx Ly Lz 2 Ainsi le premier terme de courte port e converge rapidement au sein de la bo te de simulation centrale et est donc somm dans l espace direct Le second contient les contributions longue port e convergeant lentement Sa transform e de Fourier en revanche converge rapidement C est la raison pour laquelle il est somm dans l espace r ciproque Dans le cas o S x erfc x Vcoulomb S crit 1 LX aigertc eir nl de ea LN a Vcoul b y b a ehn us 2 A21 HA nes ers Iron Teo L3 ich K Vn Hb SD Le dernier terme de l quation A 21 est constant et correspond au terme d auto couplage Le co t en terme de temps de calcul de la somme d Ewald cro t en O N ou N est le nombre d atomes dans la bo te de simulation Ceci nous oblige donc limiter la taille des syst mes simuler b
235. ie de chacune de ces trois mol cules est optimis e en phase gazeuse avec la m thode PM3 74 4 Validation du programme ALGOGEN DIVCON 4 2 1 Docking de la 8 azaxanthine dans le site actif de l urate oxydase Le docking de la 8 azaxanthine dans le site actif de l urate oxydase a fait l objet de deux tests distincts Dans un premier temps nous avons voulu comparer de la m me mani re que pour le dim re de l eau l utilisation d une minimisation par les gradients conjugu s et par un algorithme g n tique pour le docking de ce syst me Le nombre d atomes est alors r duit au minimum pour pouvoir tre trait par GEOMOP Dans un deuxi me temps un docking mol culaire sur un syst me enzyme ligand de plus grande taille a t entrepris pour tester l efficacit de notre programme dans les conditions r elles d utilisation a Docking dans le petit systeme Le petit syst me est construit par extraction d une petite partie de la structure de l enzyme pr par e ci dessus ll contient tous les r sidus et les mol cules d eau compris dans une bo te cubique de 5 de c t plac e au centre g om trique du site actif soit un total d environ 140 atomes pour la partie enzyme Le docking avec ALGOGEN DIVCON a t r alis en utilisant une population de 32 individus Chaque chromosome est constitu de 3 g nes de longueur 10 pour la translation et 3 g nes de lon gueur 8 pour la rotation La taille de la bo te de docking est
236. ie de la minimisation est enregistr dans un fichier dont on donne le nom sous la forme d une cha ne de caract res options OutputFile string e Mot cl stdout L affichage de sortie de la minimisation se fait directement sur l cran de l ordinateur sortie standard options OutputFile stdout Valeur par d faut stdout OutputPrint Fonction d affichage de sortie e Fonction externe d finie par l utilisateur Voir section B 4 7 La fonction fournie OutputPrint g n re l affichage de sortie Elle doit retourner une cha ne de caract res format e qui sera crite sur le media s lectionn options OutputPrint function Affichage par d faut Num ro de g n ration Compteur des valuations valuation courante et totale et longueur de l historique des in dividus Liste des individus de la population courante tri s par ordre croissante de leur valuation Meilleur individu de la population courante Meilleure solution actuelle OutputFrequency Fr quence d criture en sortie e Entier d finissant la fr quence en terme de g n rations laquelle un affichage de sortie est g n r par le programme options OutputFrequency int Valeur par d faut 1 B 2 6 Options de sauvegarde BackupFile Fichier de sauvegarde e Nom du fichier de sauvegarde B 3 Propri t s et m thodes de l algorithme g n tique 253 La population courante et l historique d
237. ier crit re atteint options MaxGenerations int Valeur par d faut 100 MaxEvaluations Nombre maximal d valuations e Entier correspondant au nombre maximal d valuations effectuer durant la minimisation D s que le nombre d valuations effectu es est sup rieur ou gal ce nombre le cycle de reproduction est arr t et le programme ex cute les proc dures de terminaison Ce test est effectu apr s valuation de la population Les options MaxEvaluations et MaxGenerations fonctionnent en parall le Le cycle de reproduction s arr te au premier crit re atteint options MaxEvaluations int Valeur par d faut 10000 EvaluationFunction Fonction d valuation e Fonction externe d finie par l utilisateur Voir section B 4 1 Cette fonction est appel e pour valuer chaque individu La fonction fournie EvaluationFunction prend en argument un tuple de longueur gale au nombre de variables cod es par le chromosome et retourne le r sultat de l valuation de celui ci Les options EvaluationFunction et ResultsGrabber sont exclusives Il n est pas n cessaire de renseigner l option EvaluationFunction si l option ResultsGrabber est utilis e options EvaluationFunction function Pas de valeur par d faut Param tre obligatoire 250 B Manuel utilisateur d ALGOGEN StopFunction Fonction d arr t e Fonction externe d finie par l utilisateur Voir section B 4 2 L appel cette fonction s
238. ier l g rement le m canisme d activation pr sent en d but de l tude Dans le m canisme illus tr par la figure 7 11 la forme cyst ine d proton e sulfoxyde proton est remplac e par l inter m diaire sulfurane c Les calculs de Balta et a 2 ont cependant montr que la dissociation d un sulfurane selon la liaison S S est tout fait envisageable en solution et on peut penser qu il en sera de m me dans l enzyme m me si formellement nous n avons pas trouv un minimum d nergie as soci cette configuration la pr sence de Glu en tant probablement la cause Nous avons donc r alis deux simulations de dynamique mol culaire pour le substrat activ sous forme sulfoxyde proton DMSOH Cys Glu9 et sous forme sulfurane Sulf Glu T Met n Met Y ER N S S 0 S S OH l Activation d CH du substrat Cyssi L E Cyss1 Fic 7 11 M canisme d activation de l tape r ductase du m canisme catalytique activation du substrat B conduit la formation de l interm diaire sulfurane Les r sultats de la simulation pour DMSOH Cys Glu montrent que le sulfoxyde proton est relativement mobile et forme un faible nombre d interactions avec les r sidus du site actif La simu lation de l interm diaire sulfurane Sulf Glu indique en revanche que celui ci est relativement bien stabilis par les r sidus du site actif ll est peu mobile et sa structure est proche de celle du com
239. iller et Goldberg en 1995 La population pr s lectionn e par litisme est r partie al atoirement dans un nombre de groupes gal au nombre d individus obtenir en fin de s lection Le meilleur de chaque groupe ou tournoi est plac dans la s lection finale des individus reproduire La figure 2 6 illustre le principe de cette s lection avec une population initiale de 12 individus num rot s de 1 12 Pour obtenir au final trois individus reproduire les trois groupes d individus suivant sont form s 9 7 3 6 2 8 5 11 et 1 12 10 4 Dans chaque tournoi les individus sont tri s selon l ordre croissant des valuations et l individu correspondant la plus petite valuation est plac e dans la s lection finale Nous obtenons ainsi la s lection des individus 7 2 et 10 9 1 7 2 3 3 6 4 5 2 A 7 6 8 2 7 a 5 a 10 8 11 v 9 10 1 11 be 12 12 10 4 Population initiale 3 tournois 3 individus de 12 individus de 4 individus s lectionn s FIG 2 6 Sch ma de fonctionnement de la s lection par tournois Les 12 individus de la population initiale sont r partis al atoirement dans 3 groupes diff rents Le meilleur de chacun de ces tournois est s lectionn pour les op rations de reproduction Nous constatons que cette m thode est en ad quation avec notre volont de conserver une certaine d
240. imie th orique le docking mol culaire est une m thode qui pr dit la conformation position et orientation relatives la plus favorable de deux mol cules en interaction et formant un complexe stable 97 7 La connaissance de cette conformation pr f rentielle permet par la suite l estimation de la force d association ou affinit de liaison entre ces deux mol cules Il existe deux grands types de docking mol culaire Le docking rigide consiste obtenir la confor mation pr f rentielle d un syst me prot ine ligand en consid rant que chacune des deux mol cules conserve une g om trie interne fixe Dans ce cas la relaxation de la g om trie interne de chaque entit en interaction dans le complexe n est pas prise en compte Cependant il est tout fait conce vable que les structures de la prot ine et du ligand soient modifi es durant le processus de docking mol culaire afin d optimiser au mieux l interaction entre les deux entit s On parle dans ce cas de docking flexible 1 2 Principe de fonctionnement Le docking mol culaire peut se rapporter un probl me d optimisation selon une valeur num rique qui rendrait compte de la conformation plus ou moins favorable de deux entit s e g l nergie libre totale du syst me prot ine ligand Cette valeur num rique sera appel e score de docking ou simplement score par la suite Sa d finition est essentielle tout programme de docking mol cu laire car elle d term
241. ine le r sultat de la pr diction En fait il existe diff rentes mani res d obtenir ce Score en fonction de la qualit du docking mol culaire que l on souhaite r aliser 1 2 Principe de fonctionnement 23 1 2 1 Mod lisation du syst me prot ine ligand et d finition du score Un grand nombre de programmes commerciaux ou non de docking mol culaire sont d ores et d j disponibles Parmi ceux ci nous citerons par exemple AuTODOCK 5 FLEXX HADDOCK GAsDock GOLD etc Ils diff rent les uns des autres sur la mani re de r pr senter le syst me mol culaire et la mani re de d terminer le score de docking fonction de score Deux approches sont principalement employ es pour la mod lisation du syst me prot ine ligand a Repr sentation g om trique Cette premi re approche a conduit au d veloppement de m thodes g om triques dites de com pl mentarit de forme shape complementarity o la prot ine et le ligand sont d crits par des sur faces de descripteurs 54 qu il suffit d apparier matching La construction de la surface de descrip teurs de chacune des deux entit s prend en compte diff rentes caract ristiques telles que la surface mol culaire la surface accessible au solvant les propri t s hydrophobes la formation ventuelle de liaisons hydrog ne etc Elles peuvent tre construites aussi gr ce la technique des descripteurs de surface de Fourier 7 Dans cette approche la fonction de sco
242. ine sulfoxyde r ductases 102 Analyse PROPKA des r sidus Cys51 et Glu94 de MsrA 118 R sum des simulations r alis es 120 Param tres du champ de force du substrat DMSO 122 Analyse PROPKA des r sidus Cys51 et Glu94 de MsrA 123 Valeurs des charges atomiques pour DMSO CysH Glu 136 Valeurs des distances et des angles pour les structures 1 TS _2et2 163 Valeurs des ordres de liaison et des charges pour les structures 1 TS 2et2 164 Bilan nerg tique du transfert de proton dans le mod le quantique de site actif 164 Comparaison entre la structure 1 et la cristallographie 166 Param tres du champ de forces du substrat DMSO proton 174 Param tres du champ de forces du r sidu sulfurane 181 Param tres du champ de forces du r sidu sulfurane Suite 182 Valeurs des distances des angles des ordres de liaison des charges et bilan nerg tique pour les structures A TSa p B T8gg etC 192 Valeurs des distances des angles des ordres de liaison et des charges pour la structure 3 199 Potentiels d ionisation et affinit s lectroniques du m thanethiol et du DMSO 202 Potentiel d ionisation de CH3 S et affinit lectronique de CH3
243. ique en soit totalement dissoci En d autres termes ce programme ne s occupe que de la proc dure de minimisation la partie concernant l valuation des individus faisant appel un autre programme par l interm diaire d un script d interface Une cons quence avantageuse de ce principe est que notre code peut tre r utilis de facon simple et transparente dans d autres applications que le docking Un grand nombre de param tres et de fonctionnalit s sont ais ment red finissables par le d veloppeur Le choix du langage de programmation s est port sur Python Ce langage fut cr en 1990 par Guido van Rossum et les principales caract ristiques sont e langage interpr t e multi paradigme programmation imp rative structur e orient e objet et fonctionnelle e typage dynamique fort e gestion automatique de la m moire par l interm diaire d un garbage collector Le langage Python est plac sous une licence libre proche de la licence BSD et fonctionne sur la plupart des plates formes informatiques de Linux Unix en passant par Windows et MacOS Il est con u pour optimiser la productivit des programmeurs en offrant des outils de haut niveau et une syntaxe simple utiliser Python poss de une grande biblioth que standard fournissant des outils convenant de nombreuses t ches diverses Les modules de la biblioth que standard peuvent tre augment s avec des modules sp cifiques crits en C ou en Python 2
244. iquement le 4 juin 2009 salle Jean Barriol Facult des Sciences et Techniques Membres du jury Pr sident M Guy BRANLANT Professeur Universit Henri Poincar Nancy Rapporteurs M Serge ANTONCZAK Ma tre de Conf rences HDR Universit Nice Sophia Antipolis Mme Anne MILET Professeur Universit Joseph Fourier Grenoble Examinateurs Mme Sandrine BOSCHI MULLER Professeur Universit Henri Poincar Nancy M Eric HENON Professeur Universit de Reims Champagne Ardenne Directeurs de th se M G rald MONARD Professeur Universit Henri Poincar Nancy M Manuel F RUIZ LOPEZ Directeur de recherche CNRS Nancy Equipe de Chimie et Biochimie Th oriques Unit Mixte de Recherche CNRS UHP 7565 Facult des Sciences et Techniques BP 239 54506 Vandceuvre l s Nancy Cedex Nancy Universit N Universit H enri Poincar U F R Sciences et Techniques de la Mati re et des Proc d s Ecole Doctorale Lorraine de Chimie et Physique Mol culaires SESAMES D partement de Formation Doctorale en Chimie Informatique et Th orique TH SE pr sent e l Universit Henri Poincar Nancy I en vue de l obtention du grade de Docteur de l Universit Henri Poincar Nancy en Chimie Informatique et Th orique par Eddy THIRIOT Mod lisation de la reconnaissance et de la catalyse enzymatiques d veloppements m thodologiques et d termination du m canisme des M thionine Sulfoxyde R ductases de cla
245. ir sur les positions et les vitesses des atomes au cours de la trajectoire Nous d taillons les m thodes du thermostat et du barostat de Berendsen qui sont celles implant es dans AMBER c Thermostat de Berendsen Dans cette m thode la vitesse des atomes est modifi e de sorte relaxer la temp rature instan tan e T t vers la temp rature To d sir e selon dT To T t T A 35 o t7 d signe le temps de relaxation associ aux fluctuations de temp rature Durant un pas d int gration dt l nergie cin tique est modifi e d une quantit A donn e par 1 Aja S x 1 NkeT t A 36 o x est le facteur de r ajustement des vitesses tel que St To 1 2 1 1 A 37 relie ra an d Barostat de Berendsen De mani re analogue la temp rature on souhaite relaxer la pression instantan e P t vers la pression de r f rence Pp selon dP t 8 Po P t A 38 dt Tp f o Tp est le temps de relaxation associ aux fluctuations de pression En r ajustant les coordonn es atomiques et la taille de la cellule p riodique par un facteur c le volume total se voit modifi de A V c 1 V et entra ne une variation de pression _ AV Apa DV A 39 o B est la compressibilit isotherme c s crit u 1 3 s EE c A 40 A 3 PROPKA Pr diction des valeurs de pK des r sidus d une prot ine 239 A 3 PROPKA Pr diction des valeurs de pK des r sidus d
246. ire dans le fichier de sortie 3 3 D roulement du docking Nous allons pr sent voir en d tail les t ches se succ dant durant l ex cution du programme de docking Elles ont t r sum es dans la figure 3 2 sous la forme d un diagramme UML de s quence Ce dernier permet aussi de montrer les diverses d pendances des modules entre eux Le lancement du programme de docking s effectue par l interm diaire d un script Python ex cu table repr sent par la colonne Input sur le diagramme L utilisateur y indique les diff rents para m tres et sp cifications du docking qu il souhaite r aliser La colonne AlgoGen repr sente l algo rithme de recherche genetic py Docking le traitement du syst me mol culaire docking py et quaternion py Divcon l interface au programme et SGE Sun Grid Engine le gestionnaire de cluster pour le calcul distribu Le partie Docking r cup re dans un premier temps les structures de la prot ine et du ligand sous la forme de deux fichiers distincts au format PDB 1 1 et des informations telles que la taille de la bo te de docking ou les r sidus de la partie d int r t de la prot ine 1 2 i e le site actif o le ligand va tre dock Il proc de ensuite la pr paration des syst mes mol culaires 2 Pour chaque fichier PDB un syst me d atomes est cr L origine des coordonn es est d finie par le centre g om trique de chaque syst me Nous appelerons ces syst mes PROT
247. is plus rapidement que H20 72 5 1 2 Cons quences de l oxydation des r sidus m thionine L oxydation des r sidus m thionine au sein d une prot ine entraine une modification des propri t s physico chimiques de celle ci Nous allons voir que ce ph nom ne potentiellement n faste pour la structure de la prot ine peut se r v ler tre physiologiquement utile pour le m tabolisme 92 5 Rappels bibliographiques et objectifs a Modification de la structure des prot ines Il est bien tabli que l oxydation des cha nes lat rales de r sidus au sein d une prot ine peut entra ner des changements de conformation ou un d pliement de la prot ine et avoir des cons quences importantes sur sa fonction biologique Ces observations s appliquent galement pour les m thionines dont la cha ne lat rale est particuli rement hydrophobe Ainsi les m thionines peuvent tre pr sentes au sein des r gions hydrophobes des prot ines et leur oxydation en sulfoxydes fonc tion polaire et hydrophile cr e une perturbation d stabilisatrice tendant modifier la structure de la prot ine afin d amener ces sulfoxydes dans un environnement plus polaire 2 b Modulation de la fonction des prot ines et implication pathologique L oxydation des r sidus m thionine en sulfoxyde de m thionine peut tre consid r e comme une modification post traductionnelle non enzymatique des prot ines Cette modification est impliqu e notamment dans
248. ism starting from the Michaelis complex indicates that the process is initiated by the formation of a sulfurane species after protonation of the sulfoxide and simultaneous formation of a S S bond with Cys51 A second proton transfer from Tyr134 or Tyr82 to the sulfurane OH group induces the formation of a water molecule and the dissociation of the S O bond The resulting sulfuranyl ion is finally hydrolyzed to form a sulfenic acid intermediate and the reduced substrate According to the energy profile this path could be simply described as a concerted and asynchronous mechanism involving two proton transfers Key words Enzymatic catalysis Molecular recognition Molecular dynamics Quantum chemistry Methionine sulfoxide reductases Reaction mechanism Genetic algorithm Sulfenic acid
249. it du r sidu Glu94 La solvatation relativement faible de ce r sidu sugg re que CysH GluH peut tre un tat de protonation envisageable pour l enzyme libre La figure ci dessous pr sente un r sum des interactions observ es dans cette simulation Tyr434 O O Tyra2 5 Z CS H H O H 0 H m d Glug4 130 6 Reconnaissance et ancrage du substrat C51HG E940E1 o Distance A 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance a Distance Cys51 Hy Glu94 Oe o Distance A m C51SG E94HE2 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance b Distance Cys51 S Glu94 He2 Distance 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance c Distance Cys51 Hy Tyr197 Oq FIG 6 4 Variation de la distance Cys51 H Glu94 O a de la distance Cys51 S Glu94 He b et de la distance Cys51 H Tyr197 Oq c en fonction du temps dans la simulation Free CysH GIuH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 3 Enzyme libre 131 SA 3 D o o 3 2 RS o z 400 600 1000 0 Temps ps cce de EH d Nombre de mol cules d eau proximit du r sidu Cys51 distance 3 4 6 o gt SA o o o o 3 2 O ott ee 0 i 0 200 400 600 800 1000 0 2 4 6 Temps ps Mol cules de solvant e Nombre de mol cules d eau proximit du r sid
250. ite actif par un r seau de liaisons hydrog ne au niveau de l atome d oxyg ne tel que nous venons de le d crire L interaction lectrostatique entre les deux atomes de soufre peut ainsi s tablir de mani re durable ce que nous observons La distance entre ces atomes varie peu autour de 3 5 Fig 6 7 g L orientation sp cifique du substrat dans le site actif a aussi pour effet de permettre l existence de l interaction de type hydrophobe avec les r si dus Phe52 et Trp53 avec une distance entre le groupement m thyle Cg du DMSO et l azote Ne de Trp53 variant peu autour de 3 5 Fig 6 7 h Cette interaction hydrophobe semble fournir un point d ancrage suppl mentaire au substrat l int rieur du site actif afin d en diminuer la mobilit Cette hypoth se est v rifi e par l analyse de l angle di dre Cys51 Cg Cys51 S DMSO S DMSO Cg Fig 6 7 i qui reste globalement constant avec une valeur fluctuant autour de 225 Langle diminue 90 pendant environ 50 ps aux alentours de 200 ps ce qui est mettre en corres pondance avec l interaction de l hydrog ne Hy de Cys51 et de l oxyg ne du DMSO Pendant cette p riode l orientation du substrat dans le site actif change puis revient sa valeur initiale L analyse de l angle Cys51 S DMSO S DMSO O Fig 6 7 j confirme galement ce mouvement Plus g n ralement on peut dire que la structure globale du substrat dans le site ressemble fortement 142 6 Reconnaissa
251. itement adapt pour stabiliser cette esp ce sulfurane et donc l tat de transition de protonation Conclusion g n rale 221 Diff rents m canismes ont t envisag s pour d crire la r duction enzymatique du substrat sul foxyde partir de l interm diaire sulfurane Ces travaux se r sument ainsi e le transfert du groupement OH du sulfurane sur le soufre de Cys51 via une pseudorotation ne semble pas envisageable dans l environnement du site actif e un m canisme de transfert d un lectron de Cys51 vers le sulfoxyde ou de rupture homolytique de la liaison S S envisageable en phase gazeuse met en jeu des nergies trop importantes pour tre consid r dans l enzyme e la protonation du groupement OH de l interm diaire sulfurane par un r sidu tyrosine conduisant la formation d un ion sulfuranyle et d une mol cule d eau est nerg tiquement envisageable dans le site actif si l on admet sur la base de travaux ant rieurs que l ion sulfuranyle est ai s ment hydrolysable en acide sulf nique et en substrat r duit Ce m canisme correspond un m canisme de r duction de type 2H 2e Nos tudes ont ainsi r v l que les r sidus Glu94 Tyr82 et Tyr134 ont une importance fonda mentale dans chacune des tapes que nous venons de d crire Glu94 est impliqu dans la recon naissance et l ancrage liaison hydrog ne essentielle et dans le m canisme d activation du substrat sulfoxyde premi re protonation
252. ition TS _2 et du sulfurane 2 dans le mod le quantique de site actif La g om trie est optimis e au niveau B3LYP 6 31G d En comparaison les valeurs pour le DMSO non proton DMSO et proton DMSOH sont indiqu es isol phase gazeuse 164 7 Activation du substrat Ordre de liaison 1 TS 2 DMSOH Glu C4 Ss 1 04 1 03 1 03 S S37 0 21 0 46 0 49 Ce C4o 0 99 0 97 0 96 0 92 C1o O12 1 14 1 34 1 36 1 49 C19 O11 1 68 1 52 1 51 1 48 O12 H43 0 57 0 26 0 23 H13 Osg 0 13 0 46 0 49 0 69 S37 O38 0 88 0 61 0 59 0 93 S37 C33 0 97 0 98 0 98 1 00 S37 C39 0 97 0 98 0 99 1 00 Charge u a 1 TS 2 DMSOH Glu C4 0 04 0 01 0 03 Ss 0 79 0 64 0 61 Ce 0 47 0 40 0 42 0 40 0 29 Cio 0 73 071 0 73 0 73 0 74 O4 0 53 0 55 0 62 0 63 0 76 O12 0 56 0 59 0 68 0 69 0 75 Hi3 0 0 0 38 040 0 40 0 45 Cao 0 52 0 37 0 36 Oo 0 57 0 52 0 51 Hoo 0 31 0 30 0 29 Oz 0 78 0 78 0 78 Hog 0 34 0 37 0 36 Oso 0 78 0 76 0 76 H31 0 34 0 37 0 37 H32 035 033 033 a C33 0 36 0 37 0 32 0 30 0 49 ER 0 28 0 74 0 9 0 56 0 46 Ose 0 42 0 54 0 57 0 55 0 38 Caso 0 44 0 44 0 39 0 41 0 50 TAB 7 2 Valeurs des ordres de liaison et des charges du complexe micha lien 1
253. iversit g n tique au sein de la population Si le nombre de groupes cr s est suffisam ment grand les individus dont l valuation n est pas excellente sans tre forc ment tr s mauvaise peuvent tre s lectionn s pour la reproduction 2 3 4 Reproduction Comme nous l avons vu pr c demment la reproduction est essentielle l algorithme g n tique pour explorer de nouvelles r gions de l espace de recherche Plus cette reproduction est efficace 46 2 D veloppement d un algorithme g n tique de minimisation Le cr ation chaque g n ration d individus nouveaux ayant une valuation meilleure que celle des parents plus la recherche de la solution optimale est rapide Une des conclusions du Schema theorem de Holland est que la recherche d un minimum par un algorithme g n tique s effectue de mani re optimale si les op rations de reproduction ne perturbent pas de fa on trop importante le processus global de minimisation En d autres termes ces op rations doivent s effectuer sur des g nes de la plus petite taille possible Pour s affranchir de cette r gle Goldberg propose alors de ne plus consid rer les op rations de reproduction sur le g ne en entier mais sur des partitions de celui ci II nomme cette mani re de rendre efficaces les op rateurs de reproduction pour les g nes de grande taille sous le terme de Building blocks hypothesis Nous effectuons la reproduction de deux individus croisement e
254. ividu A chaque g n ration un individu survivant voit son ge aug ment Si cet ge d passe une valeur donn e l individu est supprim Cette am lioration permet d viter une trop grande p r nnit des meilleurs individus dans les nouvelles g n rations 1067108 Elles miment pour D autres strat gies ont t d velopp es par la communaut scientifique la plupart des ph nom nes existant dans le monde vivant L algorithme g n tique que nous avons d velopp permet l utilisateur et aux futurs d veloppeurs de programmer leur s propre s strat gie s gr ce l utilisation des primitives de s lection et de reproduction 2 3 6 Population initiale La cr ation de la population initiale d individus est une op ration importante de l algorithme g n tique L efficacit de la recherche d pend de la diversit g n tique des individus de cette premi re population Nous pr sentons les trois m thodes d velopp es pour la cr ation de la population initiale a Population al atoire Cette m thode d crite l origine par Goldberg consiste construire les chromosomes des individus de la population initiale de facon totalement al atoire Cette solution permet d obtenir une population initiale ayant une grande diversit g n tique Mais ceci n cessite d avoir une taille de population assez importante pour esp rer avoir une distribution pratiquement uniforme de points dans l espace de recherch
255. knownSurvivor options Periodic 3 4 5 options ReproductionControl docking controlDistance options ResultsGrabber docking grabResults Execution Lancement du docking ga uni 265 266 C Manuel utilisateur d ALGOGEN DIVCON C 2 Importation des modules En pr ambule du script doit figurer l importation des modules Python suivants docking contient les fonctions et les proc dures propres au d roulement du docking mol culaire divcon contient les proc dures relatives aux entr es sorties du programme DIVCON genetic contient les proc dures relatives aux entr es sorties du programme ALGOGEN Lors de l importation des modules divcon py et genetic py il faut importer les singletons divcon d une part et les singletons ga parameters et options d autre part L importation du module math py permet d acc der la constante x n cessaire pour la d finition du domaine de variation des angles C 3 Fonctions et attributs de docking C 3 1 Fonctions rdPDB pdbFile Lecture d un fichier PDB e Cr e un syst me d atomes partir de la lecture d un fichier au format PDB nomm pdbFile La fonction renvoie un objet At omSet correspondant aux atomes du fichier PDB docking rdPDB pdbFile gt AtomSet cut atomSet center radius Extraction des atomes e Cr e un syst me d atomes en conservant les r sidus d un autre syst me d atomes atomSet dont les atomes sont l int rie
256. l culaire utilisant une m thode quantique semi empirique coupl e un algorithme de croissance lin aire pour la description du syst me prot ine ligand ainsi qu un algorithme g n tique pour l exploration de l espace configurationnel 1 4 Objectifs cahier des charges du nouveau programme D s la conception nous souhaitions que notre programme de docking puisse utiliser n importe quel code de calcul quantique existant et ce sans avoir modifier une partie de ce dernier Plut t que de parler de couplage entre deux programmes nous parlerons alors d interfacage Le programme de calcul quantique que nous avons choisi pour le d veloppement et les appli cations qui ont suivi est DivCon d velopp par Merz et al 81 permet de r aliser un calcul quantique semi empirique par un algorithme de croissance lin aire Divide amp Conquer Plusieurs m thodes semi empiriques sont disponibles dans le programme AM19 PM39 55 et PM3 PIF 4776 86 Cette derni re est la m thode PM3 standard corrig e des fonctions c ur c ur pour permettre une meilleure description des interactions intermol culaires Cette modification a t r alis e par le groupe de chimie th orique de Nancy Elle n est pas pr sente dans la version originale du logiciel L algorithme de recherche est la partie la plus importante du travail de d veloppement II est l inter face avec le code quantique DIVCON dans notre cas et pilote le processus de d
257. l oxyg ne de la fonction sulfoxyde du substrat e de mani re annexe la distance mesur e entre la cyst ine catalytique en position 51 et la ou les cyst ine s de recyclage en position 198 et ou 206 est trop importante pour permettre la formation directe du pont disulfure lors de l tape de r g n ration Ces r sultats coupl s avec les r sultats enzymatiques sugg rent fortement l implication d une r organisation confor mationnelle locale lors de la formation de ce pont disulfure successive ou simultan e avec la formation de l interm diaire acide sulf nique 106 5 Rappels bibliographiques et objectifs b Repliement et site actif de MsrB La figure 5 10 repr sente la structure tridimensionnelle de la MsrB de N gonorrhoeae La struc ture globale des MsrB est totalement diff rente de celle des MsrA Elle est caract ris e par un re pliement essentiellement de type B La partie centrale de l enzyme est form e par deux feuillets B antiparall les se faisant face pour donner une structure proche du tonneau p et flanqu e de trois h lices o et de deux h lices 349 Les boucles qui relient les brins D sont relativement courtes et adoptent un repliement en coude p Le c ur de l enzyme est constitu d une quarantaine de r si dus situ s sur des cha nes peu structur es essentiellement des coudes p L extr mit C terminale constitu e de deux petites h lices 349 antiparall les est plus courte Deux h lices o structurent l
258. la modulation voire m me la perte de l activit de la prot ine La1 antitrypsine fait partie de la famille des serpines prot ines inhibitrices de prot ases L oxydation de deux r sidus m thionine est responsable de la diminution de l activit inhibitrice de la prot ine vis vis de sa cible l lastase conduisant une d r gulation de l activit de la prot ase Cette d r gulation est impliqu e dans des ph nom nes inflammatoires comme l emphys me pulmonaire R cemment il a t propos que l oxydation des r sidus m thionine puisse aussi jouer un r le dans le m canisme de maladies neurod g n ratives telles que la maladie d Alzheimer Cette patho logie est associ e la formation et au d pot de peptides amyloides dans le cerveau La toxicit de ces peptides proviendrait de leur capacit produire des EOA radicalaires dont la formation serait m di e par un r sidu m thionine oxyd par un atome de cuivre li un peptide amyloide 5 176 177 L oxydation du peptide amyloide inhibe sa fibrillation et augmente sa solubilit i e il est alors capable de catalyser la formation d EOA et conduire d autres modifications du peptide C Lutte contre les EOA Le fait que les m thionines aient une grande sensibilit l oxydation et que dans certains cas leur conversion en sulfoxydes de m thionine n entraine aucune perturbation de la fonction de la prot ine am ne penser que ces r sidus
259. ler d avoir ac cept de faire partie de mon jury de th se et pour leurs suggestions concer nant le manuscrit J tends ces remerciements tous les membres et ex membres de l quipe d Enzymologie Mol culaire et Structurale AREMS pour les r unions officielles ou non au cours desquelles nous avons pu discuter et changer nos r sultats et nos points de vue concernant le m canisme des Msr Je souhaite aussi remercier le Pr Anne Milet et le Dr Serge Antonczak d avoir accept de rapporter cette th se et le Pr Eric H non d avoir accept de juger mon travail Je tiens montrer toute ma gratitude au Pr Eric H non et au Pr Fr d ric Bohr pour l int r t qu ils portent mon travail et leur soutien constant depuis mon stage de ma trise il y a sept ans Je les remercie de m avoir fait d cou vrir le monde de la chimie th orique J adresse aussi mes remerciements au Dr S bastien Canneaux ancien th sard de la Dream Team r moise pour sa proposition de stage post doctoral dans son quipe d s septembre prochain J adresse un grand merci aux membres du CBT et du SRSMC pour leur gen tillesse leur sympathie et surtout pour l aide qu ils m ont apport e pendant mon s jour au laboratoire Je ne ferai pas la liste de toutes ces personnes mais qu elles sachent qu elles ont t essentielles l accomplissement de cette th se dans un cadre tr s agr able Je ne manquerai pas de remercier le Pr Pascale Friant Michel d
260. lization Cr ation de la population initiale e Mot cl random Le programme cr e al atoirement une population initiale d individus La taille de cette popula tion est gale PopulationSize Les chromosomes des individus sont repr sentatifs de points dans tout l espace de recherche d fini par Ranges B 2 Param tres et options 249 options Initialization random e Nom du fichier de sauvegarde On peut red marrer une minimisation partir d une sauvegarde effectu e pr c demment On fournit alors Initializationle nom du fichier sous la forme d une cha ne de caract res contenant cette sauvegarde optlons Iinitialization lt string gt e Liste de r els correspondant a une solution approch e La taille de la liste doit tre gale au nombre de variables du probl me traiter Chaque r el appartient au domaine de d finition d fini dans Ranges options Initialization list Valeur par d faut random MaxGenerations Nombre maximal de g n rations e Entier correspondant au nombre maximal de g n rations produire Le nombre maximal de cycles de reproduction D s que le nombre de g n rations produites est gal ce nombre le cycle de reproduction est arr t et le programme ex cute les proc dures de terminaison Ce test est effectu apr s valuation de la population Les options MaxEvaluations et MaxGenerations fonctionnent en parall le Le cycle de reproduction s arr te au prem
261. llographique II faut pour cela identifier les groupes fonctionnels correspondants dans le ligand et le cas ch ant d terminer les param tres n cessaires pour le calcul du d placement de pK Le protocole retenu consiste identifier les groupes ionisables tels que les carboxylates ou les azotes de type pyridinium ammonium guanidinium et amidinium ventuellement pr sents sur les ligands Les valeurs mod les de pK de ces groupes sont issues de la litt rature ou d faut d une pr diction empirique Certains groupes non ionisables tels que les amines les alcools les thers les halog nes ou les ions monoatomiques sont aussi identifi s afin de traiter les diff rentes interactions lectrostatiques et ou par liaison hydrog ne Le traitement des diff rents termes entrant dans le calcul du d placement de pK Eq A 41 se fait de mani re similaire ce que nous avons d crit 244 A M thodologie pr c demment pour la pr diction sans ligand et avec l utilisation des param tres sp cifiques aux interactions trait es Comparaison des m thodes de pr diction Des tests de pr diction de valeurs de pK de diff rents r sidus sur un ensemble de structures cristallographiques ont t r alis s en comparant plusieurs m thodes de pr diction Les r sul tats montrent que PROPKA est la m thode la plus pr cise pour tous les types de r sidus sauf Glu et His Les valeurs pour les r sidus en surface sont gale
262. llographique Les RMS de d viation du ligand URA sont de 0 16 en PM3 et 0 36 en PM3 PIF par rapport la structure 3BJP La figure 4 8 montre une comparaison du complexe UOx URA entre la structure cristallographique 3BJP et la structure dock e en PM3 PIF avec ALGOGEN DIVCON 4 2 Docking dans une prot ine 81 Nous avons r alis le docking du ligand URA dans la structure de site actif 2IBA Celle ci est adapt e normalement un complexe avec le ligand AZA Cependant les ligands AZA et URA sont tr s similaires Le positionnement de la mol cule d eau W2 n est donc pas un probl me compar au cas du docking de l acide oxonique Les nergies d interaction du complexe entre l acide urique et l urate oxydase sont en PM3 et PM3 PIF plus grandes en valeur absolue que celle obtenues res pectivement pour le ligand AZA Dans ce cas pr sent l acide urique est sous une forme dianionique L nergie d interaction lectrostatique au premier ordre est donc plus importante pour un syst me charg 2 u a pour le ligand et 1 u a pour l enzyme que pour un syst me charg 1 u a pour le ligand et 1 u a pour l enzyme ALGOGEN DIVCON PDB Distances PM3 PIF PM3 3BJP Ura N Gln228 O 2 94 Ura Og GIn228 Ne 2 81 Ura O Val227 N 2 80 Ura O Arg176 Ny2 2 99 Ura Ns Arg176 Nh 2 93 Ura N Thr57 N 2 72 Ura N Thr57 O 3 10 Ura Ng Wat2 O 2 91 AE kcal mol 252 4 170 8 TAB 4 5 Energies d interaction
263. loppement d une suite de logi ciels de mod lisation et de simulation en chimie du vivant La partie applicative de ce projet porte sur l tude du mode de fonctionnement des enzymes m thionine sulfoxyde r ductases Msr par la r alisation d un travail concomitant de recherche exp rimentale et th orique Il r unit trois quipes de recherche dans diff rents domaines e Equipe de Chimie et Biochimie Th oriques SRSMC UMR CNRS UHP 7565 Universit Henri Poincar Nancy e Equipe ScalApplix Sch mas et algorithmes hautes performances pour les applications scien tifiques LaBRI UMR CNRS Univ Bordeaux I ENSEIRB 5800 Universit Bordeaux e Equipe d Enzymologie Mol culaire et Structurale AREMS UMR CNRS UHP 7214 Universit Henri Poincar Nancy I Avant de d crire les objectifs de cette th se nous allons voquer les tapes inh rentes la mod lisation de processus enzymatiques dont un sch ma g n ral est pr sent dans la figure 1 1 et les difficult s qui y sont associ es le choix de la structure de l enzyme ii l tude du processus de formation du complexe enzyme substrat et ii l tude du processus catalytique proprement dit a Structure de l enzyme Actuellement la d termination a priori de la structure tridimensionnelle d une prot ine n est pas possible et les tudes th oriques en catalyse enzymatique ont recours aux donn es exp rimen tales Elles peuvent provenir de diff rentes te
264. m tres Divide amp Conquer e Liste d un entier et de deux r els donnant respectivement le nombre de r sidus par coeur la taille de la premi re r gion tampon et la taille de la deuxi me r gion tampon par l algorithme croissance lin aire Divide amp Conquer diveon cluster Ent lt filoat gt s oat Valeur par d faut Calcul standard Pas Divide amp Conquer Lexique Outils m thodologiques AMBER B3LYP DFT HF MD MP2 NPT NVE Assisted Model Building and Energy Refinement Ensemble de programmes permettant la r alisation de simulations de dynamique mol culaire et ensemble de champs de force de m canique mol culaire Becke 3 Parameter Lee Yang and Parr Fonctionnelle d change correlation hybride constitu e de la fonction nelle d change B3 et de la fonctionnelle de corr lation LYP Density Functional Theory M thodes utilisant la densit lectronique pour le calcul des propri t s mol culaires Hartree Fock Equations et m thode pour le calcul d orbitales mol culaires Molecular Dynamics M thode permettant de d crire l volution dans le temps d un syst me mol culaire 2nd order Mgller Plesset M thode perturbative pour le calcul de l nergie de corr lation au 29 ordre Ensemble thermodynamique isobare isotherme Nombre de particules pression et temp rature du syst me mol culaire conserv s Ensemble thermodynamique microcanonique Nombre de particules
265. mani re la plus efficace Le syst me que nous venons de simuler peut donc tre associ au complexe micha lien dont la structure est illustr e par la figure 6 8 FIG 6 8 Structure du complexe micha lien du DMSO dans le site actif de MsrA Les r sidus du site actif impliqu s dans les interactions avec le substrat sulfoxyde sont repr sent s Seuls les hydrog nes par ticipant aux interactions ont t mat rialis s Les h lices sont color es en violet et les feuillets B en jaune 150 6 Reconnaissance et ancrage du substrat Par rapport l enzyme libre o l tat de protonation le plus stable est vraisemblablement CysH Glu ou CysH GIuH le complexe micha lien impliquerait donc une d protonation de la cyst ine Les simulations avec un tat de protonation Cys GluH pour l enzyme libre et pour le complexe enzyme substrat montrent que Tyr197 interagit avec Cys51 par une forte interaction de l hydrog ne Hy avec le soufre Sy De m me il a t mentionn que dans les simulations avec l tat de protonation CysH GluH l hydrog ne Hy de Cys51 s oriente fr quemment vers cette tyrosine Par ailleurs cette partie du site actif offre une grande accessibilit au solvant On peut ainsi formuler l hypoth se que Tyr197 participe au processus de d protonation de la cyst ine catalytique probablement en r alisant un relais de proton Cette hypoth se pourrait tre v rifi e par une exp rience de mutag n se dirig e 6
266. matique favorise la formation du sulfurane de type B permettant ainsi d abaisser l nergie d activation du processus de r duction consid r Dans un premier temps une simulation de dynamique mol culaire de l interm diaire sulfurane avec le groupement S Cys en position quatoriale a t r alis e de mani re analogue celle r a lis e dans le chapitre pr c dent pour le groupement en position axiale Les m mes param tres de champ de forces potentiels de liaison d angle d angle di dre et de Lennard Jones ont t utili S s Les charges atomiques ont t recalcul es pour d crire correctement les termes d interaction lectrostatique Le m me protocole de simulation a t mis en ceuvre Voir page 119 Nous constatons que dans cette configuration le sulfurane n a pas du tout le m me comporte ment dans le site actif En particulier nous observons tr s peu d interactions de cet interm diaire potentiel avec les r sidus du site actif Le groupement OH ne forme aucune liaison hydrog ne avec Glu94 Tyr82 et Tyr134 mais essentiellement avec des mol cules d eau du solvant D autre part nous observons une grande mobilit globale de ce sulfurane dans le site actif Ceci peut s expliquer en partie par une moins bonne interaction de type hydrophobe entre le groupement m thyle et les r sidus Phe52 et Trp53 Cette simulation sugg re donc que le sulfurane avec le groupement S Cys en position quatoriale n est pas favoris
267. ment methyle du sulfoxyde est stabilis dans une poche hydrophobe form e par le r sidu Trp65 e un r seau important d interactions lectrostatiques entre Asp107 Arg115 et Cys63 permet de stabiliser Cysc sous une forme thiolate 5 2 M thionine sulfoxyde r ductases 107 Trp65 Asn120 H 0 His103 Glu91 His100 Asp82 AsO CH P b FIG 5 10 Structure tridimensionnelle de la MsrB de N gonorrhoeae a Architecture globale de l enzyme Les structures secondaires ont t color es en violet pour les h lices o en vert pour les h lices 310 en jaune pour les feuillets B et en bleu clair pour les coudes p La cyst ine catalytique Cysc la cyst ine de recyclage Cysg et la mol cule de cacodylate AsO CH complex e dans le site actif ont t repr sent es en b tons b Structure du site actif Ce site actif est compos des r sidus conserv s Cysp63 Trp65 Asp82 Glu91 His100 His103 Asp 107 Arg115 Cysc 117 et Asn120 La mol cule de cacodylate AsO2 CH3 gt complex e a t repr sent e atome d arsenic en vert Sa position mime celle du substrat MetSO Les diff rentes interactions possibles entre r sidus ont t symbolis es en marron 108 5 Rappels bibliographiques et objectifs 5 3 Etudes ant rieures sur l tape r ductase de MsrA Un sch ma g n ral du m canisme catalytique des Msr a d j t pr sent dans la section 5 2 2 page 98 Nous allons nous int resser de
268. ment mieux pr dites contrairement celles des r sidus enfouis qui sont globalement moins bonnes Aucune m thode ne permet n anmoins de pr dire correctement ces valeurs La rapidit et l obtention de r sultats en accord avec les valeurs exp rimentales sont not es comme tant les atouts majeurs de la m thode PROPKA comparative ment aux autres m thodes La m thode PROPKA a t cod e dans un programme FORTRAN Il effectue le calcul partir d un fichier au format PDB de la prot ine avec ou sans la prise en compte du ligand Le programme est librement utilisable via une interface web l adresse http propka ki ku dk Annexe B Manuel utilisateur d ALGOGEN Table des mati res B 1 Lancer une minimisation 246 B 2 Param tres et options 247 B2 1 Codade ani 542 LH ee ERE EER B RGROLOR 5 Rc o eS RR X 247 B 2 2 Reproduction sso o o Ro do m om Roh m s 247 B23 S lection 2 ux ux s US ME oe QUE AUS dado se FA v si des 248 B 2 4 Options de minimisation 248 B 2 5 Options de sortie 252 B 2 6 Options de sauvegarde 252 B 3 Propri t s et m thodes de l algorithme g n tique 253 B 3 1 Propri t s et m thodes de ga 253 B 3 2 Propri t s et m thodes des objets Population 255 B 3 3 Propri t s
269. ment proches des valeurs exp rimentales d viation moyenne inf rieure 1 0 sur un benchmark il a t montr qu elles tendaient sur estimer les interactions charge charge intra prot ine et sous estimer les effets dus aux liaisons hydrog ne et la d solvatation Nous pouvons ajouter aussi que la pr diction peut prendre de quelques minutes plusieurs heures de temps de calcul Une autre m thode souvent utilis e pour la pr diction de pK de petits compos s organiques acido basiques est la m thode de Hammer Taft Elle se base sur une pr diction empirique du d placement de pK vis vis des substituants Cette m thode pr sente l avantage d tre relativement rapide et efficace pour les mol cules ayant des similarit s avec l ensemble de param trisation Tou tefois elle ne peut pas tre appliqu e aux prot ines car le d placement de pK des r sidus n est pas d aux seuls effets des subtituants La m thode que nous avons utilis e pour la d termination de l tat de protonation de l enzyme tudi e est PROPKA Tout comme la m thode de Hammer Taft celle ci se base sur des relations empiriques entre la structure et le d placement de pK Les r sultats obtenus sont qualitativement 240 A M thodologie meilleurs car elle prend en compte les effets qui affectent significativement le d placement de pK des r sidus tels que la d solvatation l interaction charge charge ou les liaisons hydrog ne La
270. mettant de rendre compte de l influence de l environnement enzymatique sur les chemins r actionnels 190 8 R duction du substrat 8 1 M canisme Transfert d un groupement OH 8 1 1 Hypoth se de travail Ce m canisme s inspire des tudes pr c dentes sur la r action de transfert d un groupement OH d un peroxyde vers un thiolate 9 83 a t d crit galement par Balta et a 2 pour la r duction du DMSO par un thiol Notre point de d part ici sera l esp ce sulfurane d crite dans le chapitre pr c dent En effet un transfert du groupement OH partir du cation MetSOH vers Cys ne para t pas possible Ce m canisme illustr dans la figure 8 1 implique un r arrangement g om trique pr a lable de l interm diaire sulfurane pseudorotation dans lequel l atome de soufre de Cys51 passerait en position quatoriale Ensuite la principale coordonn e de r action serait l angle S S O qui aurait une valeur d environ 60 au niveau de l tat de transition OH S S V ICH CySs Met Fic 8 1 Hypoth se de travail envisag e pour la formation de l acide sulf nique partir de l interm diaire sulfurane dans le site actif de l enzyme M canisme Transfert d un groupement OH Le m canisme implique une pseudorotation au niveau de l atome de soufre t travalent de l interm diaire sulfurane pour placer la liaison S S en position quatoriale et un repliement de l angle de liaison S S O jusqu
271. mises en ceuvre dans la partie Il Nous finirons par une description de la m thode PROPKA la quelle nous avons fait appel par exemple pour la d termination du pKa des groupements ionisables des cha nes lat rales de MsrA Nous ne parlerons pas ici des m thodes quantiques autres que les approches semi empiriques mentionn es plus haut Nous avons eu recours des m thodes de type DFT Density Functio nal Theory pour les tudes de r activit Chapitres 7 et 8 Ces m thodes sont maintenant bien connues et leur efficacit n est plus d montrer Elles repr sentent un excellent rapport qualit prix et compte tenu de la taille relativement importante des syst mes que nous avons eu traiter leur choix s est impos Parmi les diff rentes fonctionnelles disponibles dans la th orie DFT nous avons s lectionn la fonctionnelle hybride B3LYP qui est sans aucun doute la plus r pandue actuellement Diff rentes bases d orbitales atomiques ont t utilis es en fonction du probl me tudi En r gle g n rale nous avons utilis la base 6 31G d pour les calculs exploratoires et pour les optimisations de g om trie la base 6 311 G 2df 2p ayant t r serv e pour le calcul des nergies 226 A M thodologie Pour plus de d tails sur l ensemble des m thodes le lecteur peut consulter les ouvrages suivants Jean Louis Rivail El ments de chimie quantique l usage des chimistes CNRS Editions 1999 Christoph
272. mol culaire et les am liorations que nous comptons apporter en rapport avec les limitations des autres programmes Nous terminerons enfin ce chapitre d introduction en donnant les caract ristiques et les sp cificit s de notre approche qui seront d crites plus en d tail Utilit des programmes de docking mol culaire 22 Principe de fonctionnement 22 Motivations pour le d veloppement d un nouveau programme 25 Objectifs cahier des charges du nouveau programme 27 dans les chapitres 2 et 3 22 1 Rappels bibliographiques et objectifs 1 1 Utilit des programmes de docking mol culaire Les interactions prot ine prot ine et prot ine ligand jouent un r le cl dans l organisation des sys t mes biologiques Elles permettent la r gulation de certains processus biologiques 9 7 la trans 39 41 Conna tre la mission des signaux ou encore la catalyse de diverses r actions biochimiques fa on dont les prot ines interagissent avec d autres entit s biochimiques est une tape essentielle pour comprendre les processus biologiques dans lesquels elles sont impliqu es Le d veloppement d approches pr dictives ouvre la voie la conception assist e par ordinateur de syst mes prot i 42 44 niques aux propri t s modifi es et pr sente donc un int r t ind niable pour la recherche et l industrie phamaceutique et m dicale Dans le domaine de la ch
273. mparaison nous avons report les valeurs corres pondantes pour l interm diaire sulfurane 2 dans le mod le quantique de site actif et pour le sulfurane B dans le syst me isol La g om trie est optimis e au niveau B3LYP 6 31G d Les charges sont issues du potentiel lectrostatique 200 8 R duction du substrat 8 2 M canisme ll 1H 1e 8 2 1 Hypoth se de travail Nous allons consid rer maintenant un m canisme d oxydor duction de type 1H 1e dans lequel apr s le transfert de proton permettant l activation du substrat celui ci capture l lectron ex c dentaire de la cyst ine catalytique Selon cette hypoth se illustr e par la figure 8 4 deux esp ces radicalaires sont cr es la suite du transfert d lectron un radical cyst ine et un radical instable voir plus loin de type DMSOH qui conduit spontan ment la dissociation du radical hydroxyle Les deux esp ces radicalaires se combinent ensuite pour former l interm diaire acide sulf nique le substrat m thionine r duit tant ject du site actif de l enzyme durant ce processus Nous d crirons l tat initial sous forme sulfurane liaison covalente S S ou zwitterionique liaison ionique S S car comme il a t discut dans le chapitre pr c dent ces deux structures formelles peuvent tre envisag es dans le processus d activation du substrat 3 Met E Met S S OH SO OS OH CyS5 CyS5 CH Met ES Pd S OH S gg l Y
274. n False return True e La fonction prend en argument un objet Individual e Apr s d codage du chromosome de l individu la fonction renvoie False si la condition de suppression est v rifi e B 4 5 D finition de la fonction de calcul distribu La fonction de calcul distribu ResultsGrabber permet la soumission de calculs sur un cluster de machines ventuellement par l interm diaire d un gestionnaire de queue de calculs Exemple D finition de la fonction grabResults utilis e dans le cadre du docking pour l valuation de l nergie des syst mes prot ine ligand correspondant chaque individu d une population Elle fait appel au programme SGE de gestion de queue de calculs pour la distribution des diff rentes valuations sur un cluster de machines def grabResults compList dirList Creation du systeme Prot Lig pour chaque individu for comp in compList x y z phi theta psi comp Values quat quaternion fromEuler phi theta psi newLigand Ligand copy newLigand rot quat newLigand Vector quaternion Qvector x y z newLigand updateCoords Creation d un repertoire temporaire tmpDir tempfile mkdtemp divcon tmp scrDir dirList append tmpDir comp CompID os chdir tmpDir Ecriture du script de soumission SGE divcon sub open divcon sub sh divcon sub write 4 binjsh Deplace le fichier divcon dans le TMPFS rei B 4 D finition de fonction 259 fromDir
275. n du chromosome des parents La deuxi me strat gie appel e NewUnknown est une am lioration du principe d volution pr c dent Elle consiste s lectionner les individus consid r s bons d une population et s en servir pour cr er une nouvelle population par reproduction On s assure durant cette derni re phase de ne produire que des individus originaux Le n ayant jamais t produits dans les g n rations pr c dentes Le but de cette strat gie est d offrir l valuation une population d individus avec des caract ristiques nouvelles pour converger plus rapidement vers la solution optimale La troisi me strat gie appel e UnknownSurvivor fait intervenir la notion de p r nnit des individus Elle repose sur la strat gie pr c dente sauf que les individus s lectionn s sont plac s dans la nouvelle population Cette popu 50 2 D veloppement d un algorithme g n tique de minimisation lation est compl t e par des individus nouveaux issus de la reproduction des individus s lectionn s Cette strat gie a pour but de conserver les meilleurs individus de g n ration en g n ration Elle pr vient ainsi contre des op rations de s lection et de reproduction n fastes Le conduisant la cr ation d une population d individus moins bons que les parents La derni re strat gie appel e OldSurvivor est une am lioration de la strat gie UnknownSurvivor Elle applique la notion d ge et de vieillissement chaque ind
276. nce et ancrage du substrat la structure cristallographique 1FF3 dans laquelle le r sidu S dim thylars nic cyst ine mime le substrat sulfoxyde S S O 159 1 Enfin la solvatation du DMSO et des r sidus Cys51 et Glu94 a t analys e Le nombre de mol cules d eau autour du substrat est constante durant toute la simulation avec 5 mol cules de solvant proximit distance lt 3 4 Fig 6 7 m Les r sidus Cys51 et Glu94 sont tr s peu solvat s Nous comptons 2 mol cules de solvant pour Cys51 Fig 6 7 n et aucune pour Glu94 Fig 6 7 0 Le site actif de l enzyme est d solvat de mani re importante par la pr sence du substrat comparativement la simulation Free CysH GluH analogue pour l enzyme libre La pr sence d un proton sur Glu94 appara t donc comme un facteur d terminant permettant d ex pliquer l ancrage du substrat sulfoxyde Il permet l tablissement d une liaison hydrog ne forte avec l atome d oxyg ne du DMSO ainsi que l tablissement d un r seau assez important de liaisons hy drog ne avec les r sidus Tyr82 et Tyr134 Au del cette interaction permet d autres points d ancrage Soit par l interm diaire de l interaction lectrostatique entre le soufre de Cys51 charg n gativement et le soufre du DMSO charg positivement soit par l interaction de type hydrophobe d un groupe ment m thyle du DMSO avec Phe52 et Trp53 qui contraint toute rotation du substrat L implication des r si
277. nd J H Adaptation in Natural and Artificial Systems An Introductory Analysis with Applications to Biology Control and Artificial Intelligence University of Michigan Press Ann Arbor 1975 282 97 98 99 100 101 102 108 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 BIBLIOGRAPHIE Goldberg D E Genetic Algorithms in Search Optimization and Machine Learning Kluwer Academic Publishers Boston MA 1989 Barber M N et Ninham B W Random and Restricted Walks Theory and Applications Gordon and Breach New York 1970 Dorsey R E et Mayer W J J Bus Eco Stat 13 1995 Darwin C R On the Origin of Species by Means of Natural Selection John Murray London 1859 Etaner Uyar A S et Harmanci A E Preserving diversity through diploidy and meiosis for improved genetic algorithm performance in dynamic environments In Advances in Information Systems Lec ture Note in Computer Science Vol 2457 Yakhno T Ed Springer New York 2002 van Rossum G et Drake F L Python Reference Manual PythonLabs Virginia USA 2008 Available athttp www python org Hamming R W Bell System Technical Journal 26 147 160 1950 Gray F Pulse code communication U S Patent 2 632 058 1953 Miller B L et Goldberg D E Genetic Algorithms Tournament Selection and the Effects of Noi
278. ne premi re queue de calcul appel e EvaluationRequired et associ es un identifiant num rique L interface entre l algorithme g n tique et le programme externe s effectue par l interm diaire d instances de la classe Computation Elles permettent de stocker les valeurs d cod es du chromosome de chaque individu le r sultat de l valuation et diverses informations concernant le calcul r aliser Une instance de cette classe est cr e pour chacun des calculs mis en attente d ex cution dans la queue de calcul Le processus de production des individus est ce moment suspendu Le en attente que l valuation de tous les individus soit r alis e Le programme externe r cup re toutes les demandes d valuation pr sentes dans la queue de calcul Il traite le calcul selon les donn es et les informations qui sont contenues dans l objet Computation et y place le r sultat tre retourn l algorithme g n tique Une fois toutes les valuations effectu es l algorithme g n tique reprend la main Tous les r sultats des calculs ef fectu s sont plac s dans une deuxi me queue appel e EvaluationProcessed toujours associ s avec l identifiant num rique Finalement les individus de la population recoivent leurs valuations respectives en leur attribuant le r sultat du calcul associ leur identifiant b Calcul distribu Les algorithmes g n tiques sont par nature adapt s l ex cution de calculs distribu
279. nes e gale au nombre de variables a minimiser parameters GeneSize list Valeur par d faut 16 16 Ranges Intervalles de d finition e Liste d finissant les intervalles de d finition de chaque variable cod e par le chromosome d un individu Chaque l ment de la liste est une liste de deux r els correspondant respectivement la borne inf rieure et sup rieure de l intervalle de d finition de chaque variable coder Le nombre d l ments dans la liste impose le nombre de variables optimiser parameters Ranges list Pas de valeur par d faut Param tre obligatoire B 2 2 Reproduction CrossoverPartNumber Nombre de partitions pour le croisement e Entier d finissant le nombre de partitions cr es dans chaque g ne lors du croisement parameters CrossoverPartNumber int Valeur par d faut 1 CrossoverProbability Probabilit de croisement e R el d finissant la probabilit de croisement Cette valeur doit tre comprise entre O et 1 parameters CrossoverProbability float Valeur par d faut 1 CrossoverMaxNumber Nombre maximal de croisements par partition e Entier d finissant le nombre maximal de croisements effectuer sur chaque partition parameters CrossoverMaxNumber int Valeur par d faut 1 MutationPartNumber Nombre de partitions pour la mutation e Entier d finissant le nombre de partitions cr es dans chaque g ne lors de la mutation
280. nn es sont en et kcal mol Tir de Balta et al 2 6 Les sulfuranes 6 sont des interm diaires r actionnels dans de nombreuses r actions d oxy dor duction 249 246 247 Ce sont des compos s comportant un atome de soufre t travalent au centre d une bipyramide base trigonale o les ligands les plus lectron gatifs se situent aux po sitions axiales 41 24 8 250 d termination de leur structure lectronique a donn lieu des tudes th oriques 2 En g n ral l atome de soufre est suppos tre hybrid sp L orbitale p restante et les orbitales des ligands axiaux se combinent pour former une orbitale mol culaire liante occup e une non liante et une anti liante vacante La g om trie et la structure lectronique sont tr s sen sibles l inclusion d orbitales d dans les bases d orbitales atomiques Dans le cas du sulfurane 3 les liaisons axiales s allongent l g rement de 0 15 en l absence d orbitales d Notons que le sul furane 3 pr sente ses deux groupements les plus lectron gatifs SCH3 et OH en position axiale Une structure ayant le groupement SCHs en position quatoriale a t caract ris e comme tant un minimum d nergie 21 2 kcal mol au dessus de 3 En revanche l optimisation d une structure ayant le groupement OH en position quatoriale conduit la dissociation spontan e du syst me L influence du solvant sur la g om trie du sulfurane 3 est remarquable Entre la phase gazeuse
281. ns dans un premier temps des cations sodium pour assurer la neutralit de l ensemble Puis nous ajoutons des mol cules d eau TIP3P 95 cette structure afin de cr er au final une boite de simulation orthorhombique contenant l enzyme entour e par 10 de solvant dans chaque direction La dimension de cette bo te est 80 x 70 x 80 et elle contient environ 35 000 atomes dont environ 10 000 mol cules d eau La quantit de solvant ajout e dans la boite permet au syst me simul d tre proche de la concentration exp rimentale en Mar 0 1 mmol L L optimisation de la position des mol cules de solvant se fait par minimisations successives A chaque fois nous r alisons une minimisation en appliquant les conditions limites p riodiques la boite de simulation coupure des interactions 12 La succession de minimisations a pour but d installer le solvant autour de l enzyme sans endommager sa structure Les atomes lourds ont leurs positions fixes et nous relachons les contraintes petit petit selon l ordre e hydrog nes de l enzyme hydrog nes du solvant e hydrog nes de l enzyme hydrog nes et oxyg nes du solvant e tous les atomes libres mais en mettant une contrainte de 10 kcal mol par rapport la struc ture cristallographique sous la forme d un potentiel harmonique sur les atomes lourds de l enzyme et du substrat 124 6 Reconnaissance et ancrage du substrat d Equilibration thermodynamique Chaque s
282. ns le m canisme de r duction Ici il sera caract ris dans le mi lieu enzymatique par une simulation de dynamique mol culaire Nous discuterons de la stabilisation de cette esp ce par des interactions avec les r sidus du site actif 158 7 Activation du substrat 7 1 R duction des sulfoxydes g n ralit s La r duction de sulfoxydes est un processus important en chimie et un certain nombre de r actions catalytiques ont t d velopp es dans la litt rature 79 La r action d un sulfoxyde avec un thiol en particulier a t tudi e par plusieurs auteurs Dans ce cas et en absence de catalyseurs sp cifiques les travaux th oriques de Balta et a 99 ont montr que le sulfoxyde est d abord activ par protonation sur l atome d oxyg ne Compte tenu des conclusions obtenues dans le chapitre pr c dent on peut ainsi supposer que les principales tapes de la phase r ductase du m canisme enzymatique sont celles sch matis es dans la figure 7 1 La r duction du sulfoxyde de m thionine en m thionine conduit la formation de l interm diaire acide sulf nique A p Dans le chapitre pr c dent nous avons mis en vidence que la d protonation de la cyst ine cata lytique intervient lors de l ancrage du substrat sulfoxyde dans le site actif de l enzyme Le complexe micha lien du substrat sulfoxyde dans le site actif pr sente ainsi la cyst ine catalytique sous une forme thiolate B A partir du complexe mich
283. ns les prot ines La plupart d entre elles sont bas es sur des mod les de continuum lectrostatique qui r solvent num riquement l quation de Poisson Boltzmann lin aris e LPBE La m thode de Hammer Taft est une m thode rapide principalement utilis e pour la pr diction du pK de petits compos s or ganiques acido basiques effet de substituants qui peut donner dans certains cas une bonne estimation de l tat de protonation d un r sidu La m thode PROPKA d velopp e par Jensen et Col HI est une approche relativement r cente qui s appuie sur la structure de la prot ine et sur une param trisation empirique des divers termes qui influencent le d placement de pK liaisons hy drog ne interactions lectrostratiques et d solvatation Les calculs sont fiables comparativement d autres m thodes de plus haut niveau mais sont r alis s beaucoup plus rapidement La m thode PROPKA constitue actuellement une m thode de choix pour analyser l tat de protonation des r sidus d un syst me prot inique Signalons que certains aspects de cette m thode sont en cours de d veloppement dans notre laboratoire en collaboration avec le Pr Jensen Universit d lowa puis Universit de Copenhague 16 Introduction objectifs b Reconnaissance et ancrage du substrat docking La r action enzymatique suppose la reconnaissance sp cifique du substrat par l enzyme Son ancrage dans le site actif correspond la formation
284. nt hydrophobe et plusieurs donneurs accepteurs de liaisons hydrog ne Le site actif de MsrA est sp cifique de la r duction de l isom re S de MetSO Certaines struc tures cristallographiques de MsrA comme celle de la mutation C51S 3BQF permettent d avoir une structure approch e du complexe entre le sulfoxyde et le site actif de l enzyme Ceci nous per met d obtenir des indications vis vis du positionnement du substrat ou au moins vis vis des r sidus impliqu s dans sa reconnaissance 9 Ces hypoth ses de reconnaissances structurales ont t confirm es exp rimentalement par Gand et al 2 2 e le groupement m thyle de MetSO est stabilis au sein d une poche hydrophobe form e par les invariants Phe52 et Trp53 Le noyau indole de ce dernier tablit lui m me une liaison hy drog ne avec le noyau imidazole de His186 et une interaction hydrophobe de type x stacking avec le noyau ph nol de Tyr189 e la cha ne lat rale de Asp129 peut tablir une liaison hydrog ne avec le groupement NH de la cha ne principale du substrat MetSO e Tyr197 peut interagir avec la chaine principale du substrat MetSO via une interaction de type T T entre son noyau aromatique et la liaison peptidique du c t N terminal e les r sidus Tyr82 Glu94 et Tyr134 interagissent fortement via des liaisons hydrog ne avec une mol cule d eau pr sente dans chaque structure L oxyg ne de cette mol cule d eau est bien positionn pour mimer
285. nt Son utilisation dans le cadre des m thodes semi empiriques est cependant tr s prometteuse Les m thodes semi empiriques sont plus rapides que les m thodes ab initio car on y effectue de nom breuses approximations comme le traitement des lectrons de valence uniquement l utilisation d une base minimale d orbitales atomiques et surtout l absence du calcul de certaines int grales approximation ZDO L tape limitante est dans ce cas la diagonalisation de la matrice de Fock au lieu du calcul des int grales bi lectroniques comme pour les m thodes ab initio I convient toutefois de v rifier la qualit de la m thode semi empirique vis vis du syst me trait afin de s assurer de la validit du r sultat Par exemple certaines de ces m thodes ne reproduisent pas correctement les interactions intermol culaires Des modifications de fonctions c ur c ur ont t propos es 74 76 Ces m thodes pour pallier ce d faut et rendre possible l tude de syst mes multimol culaires semi empiriques modifi es ont t appliqu es avec succ s une simulation d eau liquide utilisant la m thode Divide amp Conquer 1 4 Objectifs cahier des charges du nouveau programme 27 Ces avanc es m thodologiques visant d crire au niveau quantique des syst mes de grande taille rendent possible d sormais la d finition d une fonction de score quantique Ceci nous a conduit d velopper un nouveau programme de docking mo
286. nt n gatif 6A Een 60 5 kcal mol PI kcal mol CH3 SH CH3 S AE kcal mol CH3 2S O CH3 2S OH A Een 217 9 43 3 AEven 61 2 103 8 A Ee 217 0 42 8 AEadia _ 135 7 TAB 8 3 Potentiels d ionisation de la cyst ine CH3 SH et de la cyst ine d proton e CH SG let affinit s lectroniques du sulfoxyde proton CH3 2S OH et du sulfoxyde CHs o SO Les valeurs d nergie indiqu es correspondent la variation d nergie lectronique lors de la perte PI ou du gain AE d un lectron sans relaxation A Evert et avec relaxation A Eaqia de g om trie Elles sont obtenues au niveau de th orie B3LYP 6 311 G 2df 2p sur g om tries optimis es B3LYP 6 31 G d L affinit lectronique adiabatique du DMSO n a pas pu tre obtenue l optimisation de g om trie n ayant pas converg Le gain d un lectron par CH3 2S OH est particuli rement exothermique En fait l optimisation de g om trie de l esp ce radicalaire CH3 S OH conduit un allongement de la liaison S O de 1 64 2 35 et donc la formation d un complexe dans lequel on trouve la forme r duite du sulfoxyde i e le thio ther CH3 2S OH gt CH3 2S OH Cette relaxation de g om trie repr sente une diminution de 31 9 kcal mol par rapport a l affinit lectronique verticale Le complexe CH3 2S OH est une esp ce connue du m canisme d oxy dation des sulfures par le radical hydroxyl Plusieurs tudes th ori
287. ntre g om trique du site actif II contient environ 700 atomes dont une petite partie repr sente des mol cules d eau cristallographique Ce syst me est trop important pour pouvoir tre trait par GEOMOP Nous validerons ce docking uniquement par rapport la structure cristallographique Les param tres utilis s pour l algorithme g n tique sont population de 32 individus dont chaque chromosome contient 3 g nes de taille 10 et 3 g nes de taille 8 16 individus s lectionn s par tour nois croisement 100 mutation 20 et pas d inversion Compte tenu de la taille du syst me il n a pas t n cessaire de passer par une tape de recherche grossi re du minimum global Ces pa ram tres ont suffit le localiser Les calculs ont t effectu s en PM3 et PM3 PIF avec croissance 76 4 Validation du programme ALGOGEN DIVCON lin aire Nous appliquons la m thode Divide amp Conquer avec les param tres suivants 1 r sidu acide amin ligand mol cule d eau par c ur et 2 r gions tampons de taille 4 et 2 respective ment Le docking est r alis en plusieurs vagues successives de minimisation de 50 g n rations Nous consid rons qu un syst me prot ine ligand pr sente sa conformation optimale lorsque nous observons 50 g n rations sans changement notable de l nergie d interaction Nous utiliserons par la suite ces m mes param tres pour les tests de docking avec d autres ligands Les structures dock e
288. ocking mol culaire Nous avons choisi d utiliser un algorithme g n tique pour effectuer cette t che Le chapitre suivant donne les raisons qui nous ont amen s faire ce choix et pr sente en d tail son d veloppement D un point de vue technique le cahier des charges du nouveau programme de docking reprend celui des programmes d velopp s dans le cadre du projet SIRE e structure modulaire e programmation de type OpenSource e programme de calcul parall le ou distribu Chapitre 2 D veloppement d un algorithme g n tique de minimisation Sommaire 2 1 M thodes de minimisation et atouts des algorithmes g n tiques 30 2 2 Principe des algorithmes g n tiques 31 2 3 Programmation de l algorithme g n tique 39 2 4 Conclusion s ssa aoi Ea a eee muets komm RR n m onm Bea 53 Ce chapitre pr sente l algorithme g n tique que nous avons d velopp dans le but d crire un programme de docking mol culaire semi empirique croissance lin aire Nous ferons dans un pre mier temps un bref rappel des diff rentes m thodes de minimisation existantes En comparant les avantages et les inconv nients de chacune d entre elles nous expliquerons le choix d un algorithme g n tique Puis apr s une br ve description du vocabulaire propre et des notions importantes inh rantes aux algorithmes g n tiques nous pr senterons le code informatique que nous
289. ofondir l utilisation d un niveau de calcul plus pouss y compris pour l optimisation de la g om trie mol culaire et ii l am lioration du mod le de len zyme D apr s les r sultats pr sent s dans cette th se on peut penser que l environnement pro t inique c est dire l ensemble des r sidus au del du site actif joue un r le important dans le m canisme de r duction du substrat sulfoxyde par MsrA Cet effet joue certainement sur l asynchro nicit des transferts de proton et pourrait donc modifier la nature de l tat de transition Un objectif prioritaire serait donc d tudier le m canisme propos dans ce manuscrit en consid rant l ensemble des atomes de l enzyme ce qui pourrait tre r alis dans une approche hybride de type QM MM Une autre perspective int ressante serait d tudier le m canisme de r duction de MsrB L iden tification des r sidus du site actif de MsrB indique que l quivalent de Glu94 serait His103 en re vanche il n y a pas d quivalent pour Tyr82 et Tyr134 La transposition du m canisme de MsrA MsrB ne peut donc pas se faire directement Bien entendu les autres tapes du m canisme de MsrA devront tre abord es Enfin nous formulons quelques propositions d tudes exp rimentales qui pourraient apporter des informations compl mentaires nos r sultats e mutag n se de Tyr197 effet vis vis du m canisme de d protonation de Cys51 e mutag n se de Tyr82 134 en
290. oir montr l efficacit du programme de docking dans l obtention de la structure du dim re de l eau nous avons voulu le tester dans une application de docking mol culaire d un syst me prot ine ligand Notre choix de syst me d tude s est port sur l urate oxydase UOx qui a fait l objet de plusieurs travaux dans notre laboratoire a Description de l urate oxydase L urate oxydase EC 1 7 3 3 est une enzyme de la classe des oxydor ductases catalysant l oxy dation de l acide urique en 5 hydroxyisourate un compos instable qui se d compose ult rieurement en allanto ne 15 117 comme l illustre la figure 4 3 Cette enzyme est pr sente chez la plupart des organismes vivants l exception notable des humains et des primates sup rieurs Elle fait partie de la voie de d gradation de la purine et pr vient l accumulation d acide urique dans le sang o H20 Op H202 O H20 CO HN 6 r HN NH2 RS a B P pu d 3 Urate Oxydase N N N O N O N O N H H H H H H Acide urique 5 Hydroxyisourate Allanto ne Fic 4 3 D composition de l acide urique en 5 hydroxyisourate puis en allantoine par la catalyse enzyma tique de l urate oxydase 4 2 Docking dans une prot ine 71 L urate oxydase d Aspergillus flavus a t cristallis e en complexe avec diff rents inhibiteurs com 119 122 La forme biologiquement active est un homo dim re ou un homo t tram re Le site p titifs actif est form de plusieurs r sidus
291. omes le constituant Ces atomes interagissent entre eux l aide de potentiels pr d finis simples qui constituent un champ de forces param tr partir des r sultats exp rimentaux et ou des calculs quantiques pouss s La dynamique mol culaire utilise les champs de forces et les principes de la dynamique newtonienne pour pr dire l volution dans le temps du syst me et en d duire ses propri t s thermodynamiques A 2 1 Champs de forces Le r le du champ de forces est de reproduire le mieux possible les interactions intra et intermol culaires r elles du syst me En principe le potentiel d interaction V E d un syst me N particules s crit comme une somme de potentiels n corps n 1 N v r wire Y we ron Y Y Y vrare Go 13 N A 9 i i j gt i i j gt ik gt j gt i o les r correspondent aux coordonn es cart siennes des particules et v rj vo ri rj repr sentent le potentiel intramol culaire 1 corps le potentiel d interaction de paire 2 corps etc Afin de parvenir des temps de calcul raisonnables la plupart des champs de forces consid rent l approximation suivante Il vir Wise Vnon li s V longation Wueden Viorsion Viorsion impropre A 10 V lectrostatique Wan der Waals Le potentiel Vias contient les contributions des liaisons covalentes V longation et des effets d hybri dation dans les d formations angulaires Viexion et di drales Vio
292. omme tant inf rieure ou gale la moiti du plus petit c t de la boite de simulation Ces approximations sont d autant plus valables que la port e des interactions est r duite Ainsi les interactions de van der Waals ne soul vent en g n ral aucune difficult Par contre le traitement des interactions lectrostatiques est plus probl matique A 2 3 Traitement des interactions lectrostatiques longue port e La mani re d approximer les interactions lectrostatiques influe significativement sur le r sultat des simulations notamment pour celles de syst mes chimiques contenant des ions Par exemple il s av re que les art facts li s la troncature simple des interactions lectrostatiques par un cut off peuvent se manifester par des minima ou des maxima prononc s au rayon de coupure r dans les fonctions de distributions radiales a Somme d Ewald La somme d Ewald 98 permet de calculer pr cis ment les interactions lectrostatiques des sys t mes p riodiques Elle consiste valuer les interactions entre une particule et toutes les autres particules de la bo te de simulation ainsi que leurs images dans une matrice infinie de cellules A 2 M canique et dynamique mol culaires 235 p riodiques Le potentiel lectrostatique s crit alors 1 EN og A 19 Ane n ici rj nl VCoulomb o N est le nombre de particules dans la bo te de simulation n Nx Lx nyLy nzL le vecteur r pl
293. on Elle est constitu e de deux queues EvaluationRequired et EvaluationProcessed issues de la librairie Python standard Queue Pour chaque valuation requise un objet Computation contenant toutes les informations Info et donn es Data n cessaires au calcul est cr Cet objet est chang avec le script d interface au programme de calcul pour tre trait L ensemble des param tres et des options n cessaires la classe Ga est stock dans les deux classes Parameters et Options La structure informatique de celles ci tout comme celle de la classe Ga est particuli re il s agit de singletons C est un motif de conception ou design pattern dont le but est de restreindre l instanciation d une classe un seul objet Il est utilis lorsque l on a besoin d exactement un objet pour coordonner des op rations dans un syst me En d autres termes il existe dans ce module un objet parameters instanci de Parameters un objet options ins tanci de Opt ions et un objet ga instanci de Ga tous trois uniques Enfin la fonction minimize de ce module proc de une minimisation selon les param tres et options d finis et retourne la solution obtenue Notre programme tout en respectant les principes fondamentaux des algorithmes g n tiques d crits pr c demment diff re l g rement sur certains points en particulier sur le codage des g nes et les m thodes de s lection et de reproduction Nous pr senton
294. on Le r sultat de la mutation est la formation d un nouveau g ne 2 2 0111001100 2 Par rapport au croisement l op rateur de mutation joue un r le secondaire mais il est tout de m me n cessaire En effet les op rateurs de s lection et de croisement suffisent faire converger la po pulation d individus vers la solution optimale du probl me Mais il se peut qu il y ait au travers de cette population un manque d information g n tique d faut de O ou de 1 certaines positions des g nes Cette diminution de la diversit g n tique peut induire une inefficacit dans la recherche 38 2 D veloppement d un algorithme g n tique de minimisation du minimum L op rateur de mutation est donc pr sent pour pallier cette perte La mutation est une modification al atoire et occasionnelle Le avec une tr s faible probabilit de r alisation d un bit dans un g ne A partir des donn es issues de l tape de s lection disponibles dans le tableau 2 2 appliquons les deux op rateurs de reproduction Nous avons form deux couples d individus au hasard 1 3 et 2 3 et choisi al atoirement un point de croisement pour chaque couple 1 3 en position 2 et 2 3 en position 4 En ce qui concerne la mutation nous consid rons que la probabilit d effectuer cette op ration est tr s faible de l ordre de 1 bit modifi pour 100 py 0 01 Comme il y a 20 bits au total pour les quatre individus nous aurons 20 x 0 01 0 02
295. on J M et Stadtman E R Proc Natl Acad Sci USA 94 9585 9589 1997 Singh V K et Moskovitz J Microbiology 149 2739 2747 2003 Vattanaviboon P Seeanukun C Whangsuk W Utamapongchai S et Mongkolsuk S J Bacteriol 187 5831 5836 2005 Moskovitz J Bar Noy S Williams W M Requena J Berlett B S et Stadtman E R Proc Natl Acad Sci USA 98 12920 12925 2001 Moskovitz J Flescher E Berlett B S Azare J Poston J M et Stadtman E R Proc Natl Acad Sci USA 95 14071 14075 1998 Marchetti M A Pizarro G O Sagher D DeAmicis C Brot N Hejtmancik J F Weissbach H et Kantorow M Invest Ophthalmol Vis Sci 46 2107 2112 2005 Sun H Gao J Ferrington D A Biesiada H Williams T D et Squier T C Biochemistry 38 105 112 1999 Friguet B Bulteau A L Chondrogianni N Conconi M et Petropoulos l Ann N Y Acad Sci 908 143 154 2000 Bakala H Delaval E Hamelin M Bismuth J Borot Laloi C Corman B et Friguet B Eur J Bio chem 270 2295 2302 2003 Petropoulos l Mary J P richon M et Friguet B Biochem J 355 819 825 2001 Picot C R Perichon M Cintrat J C Friguet B et Petropoulos l FEBS Lett 558 74 78 2004 Boschi Muller S Azza S Sanglier Cianferani S Talfournier F van Dorsselear A et Branlant G J Biol Chem 275 35908 35913 2000 Olry A Boschi Muller S et Branlant G Biochemistry 43 1161
296. on de deux m thodes l litisme et les tournois La premi re limine de mani re grossi re les individus les moins int ressants car tant tr s loin de la solution optimale du probl me La deuxi me constitue des petits groupes d individus et s lectionne le meilleur de chaque groupe Nous esp rons convenir de cette mani re ce qui a t nonc pr c demment a S lection par litisme L litisme est une suppression dirig e de certains individus de la population Seuls les individus ayant le meilleur score sont conserv s les autres sont supprim s de la population En effet la proba bilit qu un individu soit s lectionn est d autant plus grande que son score est bon Nous liminons donc de fa on arbitraire tous les individus jug s inaptes engendrer de bonnes solutions Cepen dant l litisme utilis seul n est pas une m thode de s lection satisfaisante S il est trop important nous nous acheminons rapidement vers un eug nisme d favorable l efficacit de l algorithme g n tique Le nombre d individus conserv s est exprim en pourcentage de la population totale le taux d litisme Pour obtenir ces individus il suffit de trier la population dans l ordre croissant des valeurs d valuation et de conserver uniquement la quantit suffisante 2 3 Programmation de l algorithme g n tique 45 b S lection par tournois Cette m thode de s lection est inspir e de celle d velopp e par M
297. on du temps dans la simula tion Free CysH Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 128 6 Reconnaissance et ancrage du substrat Y82HH E940E1 Y134HH E940E1 WW Distance A 0 200 400 600 800 1000 0 2 4 6 8 1 0 Temps ps Distance d Distance Glu94 Oe Tyr82 Hy rouge et Glu94 Oe Tyr134 Hy bleu Y82HH E940E2 Y134HH E94OE2 Distance 4 2 0 T 0 200 400 600 800 1000 0 2 4 6 8 10 Temps ps Distance e Distance Glu94 Og2 Tyr82 Hy rouge et Glu94 Og2 Tyr134 Hq bleu E94CB E94CD E94CG E940E1 Angle di dre 200 400 600 800 1000 180 90 0 90 180 Temps ps Angle di dre f Angle di dre Glu94 Cg Glu94 Cy Glu94 Cg Glu94 O FIG 6 3 suite Variation de la distance Glu94 Oc1 Tyr82 Hhn et Glu94 Oe Tyr134 Hy d de la distance Glu94 Oz2 Tyr82 Hh et Glu94 Oz2 Tyr134 Hp e et de l angle di dre Glu94 Cg Glu94 C Glu94 Cs Glu94 O f en fonction du temps dans la simulation de Free CysH Glu Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 6 3 Enzyme libre 129 6 3 2 Etat de protonation CysH GluH Les r sultats pour cet tat de protonation sont repr sent s dans la figure 6 4 Le proton du r sidu Glu94 est port par l oxyg ne Oe Au cours de la simulation et pendant des courtes dur es l hydro g ne H
298. onine Dans les conditions physiologiques l oxyg ne atmosph rique donne naissance des esp ces oxyg n es activ es EOA la suite d une r duction mono lectronique au niveau des mitochon 186 140 Parmi ces dries 5 lors du m tabolisme respiratoire ou ii de m canismes enzymatiques EOA figurent des radicaux libres comme l anion superoxyde O ou le radical hydroxyle HO et d autres entit s non radicalaires de l oxyg ne comme le peroxyde d hydrog ne H202 ou l oxyg ne singulet O2 Ces esp ces sont particuli rement toxiques pour l int grit cellulaire Elles sont dot es de propri t s oxydantes qui les am nent r agir dans l environnement o elles sont produites D ni 141 Ai 142 p 143 144 avec toute une s rie de substrats biologiques tels que les lipides les prot ines l ADN les polysaccharides etc Au niveau mol culaire les EOA peuvent aussi agir comme messagers secondaires 49 et activer diff rents facteurs ou g nes impliqu s dans le d veloppement de diverses pathologies 49 Le tableau 5 1 regroupe une liste non exhaustive des EOA class es selon leur caract re d oxydant un ou deux lectrons et impliqu es dans l oxydation de substrats biolo giques Oxydants deux lectrons Oxydants un lectron Oxyg ne singulet 1O gt Anion superoxyde Qr Peroxydes H202 ROOH Radicaux peroxyl HO RO Acide peroxynitreux ONOOH Radical nitro O N TAB 5 1 Liste non exhausti
299. ons crire en d monstration que n L i 0 1 111 11 1 999 99 9 N 000 01 0 000 01 000 00 0 0 Donc l ajout du codage maximal 111 11 au code d un g ne A quelconque est quivalent la soustraction du codage 000 01 A 011010 111111 011001 Il La m thode de mutation par addition est aussi utilis e pour une recherche affin e de la solution optimale du probl me une fois le minimum global localis L utilisation de la m thode de mutation par addition ne convient pas l criture du g ne sous la forme d un code Gray Ces deux fonctionnalit s sont exclusives l une de l autre i e elles ne peuvent pas tre utilis es ensemble dans le programme Pour permettre l exploration de l espace de recherche par des points contig s nous avons d velopp un s lecteur de position de mutation sp cifique afin que la mutation par addition s effectue plus fr quemment sur les bits de poids faible Ce s lecteur suit la pond ration des bits du g ne Soit k j EN L p la probabilit de mutation la position k d un g ne de longueur n est choisie si p 2 3 Programmation de l algorithme g n tique 49 d Inversion Linversion est un troisi me op rateur possible de reproduction Il est mentionn par Goldberg mais n a pas t utilis dans son algorithme car selon lui il cr e une rupture dans la recherche de la solution optimale Nous l avons tout de m me implant dans n
300. ons accro t significativement l efficacit de la m thode avec seulement une faible augmentation du temps de calcul Dans un calcul standard la part la plus importante du temps de calcul est la diagonalisation de la matrice de Fock croissant en O N N tant la dimension de la matrice de Fock Dans le formalisme Divide amp Conquer nguy matrices locales de Fock de dimension N NG N sont diagonalis es Pour un syst me bien quilibr Le un syst me dans lequel tous les sous syst mes ont un nombre gal de fonctions de base le co t d un calcul Divide amp Conquer est proportionnel NsubO N i e lin aire au nombre de sous syst mes Le temps de calcul peut tre encore r duit en utilisant un cut off explicite pour les matrices de Fock et densit La m thode Divide amp Conquer coupl e des m thodes semi empiriques a t d velopp e dans le programme DivCon 230 A M thodologie A 2 M canique et dynamique mol culaires Ce chapitre d crit succinctement les principes de la mod lisation de syst mes chimiques en m canique mol culaire puis la technique de simulation de dynamique mol culaire classique que nous avons utilis e pour notre tude Une description plus compl te est donn e par la lecture de livres tels que ceux d Allen et Tildesley 9 de Leach 9 et de Rapaport La m canique mol culaire d crit l tat d un syst me mol culaire uniquement partir de la position des at
301. ont n glig es Selon le degr d utilisation de cette ap proximation on a d velopp plusieurs classes de m thodes semi empiriques cit es ici dans l ordre d croissant du nombre d approximations effectu es e CNDO Complete Neglect of Differential Overlap e INDO 9 Intermediate Neglect of Differential Overlap e NDDO Neglect of Diatomic Differential Overlap Dans ces derni res on consid re que le recouvrement diff rentiel de deux orbitales centr es sur deux atomes diff rents est nul Parmi les m thodes semi empiriques existantes les plus utilis es sont AM19 et PM39 95 toutes les deux de type NDDO Dans ce travail nous avons utilis une variante de la m thode PM3 d velopp e au laboratoire Dans cette version appel e PM3 PIF 779 96 PIF pour Parametrizable Interaction Function on limine un certain nombre d art facts li s l utilisation de fonctions gaussiennes dans le calcul de l nergie d interaction c ur c ur de la m thode standard Ces fonctions sont remplac es par une somme de termes de type ayant le comportement physique correct Ce traitement s applique uniquement aux interactions intermol culaires 228 A M thodologie Divide amp Conquer Malgr toutes ces approximations l tude de syst mes tr s grands peut tre co teuse car l tape limitante est la diagonalisation de la matrice de Fock au cours de la proc dure SCF Ainsi plusieurs algorithmes de calcul ont t imagin
302. otre algorithme afin de pallier une perte de mat riel g n tique qui nous le savons favorise l eug nisme Cette fonction est typiquement d volue l op rateur de mutation Mais du fait que cette derni re est affect e d une probabilit tr s faible il est difficilement concevable qu elle puisse combler des lacunes souvent importantes L utilit de l inversion est donc de fournir tr s occasionnellement un bloc de bits provenant d un autre g ne afin de combler ces lacunes Dans le processus de reproduction l inversion intervient juste avant le croisement Apr s le choix des deux individus reproduire nous effectuons la permutation du codage entier de deux g nes choisis au hasard sur l un des deux individus Cette op ration est affect e d une probabilit d inver sion p tr s faible 2 3 5 Strat gie d volution La nature et l efficacit d un algorithme g n tique dans la recherche de la solution optimale d pend de la strat gie d volution employ e Chaque strat gie d termine la facon dont la nouvelle population est cr e chaque cycle de reproduction Nous avons int gr quatre strat gies d volu tion dans notre algorithme g n tique La premi re strat gie appel e NewOne est celle que nous avons utilis e dans l exemple de mini misation Elle correspond la mani re la plus simple de cr er une nouvelle population Les individus de la nouvelle g n ration sont obtenus par croisement et mutatio
303. ou CysH Glu e la protonation de Glu94 est essentielle l ancrage du substrat e le substrat est stabilis par la formation de liaisons hydrog ne avec Glu94 Tyr82 et Tyr134 au niveau de l oxyg ne du sulfoxyde ii une interaction lectrostatique entre le soufre de Cys51 et le soufre du sulfoxyde et if une interaction de type hydrophobe d un groupement m thyle du substrat avec les r sidus Phe52 et Trp53 e la d protonation de la cyst ine catalytique Cys51 est induite par l ancrage du substrat sul foxyde selon un m canisme pouvant tre assist par Tyr197 La protonation du substrat dans le site actif constitue l tape d activation du m canisme n cessaire la r action d oxydor duction Le m canisme de transfert de proton a t d crit au moyen de calculs quantiques dans un mod le de site actif Nos r sultats ont montr que e l esp ce sulfoxyde proton e ionique est relativement peu envisageable dans le site actif de l enzyme elle ne correspond pas un minimum d nergie e la protonation de l oxyg ne du sulfoxyde conduit la formation spontan e d une liaison entre l atome de soufre de MetSO et celui de Cys51 i e la formation d un interm diaire sulfurane e l interm diaire sulfurane est une esp ce labile tr s proche structurellement de l tat de transi tion de protonation qui en outre pr sente des liaisons S S et S O tr s affaiblies e le site actif de l enzyme semble tre parfa
304. phobes les contacts hydrophiles les contraintes de torsion dues la formation du complexe prot ine ligand etc Le score est finalement obtenu en g n ral en utilisant des m thodes de r gression lin aire multiple Connaissance Ces m thodes sont fond es sur des observations statistiques de contacts intermo l culaires proches dans des bases de donn es 3D Cambridge Structural Database ou Protein Data Bank Il est suppos que les contacts intermol culaires proches entre certains types d atome ou entre certains groupes fonctionnels plus fr quents qu une distribution al atoire conduisent des interactions nerg tiquement favorables permettant alors d estimer une af finit de liaison reli e un potentiel de force moyenne Cette valeur estim e de l affinit de liaison est le score de docking Il existe aussi des fonctions de score hybrides dans lesquelles plusieurs m thodes de diff rents types ont t combin es En plus de la conformation optimale l objectif d un programme de docking mol culaire est id a lement de d terminer l enthalpie libre AG de formation en solution du complexe P L entre la prot ine P et le ligand L selon AG Pso Lsoy P L soiy 1 3 Motivations pour le d veloppement d un nouveau programme 25 Quelle que soit l approche utilis e les fonctions pr c dentes nous donnent le score de docking sous la forme d une valeur souvent abstraite repr sentative de l
305. plexe micha lien pr sent dans le chapitre pr c dent Chapitre 8 R duction du substrat Sommaire 8 1 M canisme I Transfert d un groupement OH 190 8 2 M canismell 1H 1e 200 8 3 M canismelll 2H 42e rns 209 8 4 Devenir du substrat m thioniner duit 216 8 5 Conclusions s nos Sais La ere 3e ORC RES Des cu E IE aie nee 216 Dans ce chapitre nous explorons un certain nombre de m canismes r actionnels permettant d obtenir l interm diaire acide sulf nique et lib rer le substrat sulfoxyde r duit Cette partie du m canisme prend place apr s l tape d activation par protonation de la fonction sulfoxyde tel que nous venons de le voir dans le chapitre pr c dent Nous examinerons trois types de m canismes pos sibles Le premier peut tre repr sent par un transfert d un groupement OH de mani re similaire ce qui a t propos pour la r action d un thiolate avec les peroxydes En second lieu nous tudierons une r action de transfert d lectron qui globalement peut donc tre repr sent e par un m canisme radicalaire un proton et un lectron 1H 1e Enfin un m canisme impliquant un deuxi me proton et un deuxi me lectron 2H 2e sera consid r Les diff rentes tudes pr sent es ont t r alis es l aide des m thodes de la chimie quantique et en utilisant plusieurs mod les per
306. pouvaient tre respect es compte tenu du codage utilis et d autre part viter l utilisation d un code Gray pour le codage des g nes Nous int grons dans le cas pr sent une notion de m trique entre les g nes Prenons l exemple des deux g nes A et B ci dessous Code Variable de codage A 010000 0 5 B 001111 0 46875 Nous constatons que les deux variables de codage sont relativement proches elles sont contig es dans l espace de recherche alors que les deux codes g n tiques sont relativement diff rents Pour passer de B A il existe deux solutions faire cinq mutations successives sur les cinq derniers 48 2 D veloppement d un algorithme g n tique de minimisation bits de B ou i i ajouter au code de B le codage de la diff rence existante entre A et B en termes de variable de codage selon B 001111 0 46875 000001 0 03125 A 010000 0 5 Nous remarquons que cette m thode de mutation permet l exploration de l espace de recherche en passant par des points contig s de celui ci Mais l avantage le plus important de ce nouvel op rateur est de pouvoir respecter la p riodicit de certaines fonctions En fait la p riodicit est induite par le codage en lui m me i e chaque variable de codage est d finie modulo a Cette quantit est la borne sup rieure de C l espace des variables de codage Se 1 Q 5 2 2l 2n i 0 quel que soit n la taille du g ne consid r En effet nous pouv
307. principale ont t supprim s Le calcul a t effectu pour trois configurations diff rentes issues de la simulation de dynamique mol culaire pour le syst me DMSOH Cys Glu et une valeur moyenne a t obtenue Les nergies des diff rents tats lectroniques ont t calcul es au niveau B3LYP 6 31 G d L ner gie pour la transition HOMO LUMO est obtenue par un calcul de type TDDFT premier tat excit du sulfurane La figure 8 5 pr sente les diagrammes nerg tiques des tats lectroniques obtenus pour chacun des cas consid r s Pour comparaison nous incluons les calculs pour un sys t me Cys DMSOH s par ds s dans ce cas l effet d environnement correspond l effet du solvant Eau obtenu par un calcul utilisant le mod le du continuum Les calculs pour une structure sulfurane une distance d quilibre 1a et 1b montrent que l tat couche ouverte est situ un niveau nerg tique tr s au dessus de l tat fondamental L influence de l environnement pris en compte dans le diagramme 1b sulfurane 2 mod le de site actif se manifeste par une tr s l g re diminution de l nergie relative des tats lectroniques Les diagrammes 2a et 2b repr sentent les tats lectroniques d une esp ce sulfurane dissoci e respectivement pour un syst me isol et dans l enzyme Dans le cas du syst me isol l tat singu let couche ferm e Vion forme ionique se situe 6 kcal mol au de
308. q sont les charges des atomes et j s par s d une distance rj et o la constante di lectrique du vide 234 A M thodologie A 2 2 Conditions aux limites p riodiques Dans un syst me r el le nombre d atomes est de l ordre du nombre d Avogadro 1099 La mo d lisation de syst mes aussi grands n est pas envisageable Cependant si on confine le syst me d tude dans une bo te de petite dimension on voit appara tre des effets de surface certaines enti t s se trouvant l interface mati re vide Afin de simuler un milieu fini et viter les effets de surface la solution r side g n ralement en l utilisation de conditions aux limites p riodiques PBC pour Per iodic Boundary Conditions Celles ci consistent r pliquer dans les trois directions de l espace la boite originale l infini afin de paver compl tement l espace Chaque particule de la boite interagit avec les autres particules mais galement avec leurs images qui se situent dans les bo tes r pli qu es Cependant le caract re pseudo infini du syst me ainsi g n r n cessite certaines approxi mations En particulier l approximation dite de l image minimale suppose que chaque particule i de la cellule centrale interagit uniquement avec l image la plus proche de toutes les autres particules j Par ailleurs l introduction d une sph re de troncature cut off permet de supprimer les interactions au del d une distance arbitraire g n ralement d finie c
309. que d autre part La densit de charge dans cette liaison 7 tant port e plus de 90 par l atome d oxyg ne la participation de la liaison x peut tre galement repr sent e comme une paire d lectrons non partag e et port e par l oxyg ne Cette repr senta tion conduit d crire la liaison sulfoxyde comme une simple liaison o polaris e dont la force d pend principalement des interactions lectrostatiques Les param tres g om triques calcul s partir de cette description de la fonction sulfoxyde sont en excellent accord avec les mesures exp rimentales en particulier celles concernant la longueur de la liaison S O son moment dipolaire et sa fr quence de vibration IR c Liaisons hydrog ne et sulfoxyde proton L oxyg ne de la fonction sulfoxyde est un bon accepteur de liaison hydrog ne 95 Cette propri t explique les excellentes capacit s de solvatation du DMSO Elle est par ailleurs indicative du carac t re polaire de la liaison S O de la fonction sulfoxyde La capacit de la fonction sulfoxyde accepter des liaisons hydrog ne peut tre reli e son comportement de base faible La valeur de pK de la fonction sulfoxyde de diff rents m thylsulfoxydes a t d termin e exp rimentalement par titration dans l acide sulfurique ou l acide perchlorique aqueux le degr de protonation du sulfoxyde tant mesur par RMN et ou par spectroscopie UV dans le cas de sulfoxydes aromatiques Les valeurs de pK
310. ques 96 9 ont t men es pour d terminer les structures g om triques et lectroniques de ce complexe La forme d nergie mini male pr sente une liaison hydrog ne tr s forte entre l atome d hydrog ne du radical et l atome de soufre La forme d crite ici est un peu diff rente car elle correspond une liaison S O du type trois lectrons deux centres Pour tenir compte de l environnement mol culaire le potentiel d ionisation de CHa S et l affinit lectronique de CH3 2S OH ont t recalcul s dans un milieu de constante di lectrique en utilisant un mod le de continuum CPCM 21 Nous avons consid r trois solvants de polarit diff rente Cyclohexane 2 02 DMSO e 46 7 et Eau 78 39 8 2 M canisme Il 1 H 1e 203 Les r sultats regroup s dans le tableau 8 4 montrent que le potentiel d ionisation et l affinit lectronique sont logiquement tr s sensibles l environnement L augmentation de la polarit du solvant implique une augmentation de ces nergies en valeur alg brique L affinit lectronique de CH3 2S OH reste n gative quel que soit le solvant consid r Par contre l augmentation du poten tiel d ionisation de CH3 S7 entra ne un bilan nerg tique du transfert d lectron Pl AE tendant tr s rapidement vers des valeurs positives avec l augmentation de la constante di lectrique du solvant PI CHsa S kcal mol Gaz Cyclohexane DMSO Eau Ever
311. r sidus Asp Glu Cys et Tyr la d solvatation augmente pr f rentiellement l nergie de la forme charg e n gativement et ainsi accro t la valeur du pK Pour 242 A M thodologie les amines N terminales les r sidus His Lys et Arg la d solvatation augmente pr f rentiellement l nergie de la forme charg e positivement et donc abaisse la valeur de pK Les effets de d solvatation d pendent du degr d enfouissement du r sidu Pour d terminer celui ci la r gle suivie est de compter le nombre d atomes de la prot ine entourant le r sidu et d tablir alors une relation empirique qui relie le d placement de pK ce degr d enfouissement Deux types de d solvatation sont pris en compte Une premi re r gion autour de 4 5 valeurs Ri cai du tableau A 1 du r sidu est d abord d finie Si aucun atome de la prot ine n est pr sent il s agit d un groupe ionisable majoritairement entour de mol cules de solvant la d solvatation est alors nulle Par le m me raisonnement plus le nombre d atomes dans cette r gion est grand plus la surface accessible au solvant est petite et donc plus l effet de d solvatation se fait ressentir Cette d solvatation qui se base sur le nombre d atomes proches d un r sidu est appel e d solvatation locale La relation empirique qui relie le d placement de pK en d solvatation locale ApK cape et le nombre d atomes NLocai de la r gion est une constante de d placement Cia pour c
312. r t r t 8t t A 25 rj t 8t r t 8t vi A 26 e Leap Frog utilis dans le programme AMBER Vi Vi 2 f t dt A 27 2 2 vj t l v t z T Vi A 28 2 2 2 r t i rj t vj 3 t A 29 e Predictor Corrector ri 5 TTC A 30 t t vi t t vi f N A 31 t i t 6t t 8t rj D S aat n A 32 b Ensembles thermodynamiques Les trajectoires de dynamique mol culaire sont g n ralement r alis es dans l un des ensembles thermodynamiques suivants e microcanonique NVE nombre de particules volume et nergie du syst me conserv s e canonique NVT nombre de particules volume et temp rature conserv s e isobare isotherme NPT nombre de particules pression et temp rature conserv s Pour reproduire le plus exactement possible les conditions exp rimentales nous avons r alis des trajectoires de dynamique mol culaire dans l ensemble NPT La temp rature et la pression instanta n es ont pour expressions T EN sys mini A 33 th N TU 1l ef sm A 24 t vo 70270 2n i t A 34 o N est le nombre d atomes 3N n le nombre de degr s de libert du syst me kg la constante de Boltzmann V t le volume instantan de la bo te de simulation et v t la vitesse de l atome i 238 A M thodologie de masse mj l instant t Pour contraindre la temp rature et la pression rester constantes il suffit d ag
313. rable d un syst me mol culaire Ont t valid s l algorithme g n tique en tant qu algorithme de minimisation et i l ap proche semi empirique croissance lin aire pour l valuation des structures e la conception du programme permet une utilisation dans un cadre d architecture de calcul distribu parall le e la description quantique du syst me mol culaire permet de prendre en compte les effets lec troniques absents dans les autres m thodes de docking L ensemble des travaux de d veloppement et de validation a t publi sous la r f rence Eddy Thiriot and G rald Monard Combining a genetic algorithm with a linear scaling semiempirical method for protein ligand docking J Mol Struct THEOCHEM 898 31 41 2009 220 Conclusion g n rale M canisme catalytique des m thionine sulfoxyde r ductases de classe A L tape r ductase du m canisme catalytique des m thionine sulfoxyde r ductases de classe A a t caract ris e depuis l ancrage du substrat dans le site actif jusqu au m canisme de r duction par une approche th orique multi outils La reconnaissance et l ancrage du substrat sulfoxyde DMSO ont t tudi s par des simula tions de dynamique mol culaire en abordant en d tail la probl matique de l tat de protonation des r sidus Cys51 et Glu94 du site actif Nos r sultats indiquent que e l tat de protonation de l enzyme libre correspond vraisemblablement CysH GluH
314. rae Les s quences sont regroup es par sous classes La premi re ligne indique la num rotation de s quence bas e sur E coli Les cyst ines impliqu es dans le m canisme catalytique sont surlign es en bleu les autres en vert et les r sidus du site active en rouge Tir de Kauffmann et al 55 MsrB Cette sous classe est caract ris e par la pr sence de deux motifs CxxC additionels Ces quatres r sidus conserv s aux positions 45 48 et 94 97 ont t mis en vidence dans la fixation d un cation m tallique Zn n cessaire la structuration de l enzyme 5 Ce centre m tallique n est pas impliqu dans le m canisme de r duction Les SelX SelR et les MsrB d E coli font partie de cette sous classe 102 5 Rappels bibliographiques et objectifs MsrBy Cette sous classe regroupe toutes les MsrB non m talliques Elles repr sentent pr s de 6096 des MsrB connues Les enzymes exprim es par les bact ries de type Neisseria sont class es dans ce groupe En plus de Cys la plupart des enzymes poss dent une autre cyst ine conserv e en position 63 et consid r e comme tant Cysg Au cours de la r g n ration de Msrox elle forme un pont disulfure avec Cysc qui est par la suite r duit par la Trx 5 Cependant certaines organismes comme Pseudomonas aeruginosa ou Caulobacter crescentus ont une MsrB ne pr sentant pas cette Cysp en position 63 Si ces enzymes s av raient tre actives ce sont d autres cyst ines non con
315. re cas l valuation quantique repr sente presque toute la dur e du processus de docking il est important d en tenir compte au niveau des pa ram tres de l algorithme g n tique En effet il est d montr qu une population de grande taille tend 84 4 Validation du programme ALGOGEN DIVCON faire converger le docking rapidement i e nombre de g n rations r duit vers la structure optimale mais le nombre d valuations est important chaque g n ration en contre partie Inversement une population de taille minimale demande plus de g n rations pour atteindre cette structure opti male Il est donc n cessaire de trouver un jeu de param tres de l algorithme g n tique donnant une valeur optimale du rapport entre la taille de la population et le nombre total d valuations Le docking r alis par le programme ALGOGEN DIVCON s effectue en phase gazeuse Ceci n est pas repr sentatif du processus r el de docking car le solvant peut y jouer un r le important L ajout de termes de solvatation 9 131 dans l nergie calcul e au niveau semi empirique peut tre un moyen de prendre en compte ce point Le relaxation de g om trie de la prot ine et du ligand n est pas prise en compte dans notre pro gramme durant le processus de docking Cette limitation est partag e par tous les programmes de docking rigide Dans nos exemples la flexibilit du ligand n est pas n cessaire car la 8 azaxanthine l acide oxonique et l acide uriq
316. re mesure un taux d appariement correct des descripteurs entre la prot ine et le ligand pour chaque conformation valuer Plus ce taux est grand plus le score de docking est lev et plus la conformation du syst me prot ine ligand est optimale Ces m thodes sont typiquement rapides et robustes Elles sont choisies pr f rentiel lement par exemple dans le cas d un scan de plusieurs milliers de ligands pharmacophores Ces m thodes ont le d faut de ne pas pouvoir mod liser exactement les variations dynamiques de confi gurations prot ine ligand malgr de r cents d veloppements en vue de rendre le ligand flexible 9 60 b Repr sentation atomique La seconde approche repose quant elle sur une simulation du processus de docking avec une description atomique du syst me prot ine ligand La prot ine et le ligand sont au d but loi gn s une certaine distance et le ligand doit au fil de la simulation trouver sa position optimale dans le site actif de la prot ine apr s un certain nombre de d placements dans l espace configura tionnel Ces d placements correspondent aux translations et aux rotations du ligand auxquelles on ajoute les changements de g om trie interne du ligand et de la prot ine principalement des angles de torsion si on consid re un docking flexible Le traitement explicite de la flexibilit est un avantage ind niable de cette approche par rapport la pr c dente Cette approche s apparen
317. reconnaissance Cepen dant une d protonation de Cys51 ventuellement via Tyr197 vers le solvant assure une stabilit sup rieure du substrat dans le site actif en augmentant l interaction entre le soufre de Cys51 et le moment dipolaire de la liaison S O de la fonction sulfoxyde Chapitre 7 Activation du substrat Sommaire 7 1 R duction des sulfoxydes g n ralit s 158 7 2 M canisme de transfert de proton 159 7 3 Dynamique mol culaire du substrat activ 173 7 4 Conclusions 24 54x wk mmo ce use om ws WR OO Ge ee 8 188 Comme nous venons de le voir lors de l insertion du substrat dans le site actif de l enzyme la cyst ine catalytique est activ e par d protonation Nous traiterons dans ce chapitre de l tape sui vante qui consiste en une protonation du substrat sulfoxyde permettant de l activer Nous tudierons par quel moyen cette protonation peut s effectuer au sein de l enzyme Une tude du m canisme de transfert de proton utilisant les m thodes de la chimie quantique sera r alis e afin d valuer l ner g tique li e ce processus Elle sera men e sur un mod le du site actif afin de prendre en compte l effet de l environnement enzymatique Nous verrons que la protonation du substrat conduit la for mation d une esp ce de type sulfurane Ce compos a d j t mentionn pr c demment comme tant un interm diaire possible da
318. rement pour les m thodes directes elles requi rent l existence d un gradient dont le calcul n est pas toujours possible En effet les fonctions minimiser peuvent contenir des discontinuit s et ou tre tr s largement multimodales b M thodes num ratives Les m thodes num ratives comme BTD Backtracking with Tree Decomposition ont t d velopp es pour s affranchir du calcul contraignant d un gradient et esp rer obtenir directement le minimum global L espace de recherche est discr tis en un nombre fini de points dont la valeur est calcul e Le minimum global est obtenu en prenant le point de valeur minimale Ici encore nous ne pouvons retenir ce choix de minimiseur en vue du programme de docking cause de son manque d efficacit En g n ral les espaces de recherche sont souvent tr s vastes et il faut valuer un nombre consid rable de points pour obtenir un r sultat acceptable 2 2 Principe des algorithmes g n tiques 31 c M thodes al atoires Les m thodes al atoires sont devenues de plus en plus populaires l o les deux pr c dentes m thodes montraient un manque de robustesse Parmi ces m thodes nous pouvons citer le recuit 494 95 simul 96 97 et les algorithmes g n tiques entre autres Dans cette cat gorie on trouve aussi les m thodes de recherche purement al atoires du type random walk mais celles ci ne sont pas plus efficaces que les m thodes num ratives Dans
319. ring gt gt lt UserType gt Index Numero de la g n ration courante e La propri t Index retourne le numero de la g n ration en cours d existence ga Index gt int CurrentEvaluationNumber Evaluations courantes e La propri t CurrentEvaluationNumber retourne le nombre d valuations effectu es pour obtenir la population courante ga CurrentEvaluationNumber gt int TotalEvaluationNumber Evaluations totales e La propri t TotalEvaluationNumber retourne le nombre d valuations effectu es de puis la premi re g n ration ga TotalEvaluationNumber int BestIndividual Meilleur individu e La propri t BestIndividual retourne un individu de type Individual ayantla meilleure valuation de la g n ration courante ga BestIndividual Individual B 3 Propri t s et m thodes de l algorithme g n tique 255 B 3 2 Propri t s et m thodes des objets lt Population gt Evaluations Evaluations de la population e La propri t Evaluations retourne une liste contenant les valuations des individus de la population lt Populat on Evaluations lt list gt RandomIndividual Individu al atoire e La propri t RandomIndividual retourne un individu de type lt Individual gt choisit al a toirement dans la population lt Population gt RandomIndividual gt Individual sort Tride la population e La m thode sort trie les individus de la population dans l ordre croissant
320. rsion t Viorsion impropre Les termes du potentiel Vnon i s comprennent les interactions de van der Waals Wan der waals et lectrosta tiques V lectrostatique entre atomes non li s en g n ral limit s aux atomes s par s par au moins trois liaisons chimiques Ces diff rents termes sont repr sent s de mani re sch matique dans la figure A 1 A 2 M canique et dynamique mol culaires 231 Termes li s Termes non li s Elongation Van der Waals 9 G Te a _ Flexion v T Electrostatique Torsion 2 bes Za d X D T Torsion impropre FIG A 1 Repr sentation sch matique des diff rents termes intervenant dans un champ de forces i termes entre atomes li s longation flexion torsion et torsion impropre et ii termes entre atomes non li s interaction de van der Waals et interaction lectrostatique 232 A M thodologie a Termes li s Elongation Le potentiel d longation V iongation des liaisons covalentes est g n ralement repr sent par un simple potentiel harmonique 2 V longation elongation r feq A 11 o r est la distance entre les deux atomes req la distance d quilibre de la liaison et k longation la constante de force ou de rappel du potentiel harmonique Dans le but de se rapprocher le plus possible du comportement de la liaison chimique i e mo d lisation de la dissociation mol culaire anharmonicit du potentiel le potentiel d long
321. rt des param tres et options de l algorithme g n tique Importation des modules from genetic import parameters options ga import math Definition de la fonction d evaluation B 5 Exemple de script de minimisation 261 def schwefel x y z f lambda x x math sin math sqrt abs x returned M ap GE G7 ap se Cz Definition de la fonction d arret qui renvoie toujours False stop lambda False Definition de la fonction de contrele qui ne fait rien def control pass Definition de la fonction d affichage def schPrint sering UM string s 15 8f n ga BestIndividual Chromosome decode ga BestIndividual Evaluation return string Codage des genes sur 8 bits chacun defini sur 0 500 parameters GeneSize 8 8 8 parameters Randess NT ES PT life nk TM oO S TOTO il I 1 croisement avec une probabilite de 90 sur un chromosome divise en 3 partitions parameters CrossoverPartNumber 3 parameters CrossoverProbability 9 parameters CrossoverMaxNumber 1 4 mutations avec une probabilite de 2 sur un chromosome divise en 5 partitions parameters MutationPartNumber 5 parameters MutationProbability 02 parameters MutationMaxNumber 4 Probabilite d inversion de 1 parameters InversionProbability 01 Population de 32 individus parameters PopulationSize 32 Apr s avoir conserve 80 de la population on organise 8 tournois parameters ElitismRatio 8 paramet
322. ruit Les param tres du champ de forces corres pondant sont report s dans les tableaux 7 6 et 7 7 La nomenclature des atomes est donn e dans la figure 7 9 La structure de base de ce r sidu est celle d un r sidu cyst ine Lors du calcul des charges RESP nous avons contraint les charges des atomes de la cha ne principale N H C O Ca et Hal aux valeurs correspondantes un r sidu CYS amber94 Les charges des deux Hg des deux C et des six He sont contraintes tre identiques Les charges obtenues pour les atomes Sy Ss et Oe valent respectivement 0 75 0 75 et 0 74 u a Elles sont relativement importantes mais 1236 l ordre de grandeur est similaire celui des charges rapport es dans les travaux de Balta et a et dans notre tude pr c dente Fic 7 9 Nomenclature des atomes du r sidu sulfurane Sulf Les carbones sont color s en cyan les hy drog nes en blanc les azotes en bleu les oxyg nes en rouge les soufres en jaune et la paire libre en vert 7 3 Dynamique mol culaire du substrat activ 181 Atome H Ca Ha Cg Hg Type H CT H1 CT H1 Masse a m u 1 0 12 0 1 0 12 0 1 0 0 2719 0 0213 0 1124 0 0336 0 1041 0 6000 1 9080 1 8870 1 9080 1 8870 0 0157 0 1094 0 0157 0 1094 0 0157 Charge a u Gus A kcal mol Type s6 CT H1 oh ho Masse a m u 32 1 12 0 1 0 16 0 1 0 Charge a u Ou A kcal mol 0 7470 0 2128 0 1265 0 7432 0 4504 2 0000 1 9080 1 3870 1 7210 0
323. s afin d obtenir une lin arit entre le temps de calcul et la taille du syst me trait Nous pr sentons ici la m thode Divide amp Conquer qui permet de s approcher de cette croissance lin aire La m thode Divide amp Conquer fut d abord d velopp e dans le cadre de la DFT 9 39 puis reformu l e selon l approche semi empirique 5 dont nous allons utiliser le formalisme par la suite Le pos tulat de base est la localit de la densit lectronique dans le cas des syst mes non m talliques A partir de ce constat le syst me mol culaire d int r t peut tre divis en o sous syst mes R qui se recouvrent et dont on r sout pour chacun d entre eux l quation de Roothaan Hall localis e suivante EICH c E A 1 Dans cette quation C est la matrice locale des coefficients F la matrice locale de Fock et E la matrice diagonale locale des nergies ef des orbitales du sous syst me a La matrice densit locale est construite gr ce aux coefficients de la matrice C selon N OO 0 Puy Yn Cui Cvi A 2 i o N est le nombre d orbitales dans le sous syst mes a nf est le nombre d occupation d pendant de l nergie de Fermi gF et de l nergie de l orbitale mol culaire selon e 2 MEZ Dans cette expression kg est la constante de Boltzmann et T repr sente une temp rature absolue n A 3 qui n a pas de signification physique r elle et vaut habituellement 1000 K L nergie de F
324. s constatons que les deux structures do ck es sont globablement similaires la structure cristallographique Les RMS de d viation sont de 0 51 en PM3 et de 0 71 en PM3 PIF Ces valeurs sont relativement grandes par rapport celles que nous avions obtenues pr c demment avec le ligand AZA Ceci s explique en partie par le fait que nous avons effectu un docking rigide du ligand OXC dans le site actif de l enzyme 21BA qui contenait l origine le ligand AZA La structure 2IBA pr sente un site actif adapt au complexe avec AZA Sachant que la structure des ligands AZA et OXC est diff rente la structure dock e du ligand OXC dans le site actif 2IBA est diff rente de celle de ce ligand dans le site actif 1 RAU La figure 4 7 montre cette diff rence entre la structure cristallographique 1 R4U et la structure dock e en PM3 PIF dans 21BA 4 2 Docking dans une prot ine 79 ALGOGEN DIVCON PDB Distances PM3 PIF PM3 1R4U Oxc Ns Gin228 O 2 99 Oxc O GIn228 Neo 2 92 Oxc O Val227 N 2 93 Oxc O Arg176 Ny2 2 84 Oxc N Arg176 Ny 3 18 Oxc Ns Thr57 N 3 18 Oxc Ns Thr57 O 3 48 Oxc Og Wat2 O 2 41 AE kcal mol 110 4 55 1 TAB 4 4 Energies d interaction AE et distances des interactions du complexe entre l urate oxydase et l acide oxonique optimis par ALGOGEN DIVCON avec les m thodes semi empiriques PM3 et PM3 PIF Les distances de la structure cristallographique 1R4U sont report es dans ce t
325. s en PM3 et PM3 PIF sont obtenues apr s 238 et 188 g n rations cor respondant 3744 et 3024 valuations respectivement Les distances et les nergies d interaction sont report es dans le tableau 4 3 dans la colonne Grand syst me Nous constatons ici aussi que les structures dock es en PM3 et PM3 PIF sont tr s similaires la structure cristallographique Les RMS de d viation du ligand AZA par rapport la cristallographie sont de 0 14 en PM3 et de 0 23 en PM3 PIF La figure 4 6 pr sente une comparaison de la structure cristallographique avec la structure dock e en PM3 PIF Nous n observons que tr s peu de diff rences FiG 4 6 Structure du complexe de la 8 azaxanthine dans le site actif de l urate oxydase a Structure cristal lographique 2IBA et b Structure dock e par ALGOGEN DIVCON en PM3 PIF pour le grand syst me partir de la structure 2IBA 4 2 Docking dans une prot ine 77 c Discussion Le tableau 4 3 regroupe toutes les principales distances d interaction entre la 8 azaxanthine et l urate oxydase soit pour la structure cristallographique 2IBA soit pour nos r sultats de docking mol culaire en PM3 et PM3 PIF et ce pour le petit et le grand syst me Les structures dock es sont toutes globalement tr s similaires compar es la structure cristallographique de r f rence Les interactions entre le ligand et les r sidus du site actif sont de deux types liaisons hydrog ne et interaction le
326. s entre les r sidus du site actif sont repr sent s dans le sch ma ci dessous Tyr13a el O Tyre2 b d ES 4 Hoo 7 o 0 S HO a Glug e j H d 6 3 Enzyme libre 133 8 6 4 A 2 0 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance A Distance A a Distance Cys51 Sy Glu94 He Distance A 0 200 400 600 800 10000 2 4 6 8 Temps ps Distance b Distance Cys51 Sy Tyr197 Hn 180 90 CBIHA C51CA C51CB C51SG g E 2 0 9 90 180 0 200 400 600 800 1000 180 90 0 90 180 Temps ps Angle di dre c Angle di dre Cys51 Ha Cys51 Ca Cys51 Cg Cys51 Sy FIG 6 5 Variation de la distance Cys51 Sy Glu94 He2 a de la distance Cys51 Sy Tyr197 H b et de l angle di dre Cys51 Hg Cys51 Ca Cys51 Cg Cys51 S c en fonction du temps dans la simulation de Free Cys GluH Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 134 6 Reconnaissance et ancrage du substrat 180 T E94CB E94CG E94CD E940E1 Angle di dre 200 400 600 800 1000 180 90 0 90 180 Temps ps Angle di dre d Angle di dre Glu94 Cg Glu94 Cy Glu94 Cg Glu94 Oe r Y82HH E940E1 Distance gt ep N 0 ri rn 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance e Distance Tyr82 Hy Glu94 O 8 L Y184HH E94OE1
327. s maintenant les principaux points de divergence par rapport l algorithme initial et quelques fonctionnalit s diverses que nous avons ajout es Les diff rents mots cl s et quelques exemples d utilisation de ce programme sont pr sen t s dans le manuel utilisateur en annexe B de ce manuscrit 42 2 D veloppement d un algorithme g n tique de minimisation 2 3 2 Codage des g nes Le codage que nous avons vu pr c demment tait bien adapt l exemple de minimisation mais il ne pouvait pas convenir notre programme Le d faut est qu il est directement reli au probl me de minimisation les variables cod es par les g nes taient les variables du probl me De ce fait il faudrait changer le syst me de codage pour chaque minimisation r aliser Nous d crivons dans la suite le syst me de codage utilis par notre programme et les am liorations qui ont t apport es a Syst me de codage Avant toute chose nous souhaitions utiliser un alphabet r duit un nombre minimum d lements pour en faciliter la manipulation Notre choix s est port sur l alohabet binaire 0 1 Partant de cela il fallait d finir une m thode de codage qui puisse convenir la repr sentation de valeurs r elles quelconques et faire en sorte que la proc dure de d codage soit rapide et fiable Notre choix s est port sur un codage r alisant une homoth tie entre un espace r el R i e celui des variables minimiser et un espace d
328. s simulations ph nom ne de d solvatation qui a pour cons quence d augmenter le pK de Glu94 La stabilit du complexe est principalement due la liaison hydrog ne entre GluH et l oxyg ne du sulfoxyde Des liaisons hydrog ne avec Tyr82 et Tyr134 l interaction lectrostatique entre l atome de soufre de Cys51 et l atome de soufre du DMSO ainsi que l interaction hydrophobe d un groupement m thyle avec la poche hydrophobe form e par Phe52 et Trp53 contribuent sta biliser le syst me La n cessit d un proton sur Glu94 pour la reconnaissance est compatible avec une exp rience de mutag n se dirig e montrant l ancrage du substrat dans le site actif de MsrA lorsque Glu94 est mut en glutamine L utilisation du DMSO comme substrat de l enzyme dans nos simulations ne nous a pas permis de v rifier les autres sites de reconnaissance des peptides sulfoxydes de m thionine d termin s exp rimentalement par Gand et a au niveau de la cha ne lat rale de ceux ci Ainsi l tude des diff rentes tats de protonation possibles pour le couple Cys51 Glu94 la fois dans l enzyme libre et le complexe micha lien avec le DMSO montre que l tat libre Cys51 est proton CysH alors que Glu94 peut l tre ou non GluH ou Glu Par contre dans le complexe enzyme substrat Glu94 doit obligatoirement tre proton pour assurer l ancrage du substrat alors que la d protonation de Cys51 n est pas n cessaire lors de cette tape de
329. s51 Sy DMSO S Cys51 Sy Tyr197 Hy et Trp53 Ne1 DMSO C dans DMSO Cys GluH eas anea a e a he llle 152 suite Angles di dres Cys51 Cg Cys51 Sy DMSO S DMSO Cg Cys51 Ha Cys51 Ca Cys51 Cg Cys51 Sy et nombre de mol cules d eau dans la solvatation de Cys51 dans DMSO Cys GluH a i eie aa ad lle 153 suite Distances Tyr82 H Glu94 Os1 Tyr134 Hy Glu94 Og1 Tyr82 Hy Glu94 Oe2 Tyr134 Hy Glu94 Oge et angle Cys51 S DMSO S DMSO O dans DMSO Cys GluH 154 M canisme suppos de l tape r ductase Activation 158 Structure du mod le quantique de site actif 161 Complexe micha lien 1 Structure et trac des orbitales HOMO et LUMO 165 Structure de l tat de transition TS4 et de l interm diaire sulfurane 2 168 Trac des orbitales HOMO et LUMO pour l interm diaire sulfurane2 170 Trac de l isosurface de densit lectronique de 2 171 Nomenclature des atomes du substrat DMSO proton 173 Distances Glu94 Og DMSOH H Cys51 S DMSOH S et Cys51 S Tyr197 Hy dans DMSOH Cys Glu 2 ls 176 suite Distances Tyr82 Hy Glu94 Oc Tyr134 Hy Glu94 Oe1 Tyr82 Hy Glu94 O Tyr134 Hy Glu94 O ge et angle di dre Glu94 Cg Glu94 C Glu94 Cs Glu94 O dans DMSOH esc GUS a RE Gk te et EEN 177 suite
330. serv es qui pourraient jouer le r le de Cysg Elles sont situ es dans la cha ne N terminale aux alentours des positions 20 30 En cas d absence de cyst ine autre que Cys au sein de l enzyme comme pour Vibrio cholerae le processus de r g n ration doit tre r alis selon un m canisme encore inconnu ce jour 5 2 4 Structure tridimensionnelle des m thionine sulfoxyde r ductases Bien que partageant un m canisme catalytique similaire nous venons de voir que les MsrA et les MsrB ne pr sentent aucune identit ni aucune homologie de structure primaire Leurs structures tridimensionnelles se sont galement r v l es tre diff rentes A ce jour mars 2009 les structures de MsrA de quatres organismes distincts et les structures de MsrB de deux organismes distincts ont t r solues par cristallographie de rayons X et d pos es dans la Protein Data Bank PDB Des informations les concernant sont regroup es dans le tableau 5 2 D autres structures ont t d pos es la PDB mais ne donnent que des structures partielles de Msr o Organisme Code PDB R f rence R solution A MsrA Escherichia coli 1FF3 T te Favier et al 200077 1 9 Bos taurus 1FVA Lowther et al 2000227 1 7 1FVG Lowther et al 2000727 1 6 Mycobacterium tuberculosis 1NWA Taylor et al 2003228 1 5 Neisseria meningitidis 3BQE Ranaivoson et al 2008 2 0 3BQF Ranaivoson et al 2008 2 0 3BQG Ranaivoson et al 2008 2 0 3BQH Ranaivoson et
331. sid rablement 1 4 kcal mol Les calculs quantiques pour l ensemble du processus 1 2 4 et l estimation de l effet d environnement par un mod le de continuum sugg rent la possibilit d un m canisme concert 1 4 dans lequel l tat de transition aurait une structure proche de l esp ce sulfurane 2 Conclusion g n rale Cette th se avait comme objectif le d veloppement d un code de docking mol culaire utilisant une m thode quantique pour le calcul de l nergie et une tude th orique du m canisme catalytique des enzymes MsrA qui font l objet de recherches exp rimentales dans l quipe AREMS au sein de notre universit Les principales conclusions d riv es de notre travail sont pr sent es ci dessous Logiciel de docking mol culaire semi empirique croissance lin aire Le logiciel de docking mol culaire ALGOGEN DIVCON a t d velopp dans le but de d crire un syst me prot ine ligand de grande taille selon une approche de m canique quantique Il se pr sente sous la forme d une interface entre un algorithme g n tique ALGOGEN pour la partie minimisation enti rement d velopp par nos soins et le programme DIVCON qui effectue l valuation nerg tique du syst me mol culaire par une m thode semi empirique coupl e l algorithme de croissance li n aire Divide amp Conquer Les tests que nous avons effectu s ont montr que e le programme est capable de d terminer la conformation favo
332. sid rons plus la mutation comme une permutation de bit 0 1 mais comme une op ration d arithm tique binaire appliqu e au code binaire du g ne Les conditions de r alisation de l op ration restent les m mes dans le sens o il est toujours n cessaire de d terminer al atoirement un point de mutation k et une probabilit de r alisation Cependant il ne faut pas introduire de partionnement du g ne pour que cette op ration conserve un sens La mutation par soustraction est le compl ment de cette m thode Elle a aussi t aussi d velop p e dans le programme mais elle ne sera pas d crite ici par souci de simplicit Voyons au travers d un exemple l effet de cette mutation sur un g ne A de longueur L 9 La valeur de k 5 obtenue al atoirement entra ne la cr ation d un g ne Ax de m me longueur que A o la position k est 1 les autres positions tant 0 Le g ne mut A est obtenu en faisant l addition binaire des deux codes g n tiques selon A 01101000 A 00001000 A 01110000 Nous constatons sur cet exemple que cette technique de mutation peut s av rer avantageuse Une seule mutation a permis de modifier localement deux bits du code g n tique l o la m thode par permutation aurait demand deux mutations successives Le d veloppement de ce nouvel op rateur de mutation visait d une part introduire les propri tes de p riodicit de certaines fonctions math matiques qui ne
333. simple entre le d placement du pK d un groupe carboxyle et les liaisons hydrog ne peut tre exprim e par l quation suivante en consid rant un d placement de pK constant Cug pour chaque liaison hydrog ne ApKy g Nug x Cup A 42 o Nps est le nombre de liaisons hydrog ne et ApKyp est le d placement de pK total d aux liaisons hydrog ne Cependant l quation A 42 ne peut pas toujours tre appliqu e car la force des liaisons hydrog ne et ainsi son effet sur le d placement du pK d pendent de la distance et de A 3 PROPKA Pr diction des valeurs de pK des r sidus d une prot ine 241 l angle L introduction de liaisons hydrog ne caract re faible peut entra ner une sur estimation du d placement et vice versa De part les diff rentes interactions de liaisons hydrog ne qui peuvent exister il est n cessaire d avoir diff rentes valeurs de CHg Pour prendre en compte les corrections de distance et d angle pour les effets de liaison hydrog ne une fonction de distance peut tre utilis e pour les d placements dus aux liaisons hydrog ne de cha nes lat rales SDC HB Cua si D lt d ApKspc ug 4 Che X on si di lt d A 43 0 si d xD et une fonction de distance angle pour ceux dus aux liaisons hydrog ne du squelette de la prot ine BKB HB cos0 x Cup si D lt a Oz 90 ApKekgug C0S0 x Cup X J 3 si di lt d2 0 gt 90 A 44 1 de 0 si d lt D 6 lt 90
334. son avec le logiciel SGE Elle est g r e par la fonction grabResults du module docking py Lors de chaque phase d valuation de l algorithme g n tique les diff rents calculs sont soumis un cluster de machines gr ce un script SGE 6 4 Le programme de docking se met alors en pause attendant que tous les calculs aient t r alis s Une fois les valuations achev es la partie Docking demande la partie Divcon de lire l nergie du syst me prot ine ligand de chaque calcul r alis 6 5 et envoie ces valeurs la partie AlgoGen afin de poursuivre le docking 6 6 L algorithme g n tique se charge de l criture des fichiers de Sortie de sauvegarde et de visualisation du docking 7 Le programme entre ensuite dans une boucle pour produire les populations successives de l al gorithme g n tique Cette boucle se termine lorsque le nombre maximal de g n rations voulu par l utilisateur a t atteint Le programme peut aussi s arr ter si le nombre maximal d valuations ap pels au programme DIVCON a t atteint ou par tout autre crit re d arr t d fini par l utilisateur Dans 3 3 D roulement du docking 63 la partie AlgoGen chaque cycle de reproduction commence par la s lection des individus 8 1 et leur reproduction pour cr er une nouvelle population 8 2 La proc dure d valuation de cette popu lation 9 x est identique celle en dehors de la boucle 6 x Les fichiers de sortie de sauvegarde
335. sons hydrog ne avec les r sidus Tyr82 et Tyr134 Fig 7 8 e et 7 8 f Les distances entre les hydrog nes Hy de Tyr82 et Tyr134 et les oxyg nes Og et Oc de Glu94 sont sup rieures 3 Nous constatons que les r sidus Tyr82 et Tyr134 ne forment pas de liaisons hydrog ne avec l oxyg ne du substrat Fig 7 8 g et 7 8 h contrairement ce qui a t observ pour DMSO La distance Hy O est sup rieure 4 dans les deux cas Ceci s explique en partie par le fait que le groupement OH du sulfoxyde proton poss de maintenant un caract re de donneur de liaison hydrog ne Par ailleurs nous avons observ durant une courte dur e de 100 ps que l atome d hydrog ne Tyr134 Hq vient interagir avec l atome de soufre Cys51 S une distance d environ 2 Fig 7 8 i Un point important dans ce cas est l interaction forte entre les atomes de soufre de Cys51 et du DMSO proton une distance moyenne de 3 5 Fig 7 8 b La charge n gative port e par Cys51 S est toujours stabilis e par l hydrog ne Hy de Tyr197 Fig 7 8 c Linteraction de type hydrophobe du groupement m thyle du substrat avec Trp53 semble peu importante Fig 7 8 j La distance Trp53 Ne DMSOH Og oscille beaucoup autour de la valeur moyenne de 4 5 Cette interaction plut t faible a pour cons quence d augmenter la mobilit du substrat dans le site actif L angle Cys51 S DMSOH S DMSOH O varie dans des proportions assez importantes de 100 1
336. sse A soutenue publiquement le 4 juin 2009 salle Jean Barriol Facult des Sciences et Techniques Membres du jury Pr sident M Guy BRANLANT Professeur Universit Henri Poincar Nancy Rapporteurs M Serge ANTONCZAK Ma tre de Conf rences HDR Universit Nice Sophia Antipolis Mme Anne MILET Professeur Universit Joseph Fourier Grenoble Examinateurs Mme Sandrine BOSCHI MULLER Professeur Universit Henri Poincar Nancy M Eric HENON Professeur Universit de Reims Champagne Ardenne Directeurs de th se M G rald MONARD Professeur Universit Henri Poincar Nancy M Manuel F RUIZ LOPEZ Directeur de recherche CNRS Nancy Equipe de Chimie et Biochimie Th oriques Unit Mixte de Recherche CNRS UHP 7565 Facult des Sciences et Techniques BP 239 54506 Vandoeuvre l s Nancy Cedex Je remercie toutes les personnes qui de pr s ou de loin m ont accompagn et m ont soutenu durant ces cinq ann es de th se Je remercie tout d abord le Pr G rald Monard et le Dr Manuel Ruiz L pez mes co directeurs de th se de m avoir accueilli au sein de l quipe de Chimie et Biochimie Th oriques et d avoir accept d encadrer mon travail Je tiens leur montrer ma profonde reconnaissance pour leur patience et leur disponibilit pour r pondre mes interrogations et r soudre mes probl mes ainsi que pour le travail de relecture de ce manuscrit Je remercie le Pr Guy Branlant et le Pr Sandrine Boschi Mul
337. ssus catalytique reste inconnu 5 2 M thionine sulfoxyde r ductases 101 La sous classe des MsrA v g tales comme celle de Lycopersicon esculentum se caract rise par la pr sence du motif conserv s9GCFWQGs contenant Cys et de cinq r sidus cyst ine suppl men taires Deux d entre eux sont situ s dans la chaine C terminale et sont conserv s des positions identiques Il se pourrait que ces cyst ines participent au processus catalytique 221 R cemment une enzyme MsrA active d Alkaliphilus oremlandii s l nocyst ine a t d couverte b Sous classes de MsrB L alignement des s quences de diff rentes MsrB est report dans la figure 5 8 Pour chacune d entre elles Cysc est localis e dans la chaine C terminale de la prot ine la position 117 au sein du motif conserv 116 YCXN119 La num rotation des r sidus des MsrB est bas e sur la s quence r f rence de la MsrB dE coli Les mammif res ont deux MsrB ou Cys est un r sidu Cys et une MsrB o Cysc est remplac e par une s l nocyst ine Ces prot ines SeCys ayant une activit MsrB sont appel es SelX ou SelR 4 225 1 10 20 30 40 50 60 70 l I E OIL MANKPSAEELKKNLSEMQFYVTONHGTEPPFTGRLLHNKRDGVY APLFHSQTKYDS PSFYEPVS P multocida em MKKREDMTEMQVHVELNQGTEYPFTGKLLDQOKKGLY SPLFVSDTKFDA PSFFQAISP P aeruginosa MSKIDKPLDSWREELTEEQFHIBRLGGTERAFSGEYHATKTPGIY TALFDSDAKYDSGSGEP
338. ssus de l tat couche ouverte diradicalaire W aq Cette diff rence d nergie est le r sultat de deux contributions D une part la diff rence de potentiel r dox que nous avons vue plus haut sugg re que le transfert d lectron pour 8 2 M canisme Il 1 H 1 e 207 o 3 2 m 8 Il H D oi S el 8 e ec I be c T Om 0 0 2 g si gt gt 1 T D dl gt ei Te o e rI o o a o s N of e st Il 4 r oo E gt 6 o s N e Le rI o Ob 0 a O 9 5 OF zm 1 D i gt KN o e o o 3 s 2 eo wi lt i N T D N o d 3 6 eo rd T E p 2 gt gt T CH CH CH eo CH CH CH co LO st N a 10w 1e2J 3V FIG 8 5 Diagrammes des tats lectroniques singulet couche ferm e Vion et singulet couche ouverte V rag correspondant trois situations 1 sulfurane avec une liaison S S la distance d quilibre 2 sulfurane avec une liaison S S dissoci e environ 4 et 3 sulfurane avec une liaison S S dis soci e l infini R sultats pour a sans environnement et b avec environnement Dans le cas 1 et 2 l environnement est repr sent par un mod le de site actif de l enzyme Dans le cas 3 l environnement est le solvant eau Les calculs ont t r alis s au niveau B3LYP 6 31G d pour 1 et 2 et B3LYP 6 311 G 2df 2p pour 3 Voir le texte pour plus d information 208 8 R duction du substrat le couple Cys DMSOH est tr s favorable D autre part
339. substrat a HOMO E 0 08409 Hartree b LUMO E 0 09127 Hartree c HOMO E 0 21501 Hartree d LUMO E 0 06205 Hartree e HOMO E 0 19774 Hartree f LUMO E 0 01425 Hartree Fic 7 5 Trac des orbitales HOMO et LUMO pour l interm diaire sulfurane 2 dans le mod le quantique de site actif a et b pour l interm diaire sulfurane 2 dans le mod le quantique de site en absence du r sidu Glu94 c et d et pour un compos sulfurane isol en phase gazeuse e et f Les trac s correspondent une valeur d isosurface de 0 05 7 2 M canisme de transfert de proton 171 FIG 7 6 Trac de l isosurface de densit lectronique p 0 05 color e du potentiel lectrostatique bleu 0 2 V rouge 0 2 V pour l interm diaire sulfurane 2 dans le mod le quantique de site actif a et un compos sulfurane isol en phase gazeuse b 172 7 Activation du substrat un potentiel positif Lintensit faible de la couleur bleue au niveau de l atome Ss malgr sa charge n gative importante 0 61 u a compar e par exemple Osg 0 55 u a peut s expliquer par la diff rence de taille et la densit lectronique plus diffuse sur l atome de soufre Nous avons effectu le m me trac pour un compos sulfurane optimis en phase gazeuse Fig 7 6 b La diff rence de charge nette entre le mod le de site actif 1 u a et la phase gazeuse 0 u a implique une teinte plus rouge de l ensembl
340. sur l axe de la bipyramide Le plan quatorial est occup par les deux groupements m thyles Cg et C43 et la paire libre du soufre Sg La distance entre les deux atomes de soufre S5 Sg vaut 2 43 Elle est plus courte de 0 15 que son analogue dans le mod le de site actif l absence d un environnement enzyme ou solvant implique une augmentation du caract re covalent de cette liaison comme le montre les ordres de liaison S S avec respectivement 0 49 pour 2 et 0 61 pour A Nous observons aussi que la distance Se O7 passe de 1 82 pour le mod le de site actif 1 87 A pour le vide Ces valeurs sont en accord avec celles obtenues dans les travaux de Balta et al Les charges des atomes Ss Se et O7 valent 192 8 R duction du substrat o Distance A 2 A TSae B TSeg c C C1 S5 1 84 1 83 1 84 1 81 1 84 1 82 S5 S86 2 58 2 43 2 26 2 18 2 27 4 33 Se O 1 82 1 87 2 03 2 07 2 20 3 25 O7 Hg 1 08 0 97 0 97 0 97 0 97 0 98 Se Cs 1 83 1 83 1 84 1 83 1 82 1 83 Se C43 1 83 1 83 1 92 1 92 1 87 1 83 S5 O 4 30 3 76 3 12 2 40 1 69 Angle 2 A TSae B TSagc C C4 95 86 93 7 95 6 94 8 104 0 132 5 111 2 5 S6 O 170 9 178 5 1224 94 8 64 8 20 1 S6 0O7 Hg 110 1 102 9 101 5 101 8 106 7 20 9 S5 S6 Co 92 4 95 9 106 4 108 6 100 8 S5 S8e C13 90 8 92 4 86 7 94 7 75 6 Cg S6 C13 101 1 101 6 93 0 92 6 96 4 99 5 O S6 Os 91 3 88 9 79 8 82 5 82 2 81 1 O S6 C43 94 5 89 6 1449 175 1 157 4 82 7 Ordre de liaison 2 A TSag B TSgc C C1
341. sur les atomes S37 et Ogg de la fonction sulfoxyde du DMSO Lorbitale vacante de plus basse nergie LUMO Fig 7 3 c est localis e au niveau du syst me x de la mol cule de ph nol imitant le r sidu Tyr134 Nous avons compar 1 avec la structure cristallographique 3BQE dans laquelle l atome d oxyg ne d une mol cule d eau du solvant mime l atome d oxyg ne du sulfoxyde Le tableau 7 4 reporte les distances entre atomes d oxyg ne dans le mod le de site actif et dans la structure cristallographique Nous constatons globalement que les deux structures sont similaires et plus particuli rement en ce qui concerne la position de l oxyg ne du sulfoxyde Ceci nous permet de valider cette esp ce 1 comme point de d part du m canisme de transfert de proton et par extension du mod le de site actif utilis o Distance A O38 Oo4 O38 O12 O3g O27 Mod le de site actif 1 2 71 2 62 2 80 Cristallographie 3BQE 2 68 2 63 2 69 TAB 7 4 Comparaison de la structure du complexe micha lien 1 dans le mod le quantique de site actif par rapport la structure cristallographique 3BQE La g om trie 1 est optimis e au niveau B3LYP 6 31G a 7 2 M canisme de transfert de proton 167 b Etat de transition pour le transfert de proton TS L tat de transition TS4 2 Fig 7 4 a est caract ris par une fr quence imaginaire 79i cm dont le mode normalde vibration correspond l change de l hydrog ne H 3 entre les oxyg nes O42
342. t et Glu94 d autre part durant la simulation Fig 6 9 k et 6 9 l Ici les tyrosines stabilisent donc principalement le substrat D autre part l interaction lectrostatique entre les deux atomes de soufre existe toujours avec une distance Cys51 S DMSO S variant peu autour de 4 Fig 6 9 d Cette distance d quilibre est la m me que celle observ e dans la pr c dente simulation malgr la d protonation de Cys51 La charge n gative port e par le soufre S de Cys51 est stabilis e par l hydrog ne Hy de Tyr197 avec une distance fr quente de 2 entre ces deux atomes Fig 6 9 e Cette interaction avait d j t observ e dans la simulation de l enzyme libre Free Cys GluH Le substrat est encore moins mobile dans cet tat de protonation que dans la simulation pr c dente Linteraction hydrophobe du groupe ment m thyle du DMSO avec Trp53 est relativement importante avec une distance variant tr s peu autour de 4 Fig 6 9 f Ceci se v rifie par l observation de l angle di dre Cys51 Og Cys51 S DMSO S DMSO C Fig 6 9 g qui varie tr s peu durant la simulation A noter que la variation subite de 110 0 vers 300 ps est principalement due au changement de l angle di dre de Cys51 autour de la liaison Ca Cg Fig 6 9 h Signalons aussi que la variation de l angle di dre de Cys51 s accompagne d une modification de la solvatation de Cys51 Fig 6 9 i Cependant cette variation n entraine aucune mo
343. t mutation en divisant les g nes en plusieurs parties dans le but d tre en accord avec le principe qui vient d tre nonc a Croisement Nous effectuons un ou plusieurs croisements sur des parties du g ne gr ce au partitionnement de celui ci et chaque croisement est affect d une probabilit pc de se r aliser Prenons par exemple deux g nes A et B de longueur L 8 Nous d cidons de cr er deux partitions de longueur L 4 sur chaque g ne que nous notons avec i le numero de partition En d terminant un point de croisement k choisi au hasard pour chaque partition dans l intervalle 1 L 1 nous obtenons les deux nouveaux g nes A et B A 01101000 0110 1000 0001 1100 00011100 A gt B 10011101 1001 1101 1110 1001 11101001 B b Mutation par permutation Cette mutation correspond celle utilis e dans l exemple de minimisation Elle est r alis e sur chaque g ne A et B apr s l op ration de croisement en effectuant la permutation de bit 0 1 La fa on de proc der est la m me que pour le croisement i e une ou plusieurs partitions sont cr es pour chaque g ne sur lesquelles une ou plusieurs mutations peuvent se r aliser avec une probabilit py 2 3 Programmation de l algorithme g n tique 47 c Mutation par addition Nous avons apport ce programme une am lioration concernant l op ration de mutation Dans cette approche nous ne con
344. t 43 3 76 0 108 3 109 0 A Eadia 42 8 74 8 107 2 108 9 AE CH3 2S OH kcal mol Gaz Cyclohexane DMSO Eau A Evert 103 8 75 9 48 9 48 3 A Eadia 135 7 108 7 83 2 82 8 PI AE kcal mol Gaz Cyclohexane DMSO Eau Evert 60 5 0 1 59 4 60 7 A Eadia 92 9 33 9 240 26 1 TAB 8 4 Potentiel d ionisation de CH 2 et affinit lectronique de CH3 2S OH en fonction du solvant Les valeurs sont obtenues au niveau de th orie B3LYP 6 311 G 2df 2p sur g om tries optimis es B3LYP 6 31 G d avec un mod le de solvant CPCM Cyclohexane 2 02 DMSO 46 7 et Eau 78 39 La derni re partie du tableau donne la somme des nergies PI AE correspondant au bilan nerg tique du transfert d un lectron entre CH3 S et CH3 2S OH pour des esp ces s par es Pour relier les valeurs du potentiel d ionisation et de l affinit lectronique une grandeur ther modynamique nous avons calcul les potentiels d oxydor duction des couples CH3 S CH3 S7 et CH3 2S OH CH3 2 S OH selon la m thode propos e par Fu et al La valeur de potentiel r dox absolu en V d un couple Ox Red en fonction du solvant est obtenue selon l quation 1 E Ox Red aps Ploaz nea F TAS AGsoy ox Gsoiv Red O Plgaz Red est le potentiel d ionisation de la forme r duite en phase gazeuse d finie comme dif f rence d enthalpie AH adiabatique en eV 7 la constante de Faraday 7 23 06 kcal mol eV T la temp rature
345. t Castro B nt J Quant Chem 107 172 181 2007 Stavric B et Nera E A Clin Toxicol 18 47 74 1978 Vasilyev V et Bliznyuk A Theor Chem Acc 112 313 2004 Raha K et Merz Jr K M J Med Chem 48 4558 2005 Zhou T Huang D et Caflisch A J Med Chem 51 4280 4288 2008 Gogonea V et Merz Jr K M J Phys Chem A 103 5171 5188 1999 Sch neich C Biochim Biophys Acta 1703 111 119 2005 Kauffmann B Aubry A et Favier F Biochim Biophys Acta 1703 249 260 2005 Antoine M Les M thionine Sulfoxyde R ductases de classe A catalyse sp cificit structurale et relations structure fonction Ph D thesis Universit Henri Poincar Nancy France 2006 Turrens J F J Physiol 552 335 344 2003 Babior B M UIBMB Life 50 267 269 2001 Vignais P V Cell Mol Life Sci 59 1428 1459 2002 Babior B M Lambeth J D et Nauseef W Arch Biochem Biophys 397 342 344 2002 Coon M J Ding X X Pernecky S J et Vaz A D FASEB J 6 669 673 1992 Yokoyama Y Beckman J S Beckman T K Wheat J K Cash T G Freeman B A et Parks D A Am J Physiol 258 G564 G570 1990 Rubbo H Radi R Trujillo M Telleri R Kalyanaraman B Barnes S Kirk M et Freeman B A J Biol Chem 269 26066 26075 1994 Stadtman E R et Levine R L Ann NY Acad Sci 899 191 208 2000 Richter C Park J W et Ames B N Proc Natl Acad Sci
346. t constitu de la classe d objet Quaternion et de la classe Qvector h rit e de ce dernier Un objet Quaternion contient un attribut Internal qui repr sente ses quatre composantes sous la forme d une liste et plusieurs fonctions r alisant les diverses op rations d alg bre quaternionique Il existe aussi dans ce module la fonction romEuler qui permet de cr er un quaternion partir de trois angles d Euler et la fonction dist qui donne la distance entre deux vecteurs position Ce module fournit au programme de docking la r presentation d un vecteur position sous la forme d un vecteur quaternion ou q vecteur et ii les diff rentes op rations d alg bre quaternio nique relatives aux rotations effectuer 60 3 Interface ALGOGEN DIVCON 3 2 3 Module divcon py Le module divcon py est un module crit en Python d environ 100 lignes Il permet de g rer essentiellement les entr es sorties propres au programme DIVCON Il contient une classe Divcon crite sous la forme d un singleton L objet divcon instanci de ce dernier poss de diff rents attri buts e Method m thode semi empirique utilis e dans le calcul de l nergie e Charge charge totale du syst me mol culaire e Cluster param tres Divide amp Conquer e ProgramPath r pertoire de l ex cutable DIVCON et deux fonctions e writeDivconFile criture du fichier d entr e e readEnergy lecture de l nergie du syst me mol cula
347. t d tudier cette esp ce au sein du site actif et de comparer les r sultats de dynamique mol culaire avec ceux obtenus pour l esp ce sulfurane Ces deux simulations sont discut es maintenant 7 3 1 Simulation de la forme proton e du DMSO a Param tres du champ de forces du substrat DMSO proton Une param trisation du champ de forces du substrat DMSO proton a d tre effectu e pour conduire cette tude de dynamique mol culaire car aucun jeu de param tres sp cifiques cette esp ce n est disponible l heure actuelle Le protocole de param trisation est identique celui d crit dans le chapitre pr c dent pour le substrat DMSO voir page 119 Les param tres du champ de forces du substrat DMSO proton sont report s dans le tableau 7 5 La nomenclature des atomes de cette esp ce est donn e dans la figure 7 7 Fic 7 7 Nomenclature des atomes du substrat DMSO proton DMSOH Les carbones sont color s en cyan les hydrog nes en blanc les azotes en bleu les oxyg nes en rouge et les soufres en jaune 174 7 Activation du substrat Atome Cx Hx S O H Type CT H1 s4 oh ho Masse a m u 12 0 1 0 32 1 16 0 1 0 Charge a u 0 2335 0 1694 0 4196 0 4606 0 4918 o A 1 9080 1 3870 2 000 1 7210 0 0000 E kcal mol 0 1094 0 0157 0 2500 0 2104 0 0000 Liaison CT H1 oh ho s4 CT sd oh Constante de force kcal mol 340 00 369 60 233 80 274 30 Distance d quilibre 1 090 0 974 1 807 1 670
348. t une meilleure interaction prot ine ligand Nous reviendrons plus en d tail sur les algorithmes de recherche dans le prochain chapitre 1 3 Motivations pour le d veloppement d un nouveau programme Les approches utilisant une repr sentation atomique du syst me mol culaire sont actuellement limit es par une description trop simple des interactions prot ine ligand reposant essentiellement sur une param trisation du champ de forces Les limitations concernent notamment le manque de param tres ad quats la description des ligands complexes ii la difficult de prendre en charge convenablement les effets de polarisation lectronique et iii l impossibilit de traiter les ventuels changements chimiques dans le processus de docking tat de protonation par exemple 26 1 Rappels bibliographiques et objectifs En principe l utilisation d une description quantique du syst me ou d une partie du syst me ligand prot ine peut tre un moyen de s affranchir de ces probl mes Cependant le calcul de l ner gie d un ligand li une prot ine peut s av rer tre ardu dans ce cas cause de la taille du syst me biomol culaire En effet en utilisant les algorithmes standards les besoins en temps CPU croissent de mani re non lin aire avec la taille du syst me au minimum en O N 3 o N est le nombre d orbitales atomiques dans la base Ceci limite s v rement le nombre total d atomes que l on peut prendre en compt
349. ta et al 236 114 5 Rappels bibliographiques et objectifs Bien que cette derni re tape du m canisme de r duction ne semble pas limit e par des consid rations nerg tiques sa validit dans le milieu enzymatique n est pas vidente et fera l objet d une discussion d taill e dans notre tude Parall lement la derni re tape du m canisme que nous venons d voquer Balta et al ont envisag une autre voie de formation de l acide sulf nique partir de l interm diaire sulfurane 3 Cette hypoth se propose que l acide sulf nique soit form directement partir de l interm diaire sulfurane par un repliement de l angle S S O en passant par un tat de transition dont la g om trie est illustr e par la figure 5 14 Cette transformation pourrait ventuellement tre catalys e par un acide afin d aider la dissociation de la liaison S O Une exploration de la surface d nergie poten tielle sur des structures proches de cet tat de transition suppos montre que l nergie d activation serait de 41 6 kcal mol au dessus de l interm diaire sulfurane 3 Cette valeur importante est due en grande partie l interaction tr s d favorable du doublet libre de l atome de soufre central avec les deux autres atomes Il semble difficilement concevable que la barri re nerg tique soit abaiss e de mani re cons quente dans le site actif de l enzyme Cette hypoth se se retrouve donc a priori exclue du m canisme de r duction
350. te actif vers le solvant 8 5 Conclusions Dans ce chapitre nous avons analys plusieurs m canismes de r action possibles permettant de relier l esp ce interm diaire sulfurane identifi dans nos calculs l acide sulf nique mis en vidence exp rimentalement Trois m canismes ont t explor s Le premier implique un transfert de groupement OH similaire celui observ dans l oxydation de thiolate par les peroxydes Le deuxi me m canisme correspond un processus d oxydor duction de type 1H 1e Il met en jeu un transfert d lectron du thiolate vers le sulfoxyde proton qui repr sente une forme limite de l esp ce sulfurane Enfin dans le troisi me m canisme de type 2H 2e nous avons consid r 8 5 Conclusions 217 l hypoth se d un transfert de proton d une tyrosine vers le sulfurane conduisant une dissociation en ion sulfuranyle et une mol cule d eau suivi d une hydrolyse de ce m me ion Parmi tous ces m canismes le seul qui pr sente des barri res d activation compatibles avec l activit enzymatique est le troisi me Ce m canisme est comparable celui qui a t d crit par Balta et a 236 en solution Dans le cas d un processus en solution le donneur de proton est la mol cule de thiol et on pr voit une barri re d environ 5 5 kcal mol Dans l enzyme malgr le pK plus lev d un r sidu Tyr par rapport au thiol la pr sence de Glu dans le site actif a r duit la barri re con
351. te aussi da 24 1 Rappels bibliographiques et objectifs vantage un probl me de reconnaissance mol culaire Cependant son inconv nient majeur r side dans le fait que le score du syst me prot ine ligand doit tre calcul apr s chaque d placement sachant qu il faut r aliser une exploration relativement grande de l espace configurationnel Il existe ainsi plusieurs fonctions de score qui reposent sur une description atomique du syst me prot ine ligand Signalons qu il existe des fonctions de score li es au traitement sp cifique d un type de docking tel que prot ine ligand prot ine prot ine ou prot ine ADNS Ces fonctions calculent g n ralement le score de docking partir d une m thode param tr e ou empirique Nous avons regroup ces m thodes selon trois grandes cat gories Champ de forces Le score est calcul en faisant la somme des forces intermol culaires de van der Waals et lectrostatiques entre tous les atomes du syst me prot ine ligand Les nergies intramol culaires des deux entit s sont parfois incluses dans le score final Pour tenir compte du solvant les nergies de d solvatation du ligand et de la prot ine sont souvent prises en compte par des m thodes de solvatation implicite du type GBSA ou PBSA Empirique Ces m thodes se basent sur un d compte du nombre d interactions dans le syst me prot ine ligand comme par exemple le nombre de liaisons hydrog ne les contacts hydro
352. transition Les structures obtenues dans ce chemin de r action sont d crites ensuite Nous utilise rons la notation suivante A Interm diaire sulfurane avec le groupement S CHs en position axiale B Interm diaire sulfurane avec le groupement S CHs en position quatoriale C Interm diaire acide sulf nique Ils sont reli s par deux tats de transition not s TS4 g et TSg c Il faut noter ici que compte tenu de notre mod le Met CH dans la figure 8 1 les deux structures possibles pour l interm diaire B sont nerg tiquement quivalentes nantiom res Seule une de ces formes a figure 8 1 sera donc consid r e dans les calculs Le tableau 8 1 regroupe les valeurs g om triques de ces esp ces ainsi que les ordres de liaison et les charges Le bilan nerg tique y est galement pr sent Les valeurs correspondant l interm diaire sulfurane 2 dans le mod le quantique de site actif utilis dans le chapitre pr c dent ont t report es dans ce tableau pour comparaison Les structures sont rassembl es dans la figure 8 2 a Interm diaire sulfurane A L interm diaire sulfurane A Fig 8 2 a pr sente une structure similaire celle que nous obte nons en fin d tape de protonation dans le mod le de site actif 2 fig 7 4 b Latome de soufre central Sg adopte une g om trie de type bipyramide base trigonale o les atomes de soufre Ge et d oxyg ne O les atomes les plus lectron gatifs sont situ s
353. tre HO et un sulfure est son addition sur l atome de soufre conduisant la formation d un radical hydroxysulfuranyl16 182 R4S OH Ces derniers sont des compos s relativement instables 9 moins qu ils ne soient stabilis s par des liaisons hydrog ne internes 9 et se d composent unimol culairement en radical cation R2S et HOT ou H20 en 162 milieu acide selon HOT Rap R S OH Re S HO Au sein d une prot ine le radical cation R2S peut tre stabilis s il trouve un doublet d lectrons non liants provenant d un atome d oxyg ne ou d azote avec lequel il pourra former un radical cation du type S O ou S N Ces compos s pr sentent une liaison de deux centres trois lectrons deux lectrons dans une orbitale o liante et un lectron dans une orbitale o anti liante L volution de cet interm diaire peut conduire la destruction de la prot ine par clivage du squelette carbon de celle ci Un sulfoxyde n est form qu en pr sence d O partir de ces interm diaires radicaux cations Pour l interm diaire radicalaire de type S N l oxyg ne mol culaire r agit pour former un azasulfonium R2S NHR hydrolysable en sulfoxyde 56 167 HS NH R O2 gt 0 O0 R2S NH R RoS NHR HO HS NHR H O R S 0 RNH2 H Le radical hydroxysulfurany peut aussi r agir directement avec O2 pour former l interm diaire radical peroxyl R
354. triques l optimisation de g om trie conduit la structure 3 repr sent e dans la figure 8 3 Les valeurs g om triques les ordres de liaison et les charges sont donn s dans le tableau 8 2 Une dissociation de la liaison S37 O3g est observ e suite une protonation du groupement OH facilit e par la mol cule de ph nol mimant le r sidu Tyr134 du site actif Nous avons d j tabli que la liaison S O du sulfurane est relativement faible notamment lorsque le groupement S CH est en position quatoriale ordre de liaison de 0 38 dans B par exemple La pr sence d un donneur de proton m me aussi faible qu un ph nol d stabilise davantage la liaison S O et conduit sa dissociation Ce r sultat est en accord avec les travaux de Balta et al mentionnant une rupture facile de la liaison S O du sulfurane sous catalyse acide par un thiol Nous reviendrons plus loin sur le r le jou par le r sidu Tyr134 dans le m canisme de r duction La structure 3 se situe 14 2 kcal mol au dessus de l interm diaire sulfurane 2 ce qui est compa rable la diff rence d nergie entre les esp ces A et B d crites pr c demment Signalons qu il n a pas t possible pour l instant de localiser une structure d tat de transition permettant de connec ter 2 et 3 Malgr cela l ensemble de ces r sultats montre que ce m canisme ne peut tre invoqu pour d crire le processus de r duction dans l enzyme Compte tenu des nergies calcul
355. u Glu94 distance 3 4 T o c S Ki a Y82HH E940E1 Y134HH E940E1 wi E J 0 200 400 600 800 1000 0 2 4 6 8 Temps ps Distance f Distance Tyr82 H Glu94 Og4 rouge et Tyr134 Hy Glu94 Og4 bleu n n FiG 6 4 suite Variation du nombre de mol cules d eau dans la solvatation des r sidus Cys51 d et Glu94 e et des distances Tyr82 H Glu94 O et Tyr134 Hn Glu94 Oe f en fonction du temps dans la simulation de Free CysH GluH La solvatation est moyenn e sur 10 ps Les histogrammes droite montrent la r partition des valeurs pour chacune des courbes 132 6 Reconnaissance et ancrage du substrat 6 3 3 Etat de protonation Cys GluH Les r sultats de la simulation sont pr sent s dans la figure 6 5 Les interactions entre r sidus sont assez peu nombreuses dans cette simulation En effet les r sidus du site actif sont pour la plupart en interaction avec des mol cules d eau du solvant Ainsi par exemple nous n observons pas d interaction entre l hydrog ne He de Glu94 et le soufre S de Cys51 La distance entre ces deux atomes pr sente un maximum de probabilit 4 Fig 6 5 a une mol cule d eau tant intercal e A partir de t 600 ps le soufre S de Cys51 entre en interaction avec l hydrog ne Hy de Tyr197 formant une liaison hydrog ne avec une distance autour de 2 Fig 6 5 b Une mol cule de solvant est initialement pr sente entre ces deux r sidus Latome Cys51
356. u la planarit autour de certains atomes e g planarit des carbones hybrid s sp Ces termes di draux impropres sont repr sent s par un potentiel harmonique 2 Vimpropre Kimpropre S Dag A 1 6 o est l angle entre le plan form par l atome central et les deux atomes p riph riques d une part et le plan form par les atomes p riph riques d autre part b Termes non li s Ces termes permettent de prendre en compte les interactions de van der Waals et lectrostatiques entre les atomes En g n ral elles s appliquent seulement aux paires d atomes qui sont s par es par au moins trois liaisons chimiques Interaction de van der Waals En m canique mol culaire la r pulsion courte distance et la dispersion sont mod lis es par un terme d interaction de van der Waals le plus souvent exprim par un potentiel de type Lennard Jones 6 B A o 12 0 Wan der Waals 4p 7 4 2 GI A 17 o r est la distance entre les deux atomes Les deux param tres sont la profondeur du puits de potentiel et o la param tre de collision Le premier terme rend compte de la r pulsion des nuages lectroniques courte distance Le deuxi me terme d crit l attraction longue distance due la dispersion Interaction lectrostatique Les interactions lectrostatiques entre deux atomes j et j sont d crites par la loi de Coulomb Or Ate l j A 18 V lectrostatique o qj et
357. u94 permet l tablissement d une liaison hydrog ne tr s forte avec l atome d oxyg ne du substrat Fig 6 7 a La distance GIU94 H gt DMSO O vaut 2 environ la plupart du temps avec quelques tr s faibles fluctuations Au del de son interaction avec Glu94 l atome d oxyg ne du DMSO se trouve au centre d un r seau de liaisons hydrog ne avec les r sidus Tyr82 et Tyr134 situ s proximit Fig 6 7 b et 6 7 c Linteraction avec l hydrog ne Hy de Tyr82 semble tre particuli rement forte L hydro g ne Hy de Cys51 est aussi en interaction avec l oxyg ne du DMSO sur une p riode de 50 ps aux alentours de 200 ps Fig 6 7 d Le reste du temps cet hydrog ne interagit avec Tyr197 comme le confirme l analyse de l angle di dre de Cys51 autour de la liaison Cg S Fig 6 7 e et la dis tance Cys51 H Tyr197 Oq Fig 6 7 f Globalement les interactions entre les r sidus du site actif sont peu nombreuses Nous n avons pas observ d interaction entre Tyr82 ou Tyr134 et les atomes d oxyg ne de Glu94 Fig 6 7 k et 6 7 l tous ces r sidus stabilisant principalement le substrat D autre part une interaction lectrostatique existe entre les atomes de soufre port s par Cys51 et DMSO Cette interaction tait d j pr sente dans la simulation pr c dente mais comme nous l avons vu elle tait rapidement rompue par la migration du sulfoxyde vers le solvant Dans le cas pr sent le substrat est maintenu dans le s
358. uction du substrat Dans ce cas le processus de transfert d lectron est associ un processus d excitation lectro nique HOMO LUMO Lorsque la distance est plus longue ds s 4 0 A nous avons r alis un calcul SCF de type restreint pour obtenir la forme limite ionique et un calcul non restreint pour obtenir la forme limite diradicalaire avec une option guess mix sous GAUSSIANOS3 pour briser la sym trie amp fB au d part Pour chacune de ces structures nous avons r alis un calcul pour le sys t me isol en phase gazeuse puis pour un syst me en interaction avec l environnement Le choix des structures g om triques et du mod le a t r alis de la mani re suivante e pour le syst me la distance d quilibre de s 2 5 A on consid re la structure de l interm diaire sulfurane 2 dans le mod le quantique de site actif d crit page 167 e pour le syst me dissoci ds s 4 0 A nous avons utilis un mod le quantique classique dans lequel le syst me quantique est compos du substrat sulfoxyde proton et des r sidus Cys51 et Glu94 d proton s le reste de l enzyme tant repr sent par un ensemble de charges ponctuelles Les r sidus ont t coup s au niveau de la liaison Cy Cg pour Cys51 et de la liaison Cg C pour Glu94 Un atome d hydrog ne a t plac une distance de 1 08 du carbone de coupure dans l axe de la liaison coup e Les atomes restants de Cys51 et Glu94 i e chaine
359. ue sont les mol cules planes conjugu es sans angle di dre mobile Cependant la flexibilit de l enzyme aurait t n cessaire dans le cas du docking de l acide oxo nique Le d placement de la mol cule d eau W2 aurait permis la formation d un complexe stable avec l enzyme Il est possible de s affranchir de ces probl mes de rigidit en effectuant un docking rigide sur plusieurs conformations de la prot ine Cependant la grande taille des syst mes mol cu laires implique un nombre important de degr s de libert prendre en compte dans la construction de ces diff rentes conformations c Evolution du programme Cette premi re version du programme ALGOGEN DIVCON a fait ses preuves en montrant qu il est d sormais possible de r aliser un docking rigide avec une description quantique du syst me mol culaire Nous indiquons les prochaines am liorations que nous souhaitons apporter au programme pour le faire voluer e am lioration de l algorithme g n tique pour acc l rer la convergence vers la solution optimale strat gie d volution e ajout des effets du solvant dans l nergie d interaction e flexibilit du ligand et des r sidus d int r t de la prot ine e prise en compte de l tat de protonation du syst me prot ine ligand en consid rant pour chaque entit l existence de diff rents tats de protonation durant le processus de docking Deuxi me partie M canisme catalytique des m thionine s
360. ues de diff rentes Msr montre que la distance entre l atome 6 2 Simulations protocole op ratoire 119 d oxyg ne mimant celui du sulfoxyde et l atome d oxyg ne de Glu94 est en moyenne de 2 6 Ceci sugg re qu un atome d hydrog ne pourrait se situer entre ces deux atomes pour permettre la formation d une liaison hydrog ne c Proposition d tat de protonation D apr s les r sultats exp rimentaux et les valeurs pr dites par PROPKA les tats de protonation suivants sont envisageables pour d crire les r sidus Cys51 et Glu94 du site actif e Cys51 CysH dans l enzyme libre et Cys dans le complexe enzyme substrat e Glu94 Glu ou GluH dans l enzyme libre ou dans le complexe enzyme substrat Concernant le r sidu glutamate plusieurs hypoth ses sont envisageables lors de l tape de re connaissance allant du syst me enzyme libre jusqu au complexe enzyme substrat complexe mi cha lien e Glu94 est d proton la fois dans l enzyme libre et le complexe enzyme substrat Dans ce cas Cys51 transf re son proton au substrat formation d un sulfoxyde proton e lors de la formation du complexe Cys51 transf re son proton Glu94 On a alors les couples CysH Glu dans l enzyme libre et Cys GluH dans le complexe micha lien e Glu94 reste dans une forme proton e tout au long du processus de reconnaissance du substrat On a dans ce cas GluH dans l enzyme libre et dans le complexe enzyme substrat Au total trois
361. ulfoxyde r ductases de classe A Chapitre 5 Rappels bibliographiques et objectifs Sommaire 5 1 Stress oxydant et oxydation des r sidus m thionine 88 5 2 M thionine sulfoxyder ductases 95 5 3 Etudes ant rieures sur l tape r ductasede MsrA 108 5 4 Objectifs et approche m thodologique 114 Ce chapitre essentiellement bibliographique pr sente le ph nom ne biologique d oxydation des prot ines et plus particuli rement celui impliquant les r sidus m thionine conduisant leur trans formation en sulfoxydes de m thionine La description faite ici est principalement inspir e d articles de revue 133 et de la th se d Antoine Nous d crirons comment de telles entit s peuvent tre produites in vivo et quelles sont les cons quences de cette modification biochimique vis vis du m tabolisme Puis nous verrons que le vivant poss de des outils pour lutter contre ces ph no m nes d oxydation En ce qui concerne l oxydation des r sidus m thionine il existe une famille d enzymes appel es m thionine sulfoxyde r ductases Msr capables de les r parer Les r sultats des diff rentes tudes entreprises ant rieurement seront expos s avant d introduire les objectifs de ce travail de th se et l approche m thodologique qui a t choisie 88 5 Rappels bibliographiques et objectifs 5 1 Stress oxydant et oxydation des r sidus m thi
362. une simple liaison avec des atomes charg s droite La description couramment retenue est celle d une liaison partiellement double au centre r sultant d un quilibre de r sonance entre les deux formes limites De nombreuses tudes exp rimentales ont t entreprises afin de caract riser les propri t s physiques de la liaison S O La majorit des donn es exp rimentales acquises est en faveur d une structure hybride entre les deux formes de r sonance domin e par une forte contribution de la forme semi polaire La longueur de la liaison S O de 1 492 observ e dans les sulfoxydes est plus courte que la distance de 1 57 attendue pour une liaison simple S O sugg rant un caract re de double liaison 9 La spectroscopie par rayons X 9 a mis en vidence la polarisation des sulfoxydes et la pr sence d une charge positive sur l atome de soufre La mesure d un moment dipolaire de 3 96 D conforte cette observation du caract re ionique des sulfoxydes La force de la liaison S O calcul e partir de spectres IR est en faveur d une liaison semi polaire Plusieurs tudes 19 de chimie th orique ont permis de rationaliser ces donn es exp rimen tales en montrant clairement que la liaison S O des compos s sulfoxyde est d crite comme la 5 2 M thionine sulfoxyde r ductases 95 contribution d une liaison covalente o partiellement ionique et fortement polaris e d une part et d une liaison xt presque enti rement ioni
363. ur d une sph re de rayon radius centr e la position center La fonction renvoie un objet At omSet docking cut atomSet center radius gt AtomSet getCharge atomSet Charge d un syst me d atomes e Calcule la charge d un syst me d atomes atomSet prot ine en se basant sur le nom des r sidus La fonction renvoie un r el docking getCharge atomSet gt float C 3 2 Attributs Prot Partie prot ine e Syst me d atomes correspondant la partie prot ine Cet attribut permet d indiquer quel syst me d atomes repr sente la partie fixe du docking docking Prot lt AtomSet gt Pas de valeur par d faut C 4 Attributs de divcon 267 Lig Partie ligand e Syst me d atomes correspondant la partie ligand Cet attribut permet d indiquer quel syst me d atomes repr sente la partie mobile du docking docking Lig lt AtomSet gt Pas de valeur par d faut C 4 Attributs de divcon Method M thode semi empirique e Nom de la m thode semi empirique utilis e pour l valuation nerg tique des conformations prot ine ligand divcon Method lt string gt Fonctions pr d finies PM3 PM3 PIF PM3 PIF WALID AMI Pas de valeur par d faut Charge Charge du syst me prot ine ligand e R el donnant la charge nette du syst me prot ine ligand pour l valuation nerg tique des conformations divcon Charge float Pas de valeur par d faut Cluster Para
364. valeur du pK d un groupe ionisable dans une prot ine est pr dit en appliquant une perturbation environnementale ApK la valeur intrins que non perturb e PKumogei de ce groupe pKa PK Model Apk A 41 Les diff rentes valeurs de pKyjoge Sont d termin es empiriquement Tableau A 1 et sont proches de celles utilis es dans d autres tudes 5 est connu que pour les groupes ammonium N terminaux les groupes carboxyle C terminaux et les r sidus Asp les effets des substituants du squelette peptidique font diminuer significativement leurs valeurs de pKa Ces effets sont d j in clus dans le terme pKyoder Nous allons voir maintenant les diff rentes relations empiriques qui interviennent dans le terme ApK de d placement du pK Groupe ionisable PK model Centre du groupe RLocal C ter 3 20 ro foxT 2 4 5 Asp 3 80 roni l op2 2 4 5 Glu 4 50 Tort l oE2 2 4 5 His surface 6 50 Ica ND ICE NE cp d s 4 0 His enfouie 6 50 rca Np cE NE cp 5 6 0 N ter 8 00 IN 4 5 Cys 9 00 Isc 3 5 Tyr 10 00 TOH 3 5 Lys 10 50 DG 4 5 Arg 12 50 loz 5 0 TAB A 1 Valeur de pKyjoge d finition du centre g om trique et rayon Ri oca utilis pour les effets de d sol vatation pour chaque type de groupe ionisable Liaisons hydrog ne II a t montr dans des tudes pr c dentes que les liaisons hydrog ne jouent un r le d terminant dans la variation du pK des r sidus Asp et Glu La relation la plus
365. ve des principales esp ces oxyg n es activ es EOA impliqu es dans l oxyda tion de substrats biologiques Pour lutter contre ces effets toxiques il existe dans l organisme des syst mes de d fense qui permettent de r guler la quantit d EOA pr sentes ou de r parer les dommages caus s sur les substrats biologiques Ces syst mes sont constitu s par i des anti oxydants 150 tels que les vitamines A C et E les oligo l ments ou diverses biomol cules qui agissent comme des pi ges radicaux ii des enzymes comme la superoxyde dismutase qui d gradent les EOA iii des enzymes telles certaines oxydor ductases et notamment les m thionine sulfoxyde r ductases dont nous parlerons par la suite qui r duisent les substrats oxyd s et en dernier recours iv des en zymes prot olytiques souvent sous la forme d un couple ubiquitine prot asome qui d gradent les substrats biologiques irr versiblement oxyd s Le stress oxydant a t d fini par Helmut Sies comme tant le r sultat d un d s quilibre de la balance entre les pro oxydants EOA et les anti oxydants syst mes de d fense avec comme cons quence l apparition de d g ts souvent irr versibles pour la cellule 5 1 Stress oxydant et oxydation des r sidus m thionine 89 5 1 1 Oxydation des r sidus m thionine par les EOA Les r sidus m thionine sont connus pour tre tr s sensibles au stress oxydant Le soufre de la fonction thio th
366. volontairement d taill s ci dessous car ils apportent certaines informations importantes vis vis de l tude enzymatique men e durant ce travail de th se a Syst me tudi et m thodologie Le travail vise la r duction d un sulfoxyde par un thiol en solution de dim thylsulfoxyde DMSO Les auteurs ont consid r une mol cule de m thanethiol CH3SH et une mol cule de DMSO Ces deux mol cules jouent le r le de Cys et du substrat oxyd respectivement dans le cas de la r action 110 5 Rappels bibliographiques et objectifs enzymatique Le solvant DMSO est mod lis en utilisant un mod le mixte discret continuum Une deuxi me mol cule de DMSO solvant est donc introduite explicitement dans le syst me L insertion de cette mol cule explicite de solvant vise la prise en compte des interactions sp cifiques qui pour raient jouer un r le important dans la stabilisation des interm diaires de r action en formant des liai sons hydrog ne Le mod le de continuum utilis 9 240 est celui d velopp dans notre laboratoire on utilise la constante di lectrique du DMSO e 46 7 Toutes les g om tries ont t optimis es au niveau de th orie B3LYP 6 311G d p et caract ris es par un calcul de fr quences Les minima ont t connect s aux tats de transition TS par l interm diaire d un calcul d IRC intrinsic reaction coordinate Un calcul plus pouss de l nergie a t effectu au niveau MP2 6 311 G 3d2f
367. volume et nergie du syst me mol culaire conserv s 270 NVT PME SCF Lexique Ensemble thermodynamique canonique Nombre de particules volume et temp rature du syst me mol culaire conserv s Particle Mesh Ewald Algorithme de traitement des termes lectrostatiques longue port e par combinaison de la somme d Ewald et de transform es de Fourier rapides Self Consistent Field Proc dure it rative de r solution des quations Hartree Fock Compos s chimiques DMSO MetSO Msr Acides amin s Dim thylsulfoxyde Sulfoxyde de m thionine M thionine sulfoxyde r ductase Enzyme de r duction catalytique des sulfoxydes de m thionine Acide amin Code 3 lettres Code 1 lettre pK de la cha ne lat rale Alanine Ala A Arginine Arg R 12 48 Asparagine Asn N Aspartate Asp D 3 90 Cyst ine Cys C 8 18 Glutamate Glu E 4 07 Glutamine Gin Q Glycine Gly G E Histidine His H 6 04 Isoleucine lle Leucine Leu L Lysine Lys K 10 54 M thionine Met M E Ph nylalanine Phe F Proline Pro P S rine Ser S Thr onine Thr T Tryptophane Trp W Tyrosine Tyr Y 10 46 Valine Val V Lexique 271 OH OH Alanine Arginine Asparagine Aspartate OH HN Cyst ine Glutamate Glutamine Glycine Histidine Isoleucine Leucine Lysine M thionine Ph nylalanine Proline S rine 272 Lexique Thr onine Tryptophane Minuscules Aliphatiques
368. y function Fonctions pr d finies ga newOne Cr ation d individus Les nouveaux individus sont cr s par reproduction des parents s lectionn s ga newUnknown Cr ation d individus originaux Les nouveaux individus cr s par reproduction n ont jamais t produits dans les g n rations pr c dentes ga unknownSurvivor Cr ation d individus originaux et survie des parents Les nouveaux individus cr s par reproduction n ont jamais t produits dans les g n rations pr c dentes Les parents individus s lectionn s sont int gr s la nouvelle population ga oldSurvivor Cr ation d individus originaux survie et vieillissement des parents Les nouveaux individus cr s par reproduction n ont jamais t produits dans les g n rations pr c dentes Les parents individus s lectionn s sont int gr s la nouvelle population condition qu ils ne d passent pas une limite d ge Valeur par d faut ga unknownSurvivor 252 B Manuel utilisateur d ALGOGEN Gray Conversion en code Gray du code binaire des g nes e Bool en conditionnant la conversion en code Gray du code binaire des g nes Si Gray vaut True le code Gray est appliqu Les options Gray et Periodicity sont exclusives Il est impossible d appliquer ces deux options en m me temps options Gray boolean Valeur par d faut False B 2 5 Options de sortie OutputFile Fichier de sortie e Nom du fichier de sortie L affichage de sort
369. y du r sidu Cys51 est impliqu dans une liaison hydrog ne soit avec Glu94 Fig 6 4 a soit avec Tyr197 Fig 6 4 c mais l analyse d taill e de la trajectoire montre que la plupart du temps ce proton est solvat par une mol cule d eau Nous n avons pas observ de liaison hydrog ne notable entre Cys51 S et Glu94 H la distance reste sup rieure 4 tout au long de la trajectoire Fig 6 4 b Cet atome d hydrog ne forme une liaison hydrog ne avec une mol cule d eau du solvant pendant toute la dur e de la simulation L analyse des couches de solvatation montre que le r sidu Cys51 est globalement bien solvat par des mol cules d eau Fig 6 4 d On compte en moyenne 3 5 mol cules de solvant une distance inf rieure 3 4 Le r sidu Glu94 plus profond ment enfoui dans le site actif est moins solvat avec 1 mol cule d eau proximit distance 3 4 Fig 6 4 e La neutralit du r sidu Glu94 peut expliquer la l g re diminution de solvatation constat e par rapport la simulation pr c dente Par ailleurs il n existe plus de liaison hydrog ne entre celui ci et le r sidu Tyr134 ni avec Tyr82 Fig 6 4 f Dans cet tat de protonation donc une liaison hydrog ne faible se forme entre l hydrog ne H de Cys51 et l oxyg ne Og de Glu94 En comparaison avec l tat de protonation pr c dent les interactions sont globalement moins fortes ce qui n est pas tonnant compte tenu de la neutral
370. ymatique des sulfoxydes de m thionine L isom re S est r duit par les Mar de classe A MsrA et l isom re R par les Maer de classe B MsrB Les premi res vidences de l activit Msr ont t rapport es en 1979 par l quipe de Brot et Weissbach pour MsrA et en 2001 par l quipe de Grimaud et a pour MsrB 5 2 1 Implication physiologique des m thionine sulfoxyde r ductases L importance physiologique des Msr a t particuli rement document e au cours de ces dix der ni res ann es Sans entrer dans les d tails nous pr senterons ici diff rentes implications de ces enzymes et notamment leur r le dans la lutte contre le stress oxydant dans la r gulation de la fonction des prot ines et dans le vieillissement cellulaire a Lutte contre le stress oxydant La premi re mise en vidence de la fonction MsrA in vivo a t obtenue partir de l tude d une souche d Escherichia coli n exprimant plus l enzyme Cette souche pr sente une plus grande sen sibilit H202 Des tudes ult rieures ont confirm le fait que la d l tion ou l inactivation du g ne msrA implique une plus grande sensibilit des microorganismes l oxydation par les EOAT 208 Des r sultats obtenus chez les organismes eucaryotes sup rieurs sont en accord avec les obser 5 2 M thionine sulfoxyde r ductases 97 vations pr c dentes D autre part une surexpression de MsrA dans les lymphocytes T humains augmente la r sistance
371. yst me tudi a fait l objet d une phase d quilibration thermodynamique dans l en semble NPT avec l utilisation des conditions limites p riodiques Comme pour la minimisation lors de la mise en solution le protocole d quilibration a t con u afin de ne pas endommager la struc ture de l enzyme et la m me contrainte est appliqu e aux atomes lourds de l enzyme potentiel harmonique de 10 kcal mol par rapport la structure cristallographique Nous avons effectu une mont e en temp rature de 10 K 300 K par paliers de 50 K tous les 10 ps Le syst me est ensuite quilibr 300 K La pression est maintenue fixe 1 atm Nous avons produit ainsi un total de 200 000 pas de dynamique avec un pas d int gration de 0 5 fs soit 100 ps A la fin de cette tape nous v rifions que les grandeurs thermodynamiques et physiques des diff rents sys t mes sont voisines des valeurs cibles Nous obtenons par exemple une densit d environ 1 05 pour chaque simulation e Production des trajectoires Pour chacun des syst mes nous avons produit une trajectoire de 1 ns Le pas d int gration utilis est de 0 5 fs La temp rature est fix e 300 K et la pression 1 atm Nous sauvegardons les coor donn es et les vitesses tous les 200 pas soit toutes les 0 1 ps Nous avons calcul le RMS atomique de d viation de la chaine principale de l enzyme par rapport la structure cristallographique pour chaque pas sauvegard La valeur

Download Pdf Manuals

image

Related Search

Related Contents

Mémento IPSO RTS  American Standard 7005.901.002 Installation Guide  Mazda CX-9 Smart Start Guide  4784KB - Dynabook  

Copyright © All rights reserved.
Failed to retrieve file