Home

Effets des expansions des populations humaines en

image

Contents

1. b CD y 1 0 Paleolithic branches Neolithic branches Figure S6 Typic genealogical trees simulated under DD a and CD b 137 0 8 0 6 0 4 Allele frequency 0 2 0 8 0 6 0 4 Allele frequency 0 2 0 8 0 6 0 4 Allele frequency 0 2 SNP diversity in Europe after a range expansion y o 0 00 Ne 0 05 ag 010 ae Ole ia 10 25 o 0 50 Ke 0 75 1 00 Without ascertainment bias _ B Ascertainment bias 5 C Ascertainment bias 10 1 2 3 4 5 6 7 8 9 1011 12 13 14 15 16 17 18 19 20 Sout East Samples gt North West Figure S7 Mean linear regression of allele frequencies on geographic distances over 10 000 simulations with
2. 500 M1 M3 M4 400 Ee earrais aeeiio M2 300 z O 200 M1 M2 100 2 TET 0 0 50 100 150 Temps en g n rations Figure 4 7 Evolution de la densit des populations A en gris et B en noir pendant 150 g n rations selon 4 mod les d mographiques diff rents M1 M2 M3 M4 Apparition de 2 individus B au temps 0 alors que 100 individus A peuplent d j la cellule Ka 100 Kg 500 rc rg 0 1 La comparaison entre ces diff rents mod les Figure 4 7 lorsque Kg gt K4 qui est le cas particulier qui nous int resse dans ce travail montre que 56 1 Les modeles M3 et M4 sont quasiment identiques puisque la competition dependante de la densit M4 commence s exercer un moment o la densit Ng est tr s importante et donc OU Qag Se rapproche de 1 qui est la valeur fix e pour le mod le M3 2 Le temps de cohabitation des deux populations dans une cellule est plus faible pour les mod les qui ne comprennent pas de p riode de cohabitation forc e M1 et M2 Cependant la r duction de ce temps de cohabitation est nettement moins marqu e pour le mod le M2 que pour le mod le M7 Le mod le M2 est interm diaire entre le mod le M7 et les mod les M3 et M4 4 Seul le mod le M2 influence le temps de colonisation de la population B en le ralentissant En effet sous ce mod le la population qui arrive en second B dans la cellule reste plus longtemps de faibles
3. te ee ete ests ese Figure 2 Expected proportion of Neanderthal lineages in black among European samples under demographic scenario A Table 1 at different geographic locations for different interbreeding rates a 1 admixture event on average per 50 demes over the whole period of cohabitation between Neanderthals and modern humans b 1 event per 5 demes c 1 event per 2 demes d 1 event per deme 112 Absence of admixture between modern humans and Neanderthals Average admixture rate per deme 0 001 0 01 0 1 1 10 1 0 a ae ii D i i OUT Figure 3 Likelihood of different rates of interbreeding under the seven scenarios described in Table 1 The horizontal bold dashed line corresponds to 14 7 of the maximum likelihood defining the upper limit of a 95 confidence interval for the interbreeding rates e g 113 Absence of admixture between modern humans and Neanderthals Additional Figures 1 00 o A m B O 0 80 C O x S gt 0 60 E D Z 2g pa 2 0 40 e H Oo A 0 20 Q 2 A 0 00 Average number of admixture events per deme log scale Figure Sd Proportion of Neanderthal lineages in the European population as a function of the average number of admixture events per deme between HN and HS These values are given for the seven scenarios mentionned in the article A G and for a ne
4. tudier lors de nos analyses ult rieures Le mod le de comp tition M2 retenu pr sente l avantage de pouvoir tre utilis de mani re g n rale puisqu en fonction des valeurs de capacit de soutien utilis es il permet de simuler i la colonisation par B d une aire g ographique d j peupl e par A ii la mise en place d un quilibre d mographique entre A et B iii impossibilit pour A de coloniser une aire d j peupl e par B Ce mod le est donc id al pour tre utilis dans la simulation d un monde h t rog ne pour Ka et Kz dans lequel certaines r gions sont plus favorables en termes de densit l une ou l autre des populations Une application possible de ce mod le serait la simulation de la diffusion de l agriculture l chelle mondiale en tenant compte de la v g tation L conomie de pr dation pourrait tre consid r e comme avantag e par rapport l conomie de production dans certains 57 environnements sp cifiques comme la for t tropicale ou le d sert puisque ce sont des environnements dans lesquels le mode de vie chasseur collecteur a subsist jusqu nos jours alors qu il a disparu de la plupart des autres types d environnement p ex Jobling et al 2004 4 3 2 Migrations 4 3 2 1 Migrations intrapopulationnelles Pour simuler les migrations d individus entre d mes voisins et appartenant la m me population A ou B nous avons utilis un mod le qui consid re
5. Ce chapitre nous a permis de presenter le logiciel SPLATCHE ainsi que certaines de ses applications potentielles Il s agit d un logiciel g n raliste permettant de simuler une grande vari t de sc narios d mographiques et de donn es g n tiques associ es Il permet de visualiser de nombreux aspects de la g n alogie d un chantillon de g nes tir s d une population voir ANNEXE 3 Ce logiciel offre un grand int r t didactique puisqu il permet la compr hension des relations entre la d mographie d une population et sa diversit mol culaire De plus il offre de nombreuses perspectives que nous discuterons de mani re plus d taill e dans la conclusion finale de ce travail chapitre 8 Ce logiciel a t mis la disposition de la communaut scientifique par l interm diaire d un site web http cmpg unibe ch software splatche Bien que des extensions de la th orie de la coalescence aient t d velopp es dans le cas de populations subdivis es Notohara 1990 Marjoram et Donnelly 1994 Slatkin 1995 Rousset 1996 Wakeley 1999 2000 2001 Wakeley et Aliacar 2001 la r solution analytique de ces mod les devient probl matique lorsque la complexit des situations consid r es augmente SPLATCHE propose donc une alternative en offrant la possibilit de simuler des donn es g n tiques pour des situations d mographiques relativement complexes Dans le chapitre 3 nous pr sentons deux applications du logiciel SPLATC
6. Stringer C Davies W 2001 Archaeology Those elusive Neanderthals Nature 413 791 2 Stringer C B Andrews P 1988 Genetic and fossil evidence for the origin of modern humans Science 239 1263 8 Sykes B 1999 The molecular genetics of European ancestry Philos Trans R Soc Lond B Biol Sci 354 131 8 discussion 138 9 Taberlet P Fumagalli L Wust Saucy A G Cosson J F 1998 Comparative phylogeography and postglacial colonization routes in Europe Mol Ecol 7 453 64 Tajima F 1989a Statistical method for testing the neutral mutation hypothesis by DNA polymorphism Genetics 123 585 595 Tajima F 1989b The effect of change in population size on DNA polymorphism Genetics 123 597 601 Tattersall Schwartz J H 1999 Hominids and hybrids the place of Neanderthals in human evolution Proc Natl Acad Sci U S A 96 7117 7119 Thorpe I J 1999 The Origins of Agriculture in Europe Routledge New York Tills D Kopec A C 1983 The distribution of the human blood groups and other polymorphisms Oxford University Press Oxford Tolan Smith C 2003 The social context of landscape learning and the lateglacial early postglacial recolonization of the brithish isles In Rockman M Steele J eds Colonization of unfamiliar landscapes The archaeology of adaptation Routledge London pp 116 129 Torroni A Bandelt H J D Urbano L Lahermo P Moral P Sellitto D Rengo C Forster P Savontaus M L Bonne Tamir B Scozzar
7. Taberlet et al 1998 Hewitt 2000 It is therefore likely that the traces of recent spatial expansions could be found in many species other than humans in fact in all populations that would have gone through very small sizes during former ice ages spent in refuge areas from where they would have then reexpanded Interestingly the fact that some populations would have expanded from a refuge area would not only tell us something about their global dispersal abilities but could also bring important in formation on their recent rate of dispersal outside their demes Since the shape of the mismatch distribution and particularly the frequency of recent coalescent events depends on recent migration rates it should be possible to estimate emigration rates by sampling individuals from the same deme and examining their pattern of molecular diversity Applied to sex linked markers this could allow one to study potential sex biased dispersal and or different effective size between sexes An estimation procedure for Nm values inferred from a single sample drawn from a recently expanding population is currently under investigation and it will be the subject of a forthcoming paper Available methods for estimating levels of gene flow usually rely on the availability of a series of samples Gene flow is then inferred between demes from which the samples are supposed to be drawn see e g Beerli and Felsenstein 2001 This implies that sampled demes ac
8. Table 4 3 Intervalles des param tres utilis s K est donn en nombre de g nes efficaces port s par un syst me diploide et ren g n rations 4 5 3 Influence des param tres sur la diversit mol culaire Tout comme pour les simulations pr sent es dans la section 3 2 Ray et al 2003 et pour simuler des donn es proches de celles disponibles pour l ADN mitochondrial 1000 simulations d un chantillon de 30 s quences de 300 paires de base sont effectu es pour chaque sc nario d mographique simul Dans tous les cas l chantillon est pr lev dans la cellule centrale lt 25 25 gt afin d viter les l gers effets de bord observ s lorsque Nygm est petit voir section 3 2 Nous enregistrons la distribution des diff rences par paires de s quences distribution mismatch Rogers et Harpending 1992 Le taux de mutation utilis est gal a 0 001 et permet d obtenir des distributions mismatch du m me ordre de grandeur que celles observ es pour le g nome mitochondrial dans les populations humaines l chelle mondiale soit avec un mode attendu d environ 8 Excoffier et Schneider 1999 Nous avons premi rement proc d une s rie de simulations pour lesquelles la population AG remplace compl tement la population CC sans aucune hybridation y 0 La Figure 4 13 permet de visualiser les mouvements en remontant le temps d un chantillon de 30 g nes provenant du centre du monde On peut voir qu apr s une p
9. lt K K A Nate K N N Eq 4 12 na er siN gt K K K 3 K N No tut N Er rer B Selon ce mod le Kg est gale la capacit de soutien totale de la cellule Tant que Ng n a pas atteint la valeur Kg Ka aucune competition ne s exerce et la dynamique des deux populations s tablit selon une croissance logistique simple En revanche des que Nz atteint la valeur Kg Ka alors la competition interpopulationnelle entre en jeu et la dynamique des populations se fait selon le mod le de Lotka Volterra Figure 4 6 Lorsque Kg lt Ka ce mod le de cohabitation est identique au mod le de Lotka Volterra puisque la condition Ng gt Kg K est toujours respect e Dans ce cas l tat final est un quilibre entre les deux populations En revanche lorsque Kg gt Ka la population A dispara t Figure 4 6 500 E A E etes 2e D lee desc ed eds 1 alice scene tetes relie te este te li A ces te Rose ects dede el nt eee een EEES PAIESE SE EEIEIE IEN Kg AT e E EE AIOE Re ee ee ee ee eee eee Ka Ka Pas de 300 Comp tition comp tition oO Cc D a Ne 200 100 3 ee eee eee Ka 0 0 50 100 150 Temps en g n rations Figure 4 6 Evolution des densit s des populations A trait gris et B trait noir au cours du temps selon le mod le M3 Lotka Volterra avec taux de comp tition fix s comme dg 0 et aas 1 et temps de cohabitation forc e La population A dispara t car Kg gt
10. 1986 Simulation and separation by principal components of multiple demic expansions in Europe Am Nat 128 681 706 Renfrew C 1989 Archaeology and Language The Puzzle of Indo European Origins Penguin Books London Renfrew C 2000 Archaeogenetics Towards a Population Prehistory of Europe In Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeological Research University of Cambridge Cambridge pp 3 12 Renquin J Sanchez Mazas A Halle L Rivalland S Jaeger G Mbayo K Bianchi F Kaplan C 2001 HLA class II polymorphism in Aka Pygmies and bantu Congolese and reassessment of HLA DRB1 African diversity Tissue Antigens 58 211 222 Reynolds J Weir B S Cockerham C C 1983 Estimation for the coancestry coefficient basis for a short term genetic distance Genetics 105 767 779 Richards M Corte Real H Forster P Macaulay V Wilkinson Herbots H Demaine A Papiha S Hedges R Bandelt H J Sykes B 1996 Paleolithic and neolithic lineages in the European mitochondrial gene pool Am J Hum Genet 59 185 203 Richards M Macaulay V Hickey E Vega E Sykes B Guida V Rengo C et al 2000 Tracing European founder lineages in the Near Eastern mtDNA pool Am J Hum Genet 67 1251 76 Richards M Macaulay V Torroni A Bandelt H J 2002 In search of geographical patterns in European mitochondrial DNA Am J Hum Genet 71 1168 74 Richards
11. 4 5 2 1 Taux de croissance Les estimations du taux de croissance sont de trois types 1 comparaison avec des ethnies de chasseurs collecteurs ou d agriculteurs contemporains 2 estimations sur la base du peuplement du continent am ricain 3 croissance long terme pour passer de quelques milliers d individus il y a 100 000 ans quelques milliards aujourd hui Les estimations de la croissance globale de l esp ce humaine sur une longue p riode ne sont cependant pas comparables avec le taux de croissance d une population sur une courte dur e Sur une longue dur e une population passe en effet plus de temps capacit de soutien avec une croissance nulle qu en croissance Comme nous le verrons ci dessous les estimations sur le long terme sont g n ralement beaucoup plus faibles que celles effectu es sur un petit nombre de g n rations sans pour autant tre incompatibles Chasseurs collecteurs rcc Les estimations faites par comparaison avec des communaut s contemporaines de chasseurs collecteurs ont r v l un taux de croissance r pouvant aller jusqu 80 par g n ration dans ces populations Pennington 2001 Un taux de croissance aussi important est le maximum g n ralement admis pour l esp ce humaine Ammerman et Cavalli Sforza 1984 Young et Bettinger 1995 et serait caract ristique des populations qui colonisent des territoires inoccup s disposant de ressources abondantes Un tel taux de croissance n
12. 75 1 Distribution temporelle des coalesences 0 8 0 8 C1 0 6 0 6 2 a5 Nacem 17000 S 0 4 S04 oy D Fo LL PUL N N 0 1000 2000 3000 4000 0 1000 2000 3000 4000 Temps en g n rations 2 G n alogies Temps en g n rations 4 4 A 4 n S1 C1 C2 2 S1 C1 C2 Poe 3 Distribution Mismatch Double expansion o4 0 4 d i o Simple expansion 0 3 rob 0 3 1 0 90 O O Cc O O T 02 D 02 O D ee LL LL 0 1 4 0 1 4 0 BS Sa aaa mn te ne ene 0 7 0 2 4 6 8 10 12 14 16 18 20 0 2 4 6 8 10 12 14 16 18 20 Nombre de differences Nombre de diff rences Figure 4 14 Caract ristiques g n tiques obtenues apr s la simulation d une double expansion d mographique et spatiale Nacm est soit petit 10 colonne de gauche soit grand 1 000 colonne de droite 1 Distribution des coalescences au cours du temps 2 G n alogie de g nes chantillonn s 3 Distribution mismatch cercles noirs avec I C a 90 traitill et distribution mismatch moyenne obtenue dans le cas d une seule expansion en gris S1 C1 et C2 principales p riodes de coalescence voir texte 7 4 5 3 1 Influence de Nagm Tout comme dans le cas d une unique expansion spatiale section 3 2 un petit Nagm lt 50 provoque des coalescences r centes durant la scattering phase Wakeley 1999 pour laquelle nous utiliserons dor navant l abbreviat
13. For instance with as much as 2 admixture events per cell over the total coexistence period of Neanderthals and modern humans more than 95 of the current HS gene pool should be tracing back to Neanderthals for all scenarios with logistic demographic regulation described in Table 1 Scenarios A to F As shown on Figure 2 the proportion of current lineages that can be traced to Neanderthals is however not uniformly distributed over Europe in case 101 Absence of admixture between modern humans and Neanderthals of interbreeding A gradient is visible from the source of the range expansion which shows the largest proportion of modern human genes towards the margins of the expansion the British Isles and the Iberic peninsula which should then be expected to harbor a larger proportion of Neanderthal genes than the rest of Europe Figure 2 However this gradient is relatively weak and the proportion of HN lineages at any position is primarily affected by the degree of admixture between the two populations Estimation of admixture rates The present results show that if Neanderthals could freely breed with modern humans their contribution to our gene pool would be immense Since no Neanderthal mtDNA sequence has been observed so far among present Europeans it is of interest to estimate the maximum admixture rate between Neanderthals and modern humans that would be compatible with an absence of Neanderthal genes accounting for the curren
14. Pascali V Barbujani G 1998 Clines of nuclear DNA markers suggest a largely neolithic ancestry of the European gene pool Proc Natl Acad Sci U S A 95 9053 8 Chikhi L Bruford M W Beaumont M A 2001 Estimation of admixture proportions a likelihood based approach using Markov chain Monte Carlo Genetics 158 1347 62 Chikhi L 2002 Admixture and the demic diffusion model in Europe In Bellwood P Renfrew C eds Examining the farming language dispersal hypothesis McDonald Institute Monographs Cambrigs pp 435 447 Chikhi L Nichols R A Barbujani G Beaumont M A 2002 Y genetic data support the Neolithic demic diffusion model Proc Natl Acad Sci U S A 99 11008 13 Clark J G D 1965 Radiocarbon dating and thee expansion of farming culture from the Near East over Europe Proc prehist Soc 31 58 73 Coale A J 1974 The history of the human population Scientific American 231 40 51 Cockerham C 1969 Variance of gene frequenceies Evolution 23 72 84 Cockerham C 1973 Analyse of gene frequencies Genetics 7174 679 700 Comas D Calafell F Mateu E Perez Lezaun A Bertranpetit J 1996 Geographic variation in human mitochondrial DNA control region sequence the population history of Turkey and its relationship to the European populations Mol Biol Evol 13 1067 77 Comas D Calafell F Mateu E Perez Lezaun A Bosch E Bertranpetit J 1997 Mitochondrial DNA variation and the origin of the Europeans Hum Genet
15. lt K Q les deux populations subissent une comp tition interpopulationnelle plus forte que la competition intrapopulationnelle La population avec l effectif initial le plus grand va pousser l autre population l extinction 4 Si K gt K a et K gt K a les deux esp ces subissent une comp tition intrapopulationnelle plus forte que la comp tition interpopulationnelle qui s exerce entre elles Un quilibre stable s tablit alors Nous reviendrons plus tard sur ces 4 cas g n raux en fonction des diff rents mod les sp cifiques que nous allons d crire ll faut relever que l tat final du syst me ne d pend que des variables K et a mais pas de r puisque ce facteur influence seulement la rapidit avec laquelle l tat final se met en place 4 3 1 3 Mod les de comp tition d velopp s Nous avons jusqu pr sent fait une revue du mod le de Lotka Volterra tel qu il est d crit dans la litt rature Sur cette base nous avons d velopp quatre mod les diff rents de comp tition qui peuvent s appliquer sp cifiquement au remplacement des N andertaliens et la transition n olithique en Europe Nous allons les d crire puis les comparer Mod le M1 Taux de comp tition fix s Dans la situation sp cifique pour laquelle une des deux populations dispara t au cours du temps nous pouvons raisonnablement penser que la comp tition interpopulationnelle est asym trique L hypoth se de base est que dans
16. 02 02 CN D Aig Er BEAGE Teee ae a ET IT 4 0 2 4 6 8 10 12 14 16 18 20 ae 0 T TT TT q 0 2 4 6 8 10 12 14 16 18 20 125 5 AA E HA 4 D t 5 e 0 2 4 6 8 10 12 14 16 18 2 Fic 7 Observed mismatch distributions after a spatial and an optional demographic expansion Cases A through F correspond to demographic histories defined in table 4 A Demes with constant K 1 000 B Demographic growth from K 100 to K 1 000 occurring 500 generation before present C Same as B but demographic growth occurring 100 generations before present D Same as B but demographic growth occurring 50 generations before present E Same as B but demographic growth occurring 10 generations before present F Demes with constant K 100 25 diversity show a very similar trend table 4 with de mographic expansions having occurred more than 50 gen erations ago resulting in a clear rejection of neutrality and population equilibrium with Tajima s D or Fu s Fs statistic These simulations clearly show that relatively recent demographic expansions leading to overall larger Nm values lead to patterns of molecular diversity equivalent to those expected in demes having always exchanged large numbers of individuals with their neighbors It thus seems that the Nm value prevailing during the scattering phase sensu Wakeley 1999 of the
17. 5 No bias Freq R 0 03 0 50 0 03 0 47 0 03 0 45 0 04 0 42 0 03 0 42 0 02 0 43 0 02 0 40 0 02 0 40 0 02 0 40 Freq 0 57 0 48 0 50 0 51 0 66 0 71 0 70 0 68 0 68 R 0 60 0 54 0 56 0 58 0 59 0 58 0 58 0 59 0 58 y rate of gene flow between HG and F demes Minimum 0 no gene flow and maximum 1 0 PL Average number of Paleolithic lineages incorporated per deme Sand Colonization time of Europe by Paleolithic and Neolithic range expansions respectively Mean cohabitation time in generation between HG and F within a deme Bias 10 Freq 0 56 0 45 0 51 0 78 0 86 0 82 0 82 0 80 0 78 R 0 62 0 58 0 63 0 70 0 71 0 68 0 67 0 63 0 66 f Average Neolithic contribution to the current European genetic pool see text over 10 000 simulations standard deviation are shown in italic I Freq proportion of simulation over 10 000 that show a significant AFC at the 5 significance level R average determination coefficient for the significant AFCs Only one population is simulated Time for cultural diffusion over whole Europe 132 SNP diversity in Europe after a range expansion Figure 1 Spatial and temporal dynamics of the location of ancestral lineages under a double Neolithic and Paleolithic range expansion from the Near East The six panes a to f show the location of ancestral lineages and the area occupied by Neolithic layer F in dark
18. Genetics 129 555 562 Sokal R R N L Oden and C Wilson 1991 Genetic evidence for the spread of agriculture in Europe by demic diffusion Nature 351 143 145 86 Ray et al Strobeck K 1987 Average number of nucleotide differences in a sample from a single subpopulation a test for population subdivision Genetics 117 149 153 Taberlet P L Fumagalli A G Wust Saucy and J F Cosson 1998 Comparative phylogeography and postglacial coloniza tion routes in Europe Mol Ecol 7 453 464 Tajima F 1989 Statistical method for testing the neutral mutation hypothesis by DNA polymorphism Genetics 123 585 595 Wakeley J 1999 Nonequilibrium migration in human history Genetics 153 1863 1871 2000 The effects of subdivision on the genetic divergence of populations and species Evolution 54 1092 1I 101 2001 The coalescent in an island model of population subdivision with variation among demes Theor Popul Biol 59 133 144 Wakeley J and N Aliacar 2001 Gene genealogies in a metapopulation Genetics 159 893 905 28 Wakeley J R Nielsen S N Liu Cordero and K Ardlie 2001 The discovery of single nucleotide polymorphisms and infer ences about human demographic history Am J Hum Genet 69 1332 1347 Watson E K Bauer R Aman G Weiss A von Haeseler and S Paabo 1996 mtDNA sequence diversity in Africa Am J Hum Genet 59 437 444 Weiss G A Henking and
19. Haploid chromosomes in molecular ecology lessons from the human Y Mol Ecol 10 1599 613 Hurles M E Nicholson J Bosch E Renfrew C Sykes B C Jobling M A 2002 Y chromosomal evidence for the origins of oceanic speaking peoples Genetics 160 289 303 Hurles M E Maund E Nicholson J Bosch E Renfrew C Sykes B C Jobling M A 2003 Native american y chromosomes in polynesia the genetic impact of the polynesian slave trade Am J Hum Genet 72 1282 7 Hyden B 1990 J Anthrop Archaeol 9 31 Jackes M Lubell D Meiklejohn C 1997 Healthy but mortal human biology and the first farmers of western Europe Antiquity 71 639 658 Jeunesse C 1998 La n olithisation de l Europe occidentale VIle Ve mill naires av J C nouvelles perspectives In Cupillard C Richard A eds Les derniers chasseurs cueilleurs du massif jurassien et de ses marges Centre Jurassien du patrimoine Lons le Saunier Jobling M A Hurles M E Tyler Smith C 2004 Human evolutionary genetics origins peoples and disease Garland Science New York Jorde L B Bamshad M J Watkins W S Zenger R Fraley A E Krakowiak P A Carpenter K D Soodyall H Jenkins T Rogers A R 1995 Origins and affinities of modern humans a comparison of mitochondrial and nuclear genetic data Am J Hum Genet 57 523 38 Kaessmann H Zollner S Gustafsson A C Wiebe V Laan M Lundeberg J Uhlen M Paabo S 2002 Extensive linkage disequilibrium in small
20. Ka 99 Mod le M4 Cohabitation forc e puis comp tition avec taux d pendants de la densit Le mod le de cohabitation forc e M3 peut galement tre impl ment avec des taux de competition qui d pendent des densit s Tout comme pour le mod le M3 aucune competition ne s exerce lorsque Ns est inf rieur au seuil Kg Ky Une fois ce seuil atteint les deux populations entrent en comp tition A la diff rence du mod le M3 les taux de comp tition ne sont pas fix s mais d pendent des densit s respectives des deux populations et sont d finis par l quation 4 11 tout comme pour le mod le M2 Avec ce mod le lorsque Kg lt Ky ce mod le de cohabitation est identique au mod le de Lotka Volterra puisque la condition Ng gt Kg Ka est toujours respect e et par cons quent la population B ne peut pas s tablir dans la cellule et dispara t Un quilibre stable s installe lorsque Kg Ka alors que la population A dispara t si Kg gt Ka Figure 4 6 4 3 1 4 Comparaison entre les mod les de comp tition proposes Dans la section pr c dente 4 3 1 3 nous avons d fini 4 mod les d mographiques M1 M4 qui d crivent l volution au cours du temps de deux populations en competition pour les m mes ressources Il importe maintenant de comparer ces 4 mod les entre eux afin de s lectionner le ou les plus adapt s nos recherches et ainsi de r duire le nombre de simulations effectuer ult rieurement
21. Puisque l importance du biais de recrutement pour le chromosome Y est inconnue il est donc impossible de comparer directement les distributions mismatch observ es l aide de ce marqueur avec celles observ es pour le g nome mitochondrial dont les donn es sont constitu es de s quences compl tes Nous pouvons cependant souligner les ressemblances qui existent entre les distributions mismatch mitochondriales des populations Saamis Figure 3 6 et les distributions tir es du chromosomes Y pour l ensemble des populations europ ennes Figure 3 4 Les Saamis sont des chasseurs collecteurs dont l histoire d mographique est diff rente de celle des populations agropastorales du reste de l Europe Sajantila et Paabo 1995 Laan et Paabo 1997 Kaessmann et al 2002 ce qui peut tre traduit par un faible Nm dans ces populations Ray et al 2003 Cette observation est un argument suppl mentaire en faveur de l hypoth se selon laquelle le Nm de la lign e masculine europ enne est faible m me dans les populations post n olithiques 0 4 Fr quence Diff rences e Saami Inari A Saami Skolt m Saami Norrbotten o Saami Karasjok Figure 3 6 Distributions mismatch mitochondriales observ es ind pendamment dans 4 chantillons de Saami provenant de Finlande Inari et Skolt Sajantila et al 1995 de Suede Norrbotten Sajantila et al 1995 et de Norv ge Karasjok Delghandi
22. Young D A amp Bettinger R L Simulating the global human expansion in the late pleistocene Journal of Archaeological Science 22 89 92 1995 Richards M et al Paleolithic and neolithic lineages in the European mitochondrial gene pool Am J Hum Genet 59 185 203 1996 Currat M Ray N amp Excoffier L SPLATCHE A program to simulate genetic diversity taking into account environmental heterogeneity Molecular Ecology Notes 4 139 142 2004 Kalbfleisch J G Probability and Statistical Inference 360 Springer Verlag New York 1985 116 6 Expansion des populations neolithiques en Europe 6 1 Introduction La structure g n tique des populations europ ennes est modifi e par les nombreux facteurs dont nous avons deja parl en introduction du chapitre 2 et elle peut potentiellement porter la trace d v nements d mographiques majeurs Menozzi et al 1978 Sokal 1991b Barbujani et al 1995 Barbujani et Bertorelle 2001 Si la position g ographique des populations europ ennes ainsi que les barri res g ographiques qui les s parent jouent vraisemblablement un r le plus important que leurs affinit s linguistiques Sokal 1988 Sokal et al 1988 Barbujani et Sokal 1991 Barbujani et al 1996 voir aussi Hurles et al 1999 Rosser ef al 2000 Bosch et al 2001 Stefan et al 2001 Brion et al 2003 il semble tout de m me qu l chelle continentale elles portent certaines traces g n tiques d une histoi
23. aide du programme SPLATCHE nous simulons la diffusion spatiale d une population dans une matrice de d mes homog nes a partir d un seul deme source selon diff rents param tres d mographiques Le but de ces simulations est d tudier la signature g n tique observ e dans une population subdivis e en expansion et de la comparer avec celle attendue apres une croissance d mographique dans une population non subdivis e Dans cette tude nous montrons que la g n alogie d une population ne d pend pas seulement de l ge de son expansion mais galement du flux g nique qui existe entre les demes qui la constituent Ce flux migratoire est mesure par le produit Nm qui est le nombre de migrants chang s entre demes lorsque l quilibre d mographique est atteint ou N correspond a la densit d un deme et m la proportion de migrants chang s entre d mes voisins Deux types de signatures g n tiques distincts sont observ s en fonction de l importance du flux migratoire Lorsque Nm est faible moins de 20 individus chang s entre d mes voisins l quilibre de 1 La distribution mismatch correspond la distribution du nombre de diff rences entre paire de sequences d ADN provenant d une population donn e nombreuses coalescences sont tr s r centes et se d roulent dans la r gion dans laquelle a eu lieu l echantillonnage article 3 2 1 Figure 1 Cela refl te des liens de parent r cents entre les
24. d finissant la ree topologie de l arbre de coalescence Liste dynamique de pointeurs vers les noeuds courants Figure 9 11 Sch ma des objets principaux et de leurs relations pour le module g n tique de SPLATCHE Les noms des classes des objets sont en italiques Voir le texte pour les explications 185 TDeme La classe 7Deme est l quivalent g n tique de la classe Cell En effet si Cell repr sente les caract ristiques physiques d une aire g ographique donn e TDeme repr sente la population qui peuple cette aire Par cons quent il existe un objet 7Deme par objet Cell et des pointeurs permettent d acc der directement de l un l autre 7Deme contient notamment une liste des lignages qui se trouvent dans la cellule au temps courant pendant la simulation g n tique TNodeList TNodeList est une liste dynamique de pointeurs vers les TNode appartenant Ttree Cette liste est mise jour lors de chaque g n ration en fonction du mouvement des lignages au cours du temps SPLATCHE est bien videmment constitu de nombreuses autres classes et fonctions que nous ne d crirons pas ici Il nous semble cependant important de mettre en avant la complexit de ce logiciel dont la r alisation a demand plus de trois ans de travail un groupe de 3 personnes Il a fallu une coordination importante afin d optimiser l efficacit du logiciel en fonction des contraintes informatiques mais galement de celles impos es
25. es environnementales pass es r alis e par le Dr Nicolas Ray l outil principal d velopp fut le logiciel de simulation SPLATCHE Ce programme pr sent au chapitre 2 permet de simuler la fois la d mographie et la g n tique Le projet Friction attribu au Pr Laurent Excoffier a t financ par le Fond National Suisse pour la Recherche Scientifique entre 1999 et 2003 Fond n 31 054059 98 SPatiaL And Temporal Coalescences in Heterogeneous Environment anciennement appel FRICTION notamment dans Ray 2003 d une population voluant dans une aire d finie en utilisant au maximum la puissance informatique disponible Comme l a soulign Nicolas Ray 2003 dont la these doit tre consid r e comme compl mentaire a la n tre la grande difficulte du projet Friction a t de trouver le meilleur compromis entre un mod le suffisamment r aliste pour simuler de fa on convaincante les processus d sir s et un mod le suffisamment simple pour permettre leur compr hension En effet l augmentation de la complexit d un mod le n est pas un gage de l apport d informations suppl mentaires puisque l incertitude autour de nouveaux param tres ne fait qu augmenter celle qui existe autour des r sultats obtenus M me si notre programme a t d velopp afin d tudier la dispersion des hommes modernes dans le monde nous l avons con u de fa on tr s g n rale afin qu il puisse tre ult rieurement
26. n tique n olithique Contrairement ce qui avait t propos pr alablement Ammerman et Cavalli Sforza 1984 Rendine et al 1986 Barbujani et al 1995 un remplacement complet ou presque complet des chasseurs collecteurs pendant le N olithique n est pas n cessaire la pr sence de ces gradients Par contre l observation de ces gradients est fortement d pendante de l ge des mutations tudi es et par cons quent du type de donn es mol culaires utilis Nos simulations montrent en effet que plus une mutation est ancienne et plus sa probabilit d tre distribu e sous forme de gradient le long de l axe de diffusion d une expansion augmente Cette observation explique pourquoi le g nome mitochondrial ne permet pas l observation de gradients alors que les autres syst mes chromosome Y nucl aires le peuvent En effet les marqueurs mol culaires types sur le chromosome Y et les autosomes SNPs et STRs ainsi que les marqueurs classiques sont sujets a un important biais de recrutement Rogers et Jorde 1996 auquel chappe le g nome mitochondrial qui est principalement tudi sur la base de s quences d ADN completes Ce biais de recrutement provoque la sous representation des mutations r centes dans 1 Voir la page 182 pour une definition du biais de recrutement ou ascertainment bias en anglais 120 les donn es et par consequent une augmentation de la proportion de mutations qui montrent des gradien
27. population is spread over neighboring demes until all the individuals are placed in a deme The overflow function fills a deme at carrying capacity before using neighboring demes If this checkbox is switched off the size of the initial population is always the size sets in the initial density file see chapter 3 4 1 3 3 3 Environment related parameters Radio button allowing to choose how the friction values are computed When vegetation or roughness is chosen friction values are only computed from the corresponding input data set see chapter 3 4 3 If both is chosen friction values are computed by taking for each deme the mean value between the friction value from the vegetation data set and the friction value from the roughness data set Button allowing to open the friction corresponding table see chapter 3 4 4 for a description of this table in the default text editor The file can then be modified and saved The world must be rebuilt after a change in this file for a description of this table in the default text editor The file can then be modified and saved The world must be rebuilt after a change in this file a Button allowing to open the carrying capacity corresponding table see chapter 3 4 4 CheckBox allowing a dynamic simulation see chapter 3 4 4 The world must be rebuilt after a change in this checkbox 3 3 4 Output parameters Some output parameters are placed in this panel because they need to be set
28. ration Dans les autres tudes y est un param tre fix et l amplitude des migrations interpopulationnelles hybridation est tr s restreinte 4 Aucun des mod les existants ne permet de simuler de la comp tition entre les deux populations voir section 4 2 La disparition de ne se faisait que sous l effet de l assimilation et de ce fait la p riode de contact entre les deux populations tait extr mement longue voire infinie ce qui ne nous paraissait pas tr s r aliste De plus l impl mentation de notre mod le d mographique dans une version modifi e de SPLATCHE voir ANNEXE 4 offre galement les avantages suivants 5 Une plus grande souplesse quant la variation des param tres En effet l utilisation de la coalescence alli e la puissance informatique dont nous b n ficions l heure actuelle notamment gr ce au cluster de 40 machines du CMPG permet d explorer l espace des valeurs de param tres possibles dans un laps de temps raisonnable Ceci est particuli rement important du fait que la plupart des variables d mographiques des populations r elles sont tr s mal connues voir section 4 5 2 L incertitude autour de la pertinence du mod le et surtout des valeurs des param tres est donc compens e en partie par une exploration intensive de l espace des r sultats possibles De mani re g n rale l effet de la variation des diff rents param tres sur les r sultats est tr s peu tudi dans les tudes
29. rente lorsque l hybridation est tr s faibles ou nulle y lt 0 1 La Figure 4 22 pr sente les distributions mismatch obtenues avec les m mes param tres que celles illustr es par la Figure 4 21 mais cette fois dans le cadre d une expansion r cente de la population CC 1 600 g n rations Lorsque y lt 0 1 la distribution mismatch moyenne est unimodale et le 88 mode centre sur la classe O dispara t Les valeurs des petites classes sont toutes relativement importantes et il n est plus possible d observer de distribution mismatch moyenne bimodale Lorsque lhybridation est importante y gt 0 1 alors des distributions mismatch unimodales sont observ es dans tous les cas quelque soit le taux de mutation 1 ou le cadre temporel x utilis Dans le cas d un remplacement important des chasseurs collecteurs chacun des deux modes est la signature d une expansion d mographique diff rente le premier mode a gauche est la signature de l expansion n olithique et le second celle de l expansion pal olithique Figure 4 23A Lorsque ces deux expansions sont tres proches temporellement comme c est le cas avec une expansion pal olithique il y a 1 600 g n rations il n est plus possible de discerner leur signature dans les distributions mismatch moyennes voir Figure 4 23B ll faut donc faire tres attention a l interpr tation de la forme des distributions mismatch dans les populations reelles Non seulement leur varian
30. rie Nccm 10 Nagm 1000 rcc 0 3 rac 0 5 et m 0 1 goulet constitu de 9 d mes la place d un seul 81 G n ration O G n ration 100 G n ration 200 G n ration 250 G n ration 300 G n ration 350 G n ration 400 G n ration 500 G n ration 2 000 G n ration 3 800 G n ration 3 950 G n ration 4 000 Figure 4 19 Occupation du monde gris claire occupation par CC gris fonc occupation par AG noir occupation par CC et AG Rose d me de la population AG dans lequel se trouve au moins un g ne Rouge deme de la population CC dans lequel se trouve au moins un g ne 4 5 3 5 Influence du taux d hybridation y Lorsque des migrations interpopulationnelles hybridation sont simul es depuis les chasseurs collecteurs vers les agriculteurs CC gt AG la proportion de g nes chantillonn s dont les anc tres sont issus du deme source de la population AG les genes n olithiques diminue de fa on exponentielle avec l augmentation de y Figure 4 20 Cette diminution est d autant plus importante que l echantillonnage est fait en p riph rie de la source de la population n olithique Localement il y a toujours au moins 5 des g nes qui sont issus de la population n olithique originale m me lorsque le taux d hybridation est son maximum y 1 Ces observations sugg rent que si le patrimoine g n tique europ en actuel est compos d une large fraction de g n
31. s Fs statistic will show very significant negative values after a spatial expansion only in demes with high Nm values In the context of human evolution this difference could explain very simply the fact that analyses of samples of mitochondrial DNA sequences reveal multimodal mismatch distributions in hunter gatherers and unimodal distributions in post Neolithic populations Indeed the current simulations show that a recent increase in deme size resulting in a larger Nm value is sufficient to prevent recent coalescent events and thus lead to unimodal mismatch distributions even if deme sizes and therefore Nm values were previously much smaller The fact that molecular diversity within deme is so dependent on recent levels of gene flow suggests that it should be possible to estimate Nm values from samples drawn from a single deme Introduction The connection between the past history of a pop ulation and its neutral genetic diversity has become obvious with the advent of coalescent theory Kingman 1982a 1982b Hudson 1990 Nordborg 2001 Although coalescent theory was initially developed in the context of a single population it has been rapidly extended to include subdivided populations or populations connected by migration the structured coalescent Notohara 1990 Marjoram and Donnelly 1994 Slatkin 1995 Rousset 1996 1997 Nordborg 1997 Wilkinson Herbots 1998 Wakeley 1999 2000 2001 Wakeley and Aliacar 2001 Past theoretical stu
32. 1953 De plus deux matrices de d mes sont superpos es elles repr sentent respectivement la population AG ou la population CC Des migrations sont possibles entre d mes appartenant des populations diff rentes si leur localisation est identique dans leur matrice respective Tous les demes de la population CC sont peupl s au d part puis c est au tour de la population AG de coloniser tous les d mes de la seconde matrice partir de six d mes sources localis s au Proche Orient Lors de chaque g n ration la d mographie des populations CC et AG se fait selon trois tapes 1 R gulation d mographique de chacune des deux populations dans chaque d me selon une croissance logistique d finie par l quation Nea Nyy ly Ny CN IK Eq 4 1 X t 1 X Xt o Ny est la taille de la population X avec X CC ou AG la g n ration t et rx son taux de croissance Ky est la capacit de soutien du deme pour la population X soit le nombre maximum d individus qui peuvent vivre simultan ment dans un d me en fonction des ressources disponibles 2 Migrations intrapopulationnelles vers les 4 d mes voisins selon un taux m fixe 3 Incorporation de S individus CC dans la population AG migrations interpopulationnelles appel es acculturation selon l quation S y7N N Eq 4 2 CCt 1 AG t 1 Le nombre de migrants interpopulationnels S est simplement fonction du produit des densit s de AG et de CC ain
33. 2002 Nichols R A amp Hewitt G M The genetic consequences of long distance dispersal during colonization Heredity 72 312 317 1994 Chikhi L Nichols R A Barbujani G amp Beaumont M A Y genetic data support the Neolithic demic diffusion model PNAS 99 11008 11013 2002 Edmonds C A Lillie A S amp Cavalli Sforza L L Mutations arising in the wave front of an expanding population PNAS 101 975 979 2004 Bernatchez L Glemet H Wilson C C amp Danzmann R G Introgression and fixation of Arctic char Salvelinus alpinus mitochondrial genome in an allopatric population of brook trout Salvelinus fontinalis Canadian Journal of Fisheries and Aquatic Science 52 179 185 1995 Shaw K L Conflict between nuclear and mitochondrial DNA phylogenies of a recent species radiation What mtDNA reveals and conceals about modes of speciation in Hawaiian crickets Proc Natl Acad Sci US A 99 16122 16127 2002 Ruiz Pesini E Mishmar D Brandon M Procaccio V amp Wallace D C Effects of Purifying and Adaptive Selection on Regional Variation in Human mtDNA Science 303 223 226 2004 Mishmar D et al Natural selection shaped regional mtDNA variation in humans PNAS 100 171 176 2003 Chikhi L Admixture and the demic diffusion model in Europe in Examining the farming language dispersal hypothesis eds Bellwood P amp Renfrew C 435 447 McDonald Institute Monographs Cambrigs 2002 115 33
34. 50 demes A and B Dynamics of the spatial expansion showing the progressive colonization of demes with the spatial expansion starting from the central deme Each shade of gray denotes the limit of the area of occupied demes after a further 100 generation step The central white cross is the state of the expansion after just one generation and D Empirical spatial distribution of the coalescence events obtained from 1 000 simulations of the genealogies of 30 genes sampled in a single deme in the lower left periphery deme at position lt 5 5 gt of the population Gray intensity is related to the total number of coalescent events having occurred in a given cell Cells where no coalescent events occurred are shown in white E and F Empirical ume distribution of the coalescence events obtained from 1 000 simulations Time before present is represented on the X axis In A C and E the number of migrants exchanged between neighboring demes is lower Nm 10 than in B D and F Nm 500 In all cases m is set to 0 1 Nm values see fig 1E and F the total length of the gene genealogy is much larger for samples of genes drawn from a deme with high Nm than those drawn from demes with small Nm The difference in the timing of coalescence events and the overall shape and length of genealogies of genes drawn from demes with low or high Nm values can 21 Molecular Diversity in Spatially Expanding Populations 79 be seen in figure 2
35. 58 1033 41 Rosser Z H Zerjal T Hurles M E Adojaan M Alavantic D Amorim A Amos W et al 2000 Y chromosomal diversity in Europe is clinal and influenced primarily by geography rather than by language Am J Hum Genet 67 1526 43 Rousselet F Mangin P 1998 Mitochondrial DNA polymorphisms a study of 50 French Caucasian individuals and application to forensic casework Int J Legal Med 111 292 8 Rousset F 1996 Equilibrium values of measures of population subdivision for stepwise mutation processes Genetics 142 1357 1362 Roychoudhury A K Nei M 1988 Human Polymorphic Genes World Distribution Vol 1 New york Oxford Sagart L Blench R Sanchez Mazas A 2004 The Peopling of East Asia putting together Archaeology Linguistics and Genetics RoutledgeCurzon London Sajantila A Lahermo P Anttinen T Lukka M Sistonen P Savontaus M L Aula P Beckman L Tranebjaerg L Gedde Dahl T Issel Tarver L DiRienzo A Paabo S 1995 Genes and languages in Europe an analysis of mitochondrial lineages Genome Res 5 42 52 Sajantila A Paabo S 1995 Language replacement in Scandinavia Nat Genet 11 359 60 Sajantila A Salem A H Savolainen P Bauer K Gierig C Paabo S 1996 Paternal and maternal DNA lineages reveal a bottleneck in the founding of the Finnish population Proc Natl Acad Sci U S A 93 12035 9 Sanchez Mazas A 1990 Polymorphisme des syst mes immunologiques Rh sus GM et HLA et histoir
36. 8 9 1011 12 13 14 15 16 17 18 19 20 Sout East Samples gt North West Figure 3 Proportion of Neolithic lineages in every sample from the Near East 1 to the North West 20 of Europe for rates of gene flow between HG and F y 134 SNP diversity in Europe after a range expansion 0 5 0 5 a Turkey b Germany 0 4 4 04d o N DD y 0 0 if DD y 0 0 a 0 3 a 0 3 J 0 2 J 0 2 0 1 DAS o o o 2 4 6 8 10 12 14 o 2 4 6 8 10 12 14 Number of differences Number of differences ox ss DOC CE RE a amp DO 7 0 5 f 0 5 5 c Turkey d Germany 0 4 0 4 s CD y 1 0 me CD y 1 0 2 0 3 2 0 3 S S foy fox 0 2 0 2 LL LL 0 1 0 1 0 i 0 e 0 2 4 6 8 10 12 14 0 2 4 6 8 10 12 14 Number of differences Number of differences L Ea An PA Figure 4 Expected mismatch distributions obtained from 10 000 genetic simulations of 300 bp DNA sequences for samples located in Turkey and in Germany without or with maximum genetic flow between HG and F Dashed lines correspond to the limits of a 90 confidence interval for the mismatch
37. A von Haeseler 1997 Distribution of pairwise differences in growing populations Pp 81 95 in P Donnely and S Tavar eds Progress in population genetics and human evolution Springer Verlag New York Wilkinson Herbots H M 1998 Genealogy and subpopulation differentiation under various models of population structure J Math Biol 37 535 585 Naruya Saitou Associate Editor Accepted September 13 2002 3 3 Signature d une expansion spatiale dans les donnees moleculaires de type SNP Comme nous l avons vu dans la section pr c dente 3 2 la distribution mismatch pr sente une forme diff rente lorsqu elle est tir e d une population ayant pass par une croissance d mographique et lorsqu elle est tir e d une population stationnaire Rogers et Harpending 1992 Harpending et al 1993 Harpending 1994 Cette statistique a t abondamment utilis e pour tudier le genome mitochondrial des populations humaines Di Rienzo et Wilson 1991 Bertranpetit et al 1995 Sajantila et al 1995 Calafell et af 1996 Comas et al 1996 Corte Real et al 1996 Francalacci et al 1996 Comas et al 2000 Malyarchuk et Derenko 2001 Nasidze et Stoneking 2001 puisque celles ci sont principalement compos es de s quences d ADN pour lesquelles cette approche a t d velopp e Le g nome mitochondrial tant transmis uniquement par voie maternelle il ne donne des informations que sur la d mographie de la lign e f minine Il
38. B En effet lorsque les migrations intrapopulationnelles se font avant la r gulation le nombre de migrants intrapopulationnels est par cons quent l g rement plus faible Ces diff rences peuvent tre consid r es comme n gligeables 4 3 3 2 Simulation typique de l volution de deux populations dans la m me aire La Figure 4 8 pr sente une simulation typique de l expansion d une population dans une aire d j peupl e Il s agit de la diffusion d une population A au temps 0 depuis le centre d un monde carr virtuel constitu de 50 cellules de c t Apr s 500 g n rations 100 individus sont tir s de la population pour constituer la population B dans la cellule centrale IlI s ensuit une expansion de la population B coupl e une extinction progressive de la population cause de la comp tition 61 interpopulationnelle Il est int ressant de noter qu un front d expansion circulaire d avancee des individus B s tablit autour du centre de l expansion Puis une seconde vague circulaire d extinction des individus A est observ e l g rement en retrait de la premiere C est pendant la p riode situ e entre ces deux vagues d expansion que se trouve la p riode de cohabitation entre les deux populations la bande noire dans la Figure 4 8 C est uniquement pendant cette p riode de cohabitation que de l hybridation peut avoir lieu La Figure 4 9 illustre pour la m me simulation l volution des densit s dan
39. Chech M Teschler Nicola M Paunovic M Mennecier P Hofreiter M Possnert G G Paabo S 2004 No Evidence of Neandertal mtDNA Contribution to Early Modern Humans PLoS Biol 2 E57 Sgaramella Zonta L Cavalli Sforza L 1973 A methode for the detection of a demic cline In Morton NE ed Genetic structure of population Population Genetics Monograph 3 University of Hawaii Press Honolulu HI Shastry B S 2002 SNP alleles in human disease and evolution J Hum Genet 47 561 6 Shaw K L 2002 Conflict between nuclear and mitochondrial DNA phylogenies of a recent species radiation What mtDNA reveals and conceals about modes of speciation in Hawaiian crickets Proc Natl Acad Sci U S A 99 16122 16127 Shen P Wang F Underhill P A Franco C Yang W H Roxas A Sung R Lin A A Hyman R W Vollrath D Davis R W Cavalli Sforza L L Oefner P J 2000 Population genetic implications from sequence variation in four Y chromosome genes Proc Natl Acad Sci U S A 97 7354 9 Shen P Buchholz M Sung R Roxas A Franco C Yang W H Jagadeesan R Davis K Oefner P J 2002 Population genetic implications from DNA polymorphism in random human genomic sequences Hum Mutat 20 209 17 Sherratt A 1997 Climatic cycles and behavioural revolutions the emergence of modern humans and the beginning of farming Antiquity 71 271 287 Simoni L Gueresi P Pettener D Barbujani G 1999 Patterns of gene flow inferred from genetic dista
40. D Amorim A Amos W Armenteros M Arroyo E Barbujani G Beckman G Beckman L Bertranpetit J Bosch E Bradley D G Brede G Cooper G Corte Real H B de Knijff P Decorte R Dubrova Y E Evgrafov O Gilissen A Glisic S Golge M Hill E W Jeziorowska A Kalaydjieva L Kayser M Kivisild T Kravchenko S A Krumina A Kucinskas V Lavinha J Livshits L A Malaspina P Maria S McElreavey K Meitinger T A Mikelsaar A V Mitchell R J Nafa K Nicholson J Norby S Pandya A Parik J Patsalis P C Pereira L Peterlin B Pielberg G Prata M J Previdere C Roewer L Rootsi S Rubinsztein D C Saillard J Santos F R Stefanescu G Sykes B C Tolun A Villems R Tyler Smith C amp Jobling M A 2000 Y chromosomal diversity in Europe is clinal and influenced primarily by geography rather than by language Am J Hum Genet 67 1526 43 Schneider S Roessli D amp Excoffier L 2000 Arlequin a software for population genetics data analysis User manual ver 2 000 Geneva Genetics and Biometry Lab Dept of Anthropology University of Geneva Semino O Passarino G Oefner P J Lin A A Arbuzova S Beckman L E De Benedictis G Francalacci P Kouvatsi A Limborska S Marcikiae M Mika A Mika B Primorac D Santachiara Benerecetti A S Cavalli Sforza L L amp Underhill P A 2000 The genetic l
41. Europe or what was spreading with the Neolithic a reply to Ammerman Antiquity 63 379 382 Zvelebil M 1986 Review of Ammerman amp Cavalli Sforza 1984 Journal of Archaeological Science 13 93 95 Zvelebil M Zvelebil K V 1988 Agricultural transition and Indo European dispersals Antiquity 62 574 583 Zvelebil M 2000 The social context of the Agricultural transition in Europe In Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeological Research University of Cambridge Cambridge pp 57 79 210
42. Further characteristics of proto European y chromosomes Eur J Hum Genet 7 603 8 Quintana Murci L Veitia R Fellous M Semino O Poloni E S 2003 Genetic structure of Mediterranean populations revealed by Y chromosome haplotype analysis Am J Phys Anthropol 121 157 71 Ray N Adams J M 2001 A GIS based vegetation map of the world at the Last Glacial Maximum 25 000 15 000 BP Internet Archaeology 11 Ray N Adams J 2002 Vegetation maps of Europe at four key time intervals part of the article Les climats de l Europe National Geographic France in press Ray N 2003 Mod lisation de la d mographie des populations humaines pr historiques l aide de donn es environnementales et g n tiques Th se Universit de Gen ve Gen ve Ray N Currat M Excoffier L 2003 Intra deme molecular diversity in spatially expanding populations Mol Biol Evol 20 76 86 Ray N M C Excoffier L 2004 Simulating realistic genetic diversity to find the origin of a population expansion in prep Reich D E Schaffner S F Daly M J McVean G Mullikin J C Higgins J M Richter D J Lander E S Altshuler D 2002 Human genome sequence variation and the influence of gene history mutation and recombination Nat Genet 32 135 42 Relethford J H 2001 Absence of regional affinities of Neandertal DNA with living humans does not reject multiregional evolution Am J Phys Anthropol 115 95 8 Rendine S Piazza A Cavalli Sforza L
43. Gene genealogies after a spatial expansion Three random genealogies of 30 genes are shown for Nm values of 5 25 and 200 migrants exchanged between neighboring demes The spatial expansion occurred t amp units of time ago as indicated in the footnote of table 1 Nm 10 8 10 12 14 16 18 Nm 50 8 10 12 14 16 18 0 2 4 6 Nm 20 0 24 PMR 02 aD Gite Mies why sie ai Wk RUSS Sige ies eT 6 2 4 6 8 10 12 14 16 18 e 2 4 6 8 10 12 14 16 18 Nm 100 Nm 500 0 2 4 6 8 10 12 14 16 18 Fic 3 Average mismatch distributions after a spatial expansion for different Nm values The Y axis stands for the average probability that two DNA sequences differ at a given number of sites represented on the X axis The solid lines are average mismatch distributions obtained from 1 000 simulations of the coalescent of 30 genes drawn in a single deme after a spatial expansion having occurred t 8 units of time ago Dotted lines delimit an empirical 90 confidence interval for the mismatch distribution of demographic expansion in unsubdivided populations Rogers and Harpending 1992 the mismatch distribution mode is shifted to the right with older expansion times data not shown Discussion Implication for Human Mitochondrial DNA Diversity Previous interpretations concerning the pattern of diversity in mitochondrial mtDNA have relied on the assumption that populations were uns
44. Jersey 1984 Weiss K M On the number of members of the Genus Homo who have ever lived and some evolutionary implications Human Biology 56 637 649 1984 Landers J Reconstructing ancient populations in The Cambridge Encyclopedia of Human Evolution eds Jones S Martin R amp Pilbeam D 402 405 Cambrige University Press London 1992 Rendine S Piazza A amp Cavalli Sforza L Simulation and separation by principal components of multiple demic expansions in Europe Am Nat 128 681 706 1986 Binford L R Constructing frames of reference An analytical method for archaeological theory building using hunter gatherer and environmental data sets 563 University of California Press Berkeley 2001 Skellam J G Random dispersal in theoretical populations Biometrica 38 196 218 1951 Fisher R A The wave of advance of advantageous genes Annals of Eugenics 7 355 369 1937 Helgason A Hrafnkelsson B Gulcher J R Ward R amp Stefansson K A Populationwide Coalescent Analysis of Icelandic Matrilineal and Patrilineal Genealogies Evidence for a faster Evolutionary Rate of mtDNA Lineages than Y Chromosomes Am J Hum Genet 72 00 00 2003 Tremblay M amp Vezina H New estimates of intergenerational time intervals for the calculation of age and origins of mutations American Journal of Human Genetics 66 651 8 2000 Biraben J N L volution du nombre des hommes Population et Soci t s 394 1 4 2003
45. M 2003 The Neolithic invasion of Europe Annu Rev Anthropol 32 135 162 Richards M Rengo C Cruciani F Gratrix F Wilson J F Scozzari R Macaulay V Torroni A 2003 Extensive female mediated gene flow from sub saharan Africa into near eastern arab populations Am J Hum Genet 72 1058 64 Richards M B Macaulay V A Bandelt H J Sykes B C 1998 Phylogeography of mitochondrial DNA in western Europe Ann Hum Genet 62 Pt 3 241 60 Roebroeks W 2001 Hominid behaviour and the earliest occupation of Europe an exploration Journal of Human Evolution 41 437 461 Roebroeks W 2003 Landscape learning and the earliest peopling of Europe In Rockman M Steele J eds Colonization of unfamiliar landscapes The archaeology of adaptation Routledge London pp 99 115 206 Roewer L Kayser M de Knijff P Anslinger K Betz A Caglia A Corach D Furedi S Henke L Hidding M Kargel H J Lessig R Nagy M Pascali V L Parson W Rolf B Schmitt C Szibor R Teifel Greding J Krawczak M 2000 A new method for the evaluation of matches in non recombining genomes application to Y chromosomal short tandem repeat STR haplotypes in European males Forensic Sci Int 114 31 43 Rogers A R Harpending H 1992 Population growth makes waves in the distribution of pairwise genetic differences Mol Biol Evol 9 552 69 Rogers A R Jorde L B 1996 Ascertainment bias in estimates of average heterozygosity Am J Hum Genet
46. Nac est la densit de chasseurs collecteurs convertis aux techniques n olithiques 47 Le mod le d velopp par Aoki est difficilement comparable au n tre pour plusieurs raisons i Son mod le ne consid re pas de mariages mixtes entre chasseurs collecteurs et agriculteurs En effet les n olithiques convertis restent dans une population s par e des n olithiques d origine Si cette subdivision de la population des agriculteurs peut s expliquer par une simplification du mod le math matique en revanche d un point de vue g n tique la dynamique d une population subdivis e est diff rente de celle d une population non subdivis e De plus l utilisation de la th orie de la coalescence comme dans notre approche voir Annexe 2 2 ne nous oblige pas invoquer l existence d une telle population AC ii L influence de l environnement n est pas prise en compte iii Le mod le de Aoki simule de la comp tition uniquement entre N olithiques convertis AC et N olithiques originaux AG mais pas entre agriculteurs et chasseurs collecteurs CC qui sont consid r s comme voluant dans des aires diff rentes Il n existe aucun type d interactions entre agriculteurs originaux et chasseurs collecteurs 4 3 Mod le d mographique propos Nous avons d velopp notre propre mod le d mographique pour simuler l expansion d une population dans une aire d j peupl e Ce mod le s inspire de ceux qui ont t pr sent s dans la sec
47. Neanderthal genes in the current gene pool of modern humans Results Modeling the colonization of Europe by modern humans A digital model of the region encompassing Europe the Near East and North Africa was build as a matrix of 7 500 cells arranged on a grid Each of these cells can contain two demes one occupied by modern humans HS and the other by Neanderthals HN At the beginning of the simulation 1 600 generations ago corresponding to 40 000 years if a generation time of 25 years is assumed the HN population occupies all the demes corresponding to their estimated range see Figure 1a The colonization of Europe by HS is then initiated at an arbitrary but plausible point black arrow on Figure 1a in western Asia From this origin modern humans then progressively colonize neighboring demes where they were facing competition and potential admixture with Neanderthals Figure 1 Competition was implemented as a modified Lotka Volterra model and population interaction was modeled as a density dependent mating probability with partial fecundity controlling the rate of gene transfer between the two populations An important and new feature of our model is that the local density of the two populations is logistically regulated implying that a 100 Absence of admixture between modern humans and Neanderthals newly founded HS deme grows logistically until it reaches a given carrying capacity During this growth period the HS dem
48. Nm 2 MU b Nm 2 0 4 S 04 PLL 0 2 024 0 ENE 0 2 4 6 8 10 12 0 2 4 6 8 10 12 Diff rences Diff rences 0 8 0 8 0 6 0 6 c Nm 100 d Nm 100 O D gt Fr quence O D gt N o N Diff rences Diff rences Figure 3 5 Distributions mismatch simul es ind pendemment avec 11 SNPs dans un chantillon de 40 g nes apr s une expansion spatiale et d mographique dans une population dont le Nm est soit petit ligne du haut soit grand ligne du bas SNPs choisis al atoirement colonne de gauche SNPs avec une fr quence minimum gale 10 colonne de droite 3 4 Discussion Dupanloup et al 2003 mettent l hypoth se que les lign es masculines et f minines sont pass es par des expansions d mographique et spatiale d cal es dans le temps Les femmes auraient connu une expansion plus ancienne que les hommes dont l expansion d mographique daterait de moins de 10 000 ans lors du passage de la polygamie la monogamie Nos simulations ne permettant pas d carter l hypoth se d une expansion ancienne de la lign e m le nous pouvons notre tour proposer une hypoth se alternative selon laquelle une expansion spatiale et d mographique a eu lieu en m me temps pour les lign es f minines et masculines mais que le Nm actuel de la population f minine Nam est plus grand que celui de la population masculine N m Un plus grand Nm f mini
49. Notes Currat et al 2004 Further details on the methodology can also be found in Ray 2003a and Currat in prep 2 Contents t TINFRODUCTION wisstesesiccststecasstassivetelspescdsadetastedtontedasedoasteut SacdsiscdalsstetasiccstsludadstessvetedsesadsedetestestentasssuGdatsecuisastes 2 MCONTEN ES A E E S EE A ENEN E T N AE ET 3 DEMOGRAPHIC AND SPATIAL EXPANSION MODULE ssssesensssenesnesssesessesesseensese 3 1 PRINCIPE D Sraa E E N ENA EE E Ja AVAILABLE DEMOGRAPHIC MODELS nue E O A O a eee 3 3 GENERAL SELTINGS PANEG crinii net E E EEEE E near du orne 3 3 1 E ae Eee OTe eR Re nT RRR EEE OE er aren E ST Tee RETO Eee wre TERT ee 332 Demography related parameters De ttes cn ie en ie a nie cn 3 3 3 FVIFONINCNL CIE Parameters psen hia NS a lei Air dt en 3 3 4 OUTPUT DON GIN te TS ESS SR MS RE en A lia sus 3 3 5 MODU O E T S oO eee RSE Reon not te INV RARES du tn St UN ed cn Men 3 4 1 Initial density and Ore 1OCAHON eee noel ne en de men M in 3 4 2 SNES TOR NN en ee ec aaeeteat ranulas 3 4 3 ASCH format Jor environmental data issus in ie M Na ie ne 3 4 4 Dynamic simulations and conversion tables to obtain K and FL 3 5 GRAPHICACOUTPUTS WINDOW greai onana na eae E AEEA nn niet 30 DEMOGRAPHIC OUTPUTS WINDOW uns 4 GENETIC MODULE San sn ae e a E e ls 4 1 PRINCIPE Sanao aen E RE E E E te dl E te TUNG SDAIN Daren o A ale e A AA D eus 4 2 1 E A PE ee AEEA EE TIE AE P E E E E EE E RU E E E E E E EE 4 2 2 MAO models poc CS e pi E UN de d
50. Nous aimerions premi rement souligner l int r t de l approche g n rale pr sent e dans ce travail Si la simulation de donn es g n tiques avait d j t effectu e dans des cadres environnementaux relativement simples Rendine et al 1986 Barbujani et al 1995 notre quipe est sans doute parmi les premi res avoir d velopp cet aspect dans un cadre g n raliste L int r t de notre m thodologie r side dans la traduction d informations d mographiques en informations mol culaires en tenant compte de l influence de l environnement Ses avantages principaux en comparaison de simulations classiques sont d une part la g n ration de donn es mol culaires puisque les travaux ant rieures ne simulaient que des fr quences all liques et d autre part l utilisation de la th orie de la coalescence qui permet un gain gigantesque en temps de calcul et en espace m moire Il sera sans aucun doute possible dans le futur d effectuer des simulations individuelles selon un sc nario d mographique donne mais cela n est cependant gu re r aliste actuellement dans le cas d hypotheses complexes ou d une r solution g ographique fine L utilisation d une m thode conomique comme la n tre est le seul moyen d tudier avec des moyens informatiques limit s des situations compliqu es comme celles abord es dans ce travail Dans le cadre du projet Friction nous avons donc t amen s d fricher un vaste champ de conn
51. SPLATCHE Ce dernier permet de simuler des donn es g n tiques pour un ventail de sc narios d mographiques bien plus large que SIMCOAL L int gration des routines de SIMCOAL dans SPLATCHE a t longue et d licate puisqu il a t n cessaire de les adapter des mod les d mographiques beaucoup plus complexes L une des difficult s principales a t de traduire les donn es d mographiques en nombres entiers n cessaires au fonctionnement des fonctions de coalescence tout en gardant une coh rence stricte entre nombres de migrants et densit s L utilisation de nombres entiers a galement n cessit une impl mentation sp cifique afin que la pr cision num rique des mod les d mographiques reste satisfaisante Une simulation g n tique se divise en deux phases Lors de la premi re la g n alogie d un nombre arbitraire de g nes chantillonn s dans le monde virtuel est reconstruite l aide d un algorithme d riv de la th orie de la coalescence Puis lors de la seconde phase des mutations sont superpos es al atoirement sur les branches de l arbre g n alogique obtenu ou arbre de coalescence afin de g n rer la diversit mol culaire des g nes chantillonn s Annexe 2 2 1 Processus de coalescence La premi re phase d une simulation g n tique utilise la th orie de la coalescence qui a t formalis e en 1982 par Kingman 1982a 1982b puis d velopp e ult rieurement Ewens 1990 Hudson 1990
52. The hypothesis of selective neutrality and population equilibrium will be more often rejected for relatively recent expansions tT lt 3 than for older expansions t gt 5 which is somewhat counterintuitive However we may propose the following explanation Since Fu s F statistic is the logit of the probability to observe k or more alleles conditional on x the observed average number of pairwise differences the behavior of this test can be explained by understanding the behavior of and m under spatial expansions As visible on the first row of figure 2 a range expansion with limited gene flow among demes produces an intra deme gene genealogy with both many recent and many old coalescent events The age of the old coalescent events depend essentially of the age of the expansion whereas the age of the recent coalescent events depends on the size of the deme For a sufficiently large mutation rate the age of the 22 expansion will not affect much k but it will have a large effect on m Thus the probability of observing a given number k or more alleles will increase with older expansions leading to less negative F s values as shown in table 3 The effect of the age of the expansion on the mismatch distribution is clearer and much like in the case Nm 5 wooo F k d 3 L 4 Nm 25 r Nm 200 f l Fic 2
53. amp Cavalli Sforza 1984 Pennington 2001 Young amp Bettinger 1995 A migration rate of m 0 25 imply 125 SNP diversity in Europe after a range expansion the exchange of 10 males or 10 females between neighboring HG demes per generation and 200 individuals between F demes two values in broad agreement with those estimated from mtDNA diversity in HG and post Neolithic populations Excoffier 2004 Genetic simulations We have simulated the diversity of samples of 40 genes in 20 demes located along an axis between the Near East to Ireland see Figure 1a For each reconstructed genealogy the local Neolithic contribution to the current gene pool is measured as the proportion of sampled lineages whose ancestors belong to the source deme F at generation 400 In order to be able to compare our simulations with the Y chromosome data published for the European populations by Semino et al 2000 and in derived analyses Dupanloup et al 2003 Pereira et al 2001 we have simulated 22 linked SNPs assumed to be on the Y chromosome In order to detect allele frequency clines AFCs the frequency of the SNP is measured in each of the 20 simulated samples and a linear regression is carried out over geographical distance between samples If the regression coefficient is statistically significant at the 5 level we consider this SNP as showing an AFC The determination coefficient R of the regression is also calculated for every statistically signi
54. capacity and aj is an asymmetric competition coefficient An a value of 1 implies that individuals of the j th population have as much influence on those of population as on their own conspecific or that competition between populations is as strong as competition within population Lower values of aj indicate lower levels of competition between than within populations a value of zero implying no competition between individuals from different populations We have decided here not to fix a values but to make them 106 Absence of admixture between modern humans and Neanderthals density dependent as a N N N reflecting the fact that the influence of the members of a population on the other grows with its density In the migration phase each population of each deme can send emigrants to the same population in neighboring demes at rate m N m emigrants are thus sent outwards each generation and distributed equally among the four neighboring demes as described previously If a gene is sent to an occupied deme the migration event results in gene flow otherwise it results in the colonization of a new deme This latter possibility only exists for the population of modern humans since we assume that Europe was already fully colonized by Neanderthals Finally the densities of the two populations are updated as a balance between logistic growth migration and admixture as N N 1 m where l is the
55. coalescent events the scattering phase sensu Wakeley 1999 S1 in Figure 2 followed by two contraction phases Corresponding to range expansions when going forward in time that respectively take place during the Neolithic C7 and the Paleolithic C2 migration waves As illustrated on Figure 2 the relative proportion of coalescent events taking place during the two contraction phases C7 and C2 are quite different under the pure DD model y 0 and with high Paleolithic input y 1 The number of coalescent events in the scattering phase S7 only depends on the parameter Nem as shown 126 SNP diversity in Europe after a range expansion previously Ray et al 2003 and it does not allow one to distinguish between the two models It thus appears that the period C7 is critical to distinguish between models Under a pure DD model almost all coalescent events 98 occur before the lineages reach the initial Neolithic deme Figure 2 Contrastingly only about half 49 of the coalescent events occur after the onset of the Neolithic transition when y 1 Under this latter case less than 10 of the coalescent events occur within the Neolithization wave and 20 within the Paleolithic contraction wave C2 Figure 2 The remaining 70 occur in the HG layer during or before Neolithic times after the passage of the Neolithic wave because the lineages evolve in demes with low densities Note that the number of coalescent events occurring wi
56. contemporary population in northeast Quebec Am J Hum Genet 56 1450 5 Heyer E amp Tremblay M 1995 Variability of the genetic contribution of Quebec population founders associated to some deleterious genes Am J Hum Genet 56 970 8 140 SNP diversity in Europe after a range expansion Heyer E Zietkiewicz E Rochowski A Yotova V Puymirat J amp Labuda D 2001 Phylogenetic and familial estimates of mitochondrial substitution rates study of control region mutations in deep rooting pedigrees Am J Hum Genet 69 1113 26 Hudson R R 1990 Gene genealogies and the coalescent process In Oxford Surveys in Evolutionary Biology ed D J Futuyma amp J D Antonovics pp 1 44 New York Oxford University Press Jeunesse C 1998 La n olithisation de l Europe occidentale Vile Ve mill naires av J C nouvelles perspectives In Les derniers chasseurs cueilleurs du massif jurassien et de ses marges ed C Cupillard amp A Richard Lons le Saunier Centre Jurassien du patrimoine Kozlowski J amp Otte M 2000 The formation of the Aurignacian Journal of Anthropological Research 56 513 524 Lahr M M Foley J A amp Pinhasi R 2000 Expected regional patterns of mesolithic neolithic human population admixture in Europe based on archaeological evidence In Archaeogenetics DNA and the population prehistory of Europe vol 1 ed C Renfrew amp K Boyle pp 81 88 Cambridge McDonald Institute for Archaeologica
57. defines a regularly spaced array of demes Each deme undergoes an independent population growth and can exchange emigrants with its four direct neighboring demes Each deme is also considered as a sub unit of the environment The environment can influence the local demography through its carrying capacity maximum number of individuals and its friction facility to migrate through These two environmental characteristics can be defined for the entire array of demes through the input of maps Variations through time of carrying capacity and or friction values are also possible 3 2 Available demographic models The logistic population growth of each deme follows a standard logistic curve of the form K N Na N i K where K is the carrying capacity and r is the growth rate For the migration part of the demography three models are available in SPLATCH Model 1 Migration model with even number of emigrants The number of emigrants M from a deme is computed for each generation as M mN where m is the migration rate and N is the population density of the deme at generation t The number of emigrants M in any of the four directions is then computed as where F is the friction of the deme in direction i north south east or west and floor means that the fractional part of the number is truncated This model always gives a total number of emigrants which is a multiple of four Model 2 Migration model with absolute number
58. discussed above the existence of gradient of allele frequencies along a European South East to North West axis the proportion of the European gene pool being of Paleolithic origin and the 123 SNP diversity in Europe after a range expansion mismatch distribution within populations Because an ascertainment bias in favor of SNP showing a relatively frequent minor allele is common i e Casalotti et al 1999 and leads to biased estimates of the past demography of a population e g Wakeley et al 2001 we have also examined its impact on patterns of molecular diversity Material and Methods As reported previously Excoffier 2004 Ray et al 2003 realistic simulations of genetic diversity were carried out by first generating the forward demographic history densities and migration rates between adjacent demes of the populations These demographic information are stored in a database which is then used to generate the genealogies of samples of genes drawn in a predefined set of demes using a backward coalescent approach e g Hudson 1990 Nordborg 2001 Demographic simulations While our approach is inspired by previous simulation studies on allele frequencies e g Barbujani et al 1995 Rendine et al 1986 we have specifically modeled the occurrence of SNP mutations and we have added some level of realisms such as the spatial dynamics of Paleolithic populations and an explicit competition for local resources between Paleolithic a
59. disparaisse compl tement r sultat non montr Dans tous les autres cas la signature g n tique de l expansion pal olithique est observable dans la distribution mismatch moyenne sous la forme du mode le plus droite Cependant cette signature n est pas forcement d celable lors d une observation unique car la variance est grande particuli rement lorsque Naeem est petit 4 5 3 2 Influence de Nccm 0 2 Fr quence Temps en g n rations Figure 4 15 Distributions mismatch moyennes obtenues pour un petit 10 cercles noirs et un grand Nccm 100 cercles blancs Avec un Naeem 1 000 identique dans les deux cas 78 Plus Ncm est petit et plus homozygotie attendue est lev e Figure 4 15 m me si cette augmentation est beaucoup plus faible que celle provoqu e par Nagm Ceci est d a l augmentation des coalescences provoqu e par la concentration des lignages lors de leur passage par le goulet n olithique comme le montre la Figure 4 16 Cette figure montre que lorsque Nccm est petit 10 environ 30 des g nes qui passent le goulet coalescent pendant les 50 g n rations qui pr c dent celui ci alors que lorsque Nccm est grand 100 il ny a pratiquement aucune coalescence pendant ce laps de temps lt 0 4 Plus Nccm est petit et plus la probabilit de coalescence est donc importante par rapport a la probabilit de dispersion la suite du goulet L influence de Nccm est tout de m me nette
60. distribution Small graphs show 6 independent replicates of each case studied here Nem 200 135 SNP diversity in Europe after a range expansion a DD y 0 0 b CD y 1 0 04 pal ee without bias l gt without bias gt PCR gt 2 Kes 2 O ae O LL LL 6 8 10 12 0 2 4 6 8 10 12 Number of differences c DD y 0 0 d CD y 1 0 0 4 ascertainment bias gt 10 Frequency es T T Fa T T T ae T T T T r T I T T 10 12 14 16 18 20 22 Pe tenn ok e eh ee 9 0 0 er 0 2 4 6 8 10 12 14 16 18 20 22 0 2 4 6 8 Number of differences Number of differences C A Woh LA A Figure 5 Expected mismatch distributions obtained from samples located in Germany without or with maximum genetic flow between HG and F with and without ascertainment bias Dashed lines correspond to the limits of a 90 confidence interval for the mismatch distribution Small graphs show 10 independent replicates of each case studied here Ascertainment bias was modeled by selecting SNPS with a minor allele frequency exceeding 10 along the transect shown on Figure 1 A N PB LL 136 SNP diversity in Europe after a range expansion Additional Figures
61. du g nome mais galement au niveau des populations La r alisation du logiciel de simulation SPLATCHE a t effectu e dans le cadre du projet Friction Ce projet vise la reconstitution de l histoire des migrations humaines en fonction des donn es environnementales et g n tiques La complexit de ce projet a n cessit la participation de plusieurs personnes pendant pr s de 4 ans chacune ayant un r le bien d fini De nombreux aspects logiciel SPLATCHE compilation des donn es environnementales mod les ont en effet d tre d velopp s sp cifiquement puisqu ils n existaient pas avant sous la forme d sir e Le Pr Laurent Excoffier est a la base m me du projet et a principalement supervis son d veloppement Le Dr Nicolas Ray s est consacr a la recherche de donn es environnementales et leur num risation ainsi qu au d veloppement et l impl mentation des mod les d mographiques Notre propre r le a principalement concern l incorporation de l algorithme de simulation de donn es g n tiques ainsi que la visualisation de ses diff rentes composantes D autres personnes ont galement contribu l avanc e de ce projet Le Dr Stefan Schneider s est consacr la cr ation de la structure initiale de SPLATCHE et le Pr J r me Goudet a particip l laboration de mod les d mographiques D s le d but SPLATCHE a t d velopp dans le but d tre utilisable de fa on tres g
62. effectifs dans notre cas Cependant des valeurs de Kac sup rieur 10 fois celle de Kcc ne changent quasiment plus rien au nombre de migrants chang s entre les deux populations Nous utiliserons donc 10 000 comme valeur de Kac maximum Lors de la simulation de syst mes g n tiques haploides li s au sexe g n me mitochondrial ou chromosome Y il faut diviser les valeurs mentionn es ci dessus par 2 alors qu il faut les multiplier par deux lors de la simulation de syst mes diploides comme dans la Table 4 3 1 roe Sie ben l Des cellules de 50 km de c t ont t jug es comme tant de taille ad quate pour repr senter des sous populations de chasseurs collecteurs Anderson et Gillam 2000 Le diam tre de leur territoire saisonnier en Europe centrale il y a environ 8 000 ans a t estim entre 60 et 80 km Gronenborg 1999 De plus la distance d exploration moyenne des pygm es contemporains s tend d environ 50 90 km Hewlett et al 1982 et leur distance moyenne de mariage environ 40 km Cavalli Sforza et Hewlett 1982 ces valeurs tant sans doute sup rieures celles des chasseurs collecteurs pal olithiques Ammerman et Cavalli Sforza 1984 La taille efficace Ne peut galement tre d finie comme tant gale N 3 mais pour des raisons de simplification nous utilisons N 2 dans ce travail 13 Param tre Minimum Maximum loc 0 1 0 8 FAG 0 1 0 8 Kec 50 2 000 Kac 100 20 000 m 0 04 0 2 y 0 1
63. emigration rate does not depend on the current density of the target deme so that the same proportion of migrants are sent to empty or occupied demes The number of emigrants Nm is then distributed equally among the neighboring demes The density of each deme is limited by its carrying capacity K and is regulated logistically as Na NI r K N K where N is its density at time and r is the intrinsic rate of increase per generation in the current study r was constant at 0 1 At carrying capacity Km migrants are thus exchanged between a deme and its neighbors In the following this number of migrants exchanged at equilib 78 Ray et al rium will be denoted by Nm to be consistent with published literature For each generation we implement a logistic regulation step followed by a round of migration The demographic simulations are performed for 4 000 generations and we store for each generation f the density of the j th deme N and the number of immigrants received from the k th deme Zw in a database This demographic database is then used to perform the genetic simulations using a coalescent approach described below Coalescent Simulations Under neutrality the genetic diversity of samples in a subdivided population is easy to simulate as it depends only on the demographic and migration histories of the demes e g Hudson 1990 Nordborg 2001 For this purpose we have modified the coalescent simulation progra
64. est donc tentant de comparer les distributions mismatch obtenues pour l ADN mitochondrial avec celles obtenues pour la lign e masculine Malheureusement les s quences compl tes d ADN pour le syst me g n tique sp cifique aux m les la partie non recombinante du chromosome Y ou MSY sont rares Whitfield et al 1995 Shen ef al 2000 Hammer et al 2003 Les donn es g n tiques disponibles pour ce syst me sont principalement compos es de microsatellites de Knijff et al 1997 Pritchard et al 1999 Belledi et al 2000 Forster et al 2000 Shen et al 2000 Kayser et al 2001 de SNPs Semino et al 2000a Bosch et al 2001 Hammer et al 2001 Underhill et al 2001 Shen et al 2002 ou des deux Bosch et al 1999 Carvajal Carmona et al 2000 Al Zahery et al 2003 Des distributions mismatch pour les populations europ ennes et moyen orientales ont tout de m me t tablies sur la base de SNPs Pereira et al 2001 Dupanloup et al 2003 Ces derniers sont sujets a un important biais de recrutement ascertainment bias en anglais Rogers et Jorde 1996 car ils ne correspondent pas a tous les sites polymorphes qui existent dans les sequences d ADN En effet les mutations les plus rares dans la population sont sous repr sent es dans les chantillons constitu s de SNPs voir page 182 Il nous a donc paru int ressant d utiliser SPLATCHE pour tudier l effet de l utilisation de SNPs dans la constitution d
65. fonction de leur r partition Figure 5 1 Ces derniers disparaissent sous l effet de la comp tition exerc e par les Hommes modernes dont la capacit de soutien doit tre au moins 2 5 4 fois sup rieure celle des N andertaliens pour que cette extinction ait lieu Cette diff rence de densit est due une meilleure exploitation des ressources par les Hommes modernes probablement gr ce une technologie plus avanc e ou a de meilleures facult s cognitives Klein 2003 Nous avons simul diff rentes proportions d changes g n tiques entre les deux populations pendant une p riode de 97 cohabitation qui dure entre 7 5 et 12 g n rations environ 200 a 300 ans dans chaque deme de 2 500 km en fonction des sc narios En effet 8 sc narios d mographiques differents sont consid r s afin de tenir compte de l incertitude li e au choix des valeurs de param tres Le sc nario A est celui qui utilise les valeurs les plus probables estim es partir des donn es de la litt rature Nous montrons dans cette etude que l absence de lignage n andertalien dans la population europ enne actuelle ne peut r sulter que d une hybridation extr mement faible entre les deux populations concern es Selon tous les sc narios simul s la proportion initiale de g nes n andertaliens dans la population moderne n a pu exc der 0 09 sans que l on en observe encore des traces aujourd hui Cette estimation est environ 400 fois plus faible
66. gene lineages is the factor that will primarily determine the overall pattern of diversity observed within demes Large Nm values during the scattering phase are sufficient to prevent recent coalescent events The ancestral lineages of almost all sampled genes will thus be found in different demes at the end of the scattering phase After that point if the number of demes is much larger than the number of remaining lineages the size of the demes and their associated Nm value will have almost no effect on the pattern of coalescence until the onset of the spatial expansion This property should make the model quite robust to the likely complex histories of natural populations going through long term size fluctuations The present simulation results thus explain the difference between the mismatch distributions of hunter gatherer and post Neolithic populations by the simple fact that food gatherers have generally lower densities than food producers if one assumes that both groups have approximately similar emigration rates However addi tional factors may have led to different patterns of molecular diversity in these communities It remains true that present hunter gatherer communities currently live in environments that are unfavorable and more fragmented than before Lewin 1988 which could have reduced considerably their effective population size and thus led to multimodal mismatch distribution Excoffier and Schneider 1999 Such a proc
67. human populations in eurasia Am J Hum Genet 70 673 85 Kalmar T Bachrati C Z Gyorgypal Z Downes C S Rasko 2003 Mitochondrial lineages in Hungarian speaking populations of the Carpathian basin Vol 2003 Genbank Kaplan N Hudson R R lizuka M 1991 The coalescent process in models with selection recombination and geographic subdivision Genet Res 57 83 91 Kayser M Krawczak M Excoffier L Dieltjes P Corach D Pascali V Gehrig C Bernini L F Jespersen J Bakker E Roewer L de Knijff P 2001 An extensive analysis of Y chromosomal microsatellite haplotypes in globally dispersed human populations Am J Hum Genet 68 990 1018 Kimura M 1953 Stepping stone model of population Annual Report of National Institute of Genetics 3 62 63 King J P Kimmel M Chakraborty R 2000 A power analysis of microsatellite based statistics for inferring past population growth Mol Biol Evol 17 1859 68 Kingman J F C 1982a The coalescent Stoch Proc Appl 13 235 248 Kingman J F C 1982b On the genealogy of large populations J Appl Proba 19A 27 43 Kittles R A Bergen A W Urbanek M Virkkunen M Linnoila M Goldman D Long J C 1999 Autosomal mitochondrial and Y chromosome DNA variation in Finland evidence for a male specific bottleneck Am J Phys Anthropol 108 381 99 Klein R G 2003 Paleoanthropology Whither the Neanderthals Science 299 1525 7 Klopfstein S in prep Travail de dipl me Un
68. in their higher fitness the absence of observed mtDNA introgression would not necessarily be due to an absence of interbreeding but would rather result from an active selection process against crosses between Neanderthal females and modern human males and one would therefore expect to see potential leakage of Neanderthal genes in our nuclear genome While some evidence for the differential fitness of some mtDNA human genomes in distinct climates has been recently found it is unlikely that such differences were involved in the selective advantage of modern humans over Neanderthals It is indeed doubtful that modern humans coming from the Middle East would have had mitochondria better adapted to the colder environment of Europe than Neanderthals who had spent tens of thousands of years in such a climate It is therefore more likely that modern humans higher technology and higher cognitive abilities resulting in better resource processing and environmental exploitation have allowed them to out compete Neanderthals and that mtDNA was selectively neutral in that respect It should however be kept in mind that our conclusions assume no sex bias in interbreeding rates Studies of fossil Y chromosome or nuclear DNA would be needed to examine the basis of this assumption but it seems difficult to imagine why interbreeding between Neanderthal men and modern human females resulting in the incorporation of Neanderthal genes would have been more frequ
69. jusqu nos jours En effet seul un remplacement presque complet de ces chasseurs collecteurs sur l ensemble du continent par les descendants des premiers agriculteurs du Proche Orient aurait pu permettre une incorporation importante de lignages proche orientaux en Europe Si un tel remplacement de population est possible dans certaines r gions comme l Eg e les Balkans l Adriatique et l Anatolie les processus d acculturation au sens large auraient largement domin dans le reste de l Europe Mazuri de Keroualin 2001 Gallay 2004 A notre sens s il parait probable que les g nes des premiers agriculteurs proche orientaux se soient r pandus dans le sud est de l Europe lors du N olithique il nous semble cependant beaucoup plus improbable qu ils soient pr sents majoritairement dans le reste du continent Nous pensons que l apport g n tique global des agriculteurs proche orientaux dans le patrimoine g n tique europ en est certainement minoritaire m me s il est encore difficile de l estimer ce stade des connaissances Nous n avons pu comparer les donn es g n tiques virtuelles simul es qu aux marqueurs du g nome mitochondrial et ceux de la portion non recombinante du chromosome Y Il a t impossible de tirer des conclusions sur la base de ces derniers cause du biais de recrutement qui les affecte Avant d tendre les diff rentes conclusions obtenues par les tudes pr sent es dans ce chapitre il est donc n cessa
70. m mes tr s proches de Le terme mariage ne correspond videmment pas sa d finition religieuse ou civile mais est utilis pour d finir le choix d un partenaire sexuel 59 ceux obtenus par Rendine ef al 1986 avec un mod le plus simple S 7N N voir section 4 2 Le raisonnement sous jacent aux mod les d velopp s dans le cadre de ces deux tudes n est pas tr s diff rent du n tre Leur point commun est l incorporation d individus A dans la population B en fonction des densit s des deux populations pr sentes C est par des d tails l int rieur de ces fonctions que se fait la diff rence entre les mod les voir section 4 2 En revanche Rendine et al 1986 et Barbujani et al 1995 accordent une signification diff rente la variable y qui repr sente le taux d acculturation puisqu elle est utilis e uniquement dans le cadre de la transition n olithique Contrairement aux tudes pr alables notre mod le permet un flux g nique allant dans les deux sens soit de A vers B mais aussi de B vers A Pour calculer le nombre Sg d individus B qui passe dans la population A pendant une g n ration il suffit d inverser les indices de l quation 4 18 L ajout de possibilit s d hybridation au mod le de comp tition peut passablement modifier l tat final du systeme par rapport a celui attendu sous le simple modele de competition La resolution analytique d un tel syst me non lin aire dont le nombre d
71. model Current Opinion in Genetics and Development 12 675 682 2002 Rak Y Ginzburg A amp Geffen E Does Homo neanderthalensis play a role in modern human ancestry The mandibular evidence Am J Phys Anthropol 119 199 204 2002 Duarte C et al The early Upper Paleolithic human skeleton from the Abrigo do Lagar Velho Portugal and modern human emergence in Iberia Proc Natl Acad Sci U S A 96 7604 9 1999 Tattersall amp Schwartz J H Hominids and hybrids the place of Neanderthals in human evolution Proc Natl Acad Sci U S A 96 7117 7119 1999 Harvati K The Neanderthal taxonomic position models of intra and inter specific craniofacial variation J Hum Evol 44 107 32 2003 Krings M et al Neandertal DNA sequences and the origin of modern humans Cell 90 19 30 1997 Krings M Geisert H Schmitz R W Krainitzki H amp Paabo S DNA sequence of the mitochondrial hypervariable region Il from the neandertal type specimen Proc Natl Acad Sci U S A 96 5581 5 1999 Ovchinnikov I V et al Molecular analysis of Neanderthal DNA from the nothern Caucasus Nature 404 490 493 2000 Cooper A et al Human origins and ancient human DNA Science 292 1655 6 2001 Scholz M et al Genomic differentiation of Neanderthals and Anatomically modern man allows a fossil DNA based classification of morphologically indistinguishable hominid bones Am J Hum Genet 66 1927 1932 2000 Krings M et al A view of Nean
72. par les mod les d mographiques et g n tiques Comme nous l avons d j signal il existe une version volutive de SPLATCHE FRICTION pour laquelle des fonctionnalit s sont ajout es r guli rement 186 ANNEXE 3 Visualisation de la coalescence Une des particularites de SPLATCHE est la possibilite de representer graphiquement les arbres de coalescence C est a notre connaissance le seul logiciel qui permette de visualiser les diff rentes composantes des g n alogies de genes de fa on spatiale Ces sorties graphiques sont tres int ressantes d un point de vue didactique car elles permettent de bien comprendre le processus de coalescence en fonction de diff rents sc narios d mographiques simul s Trois composantes des g n alogies peuvent tre superpos es la carte de la r gion o a lieu la simulation Annexe 3 1 Arbre de coalescence Il est possible de visualiser les liens g n alogiques entre les diff rents n uds de la g n alogie en fonction des endroits o ont eu lieu les coalescences Il s agit donc de la repr sentation spatiale de l arbre de coalescence Figure 9 12 Figure 9 12 Exemple d un arbre de coalescence obtenu apr s une simulation dans l ancien monde Les croix noires repr sentent les endroits d o sont tir s les chantillons 187 Annexe 3 2 Distribution des evenements de coalescence SPLATCHE offre la possibilit de visualiser la distribution spatiale des v nements
73. population adoptent l agriculture et cr ent la population n olithique B Ce sc nario ne requiert aucune modification particuli re dans le module g n tique puisque les lignages qui arrivent dans la cellule source B en remontant le temps migrent automatiquement dans la population A au temps O et pourront ensuite coalescer dans cette population jusqu ce qu il ne reste que le MRCA Strategie 2 La population B est cr e par des individus totalement ind pendants de la population A de sorte que lorsque l on remonte le temps les lignages peuvent se trouver soit dans le deme source de la population A soit dans celui de la population B L utilisateur va donc d cider d un temps t en g n rations pendant lequel les deux d mes vont rester s par s avant d tre r unis dans un seul et unique deme Dans ce cas l hypoth se est donc faite que les deux populations A et B ont un anc tre commun 7 t g n rations avant le present Cette strategie est utilis e lors de la simulation du remplacement des Neandertaliens chapitre 5 Strat gie 1 Strat gie 2 Population B Population B Migrations interpopulationnelles Population A Population A Simulation dynamique t g n rations Statique t g n rations Figure 9 16 Sch ma des deux strat gies d velopp es pour cr er un arbre de coalescence malgr le fait que chaque population poss de sa propre origine 194 Annexe 4 3 Echantillonnage
74. pour des chantillons differents a partir d un seul locus ne peut donner aucune indication fiable du fait de sa tres grande variabilite Echantillonnage local Echantillonnage peripherique 0 4 0 4 Taille du Goulet 0 3 en ind 0 3 N rab i O O D ee D 5 0 2 ee Tae 50 S i og D a D LL s LL SIS PE 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Differences Diff rences 0 4 0 4 0 3 0 3 4 h 0 a O O 5 TE 5 202 a as 250 2 02 D Ris O LL Z ane LL 0 1 0 1 0 0 Ole ak dom Ae ee eee eee galore 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 0 4 0 3 0 3 A O O s 5 5 s o 4 20 2 q x a 450 3 0 2 N O LL is LL 0 1 0 1 0 0 4 6 8 10 12 14 16 18 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 0 4 0 3 0 3 h A O O S 5 PRE dl 7 0 a s 30 2 x 1800 5302 D Ta 2 gt is LL x LL eit ee 0 1 0 1 0 0 ee a aaa 0 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Diff rences Diff rences Figure 4 18 Distributions Mismatch moyennes pour 1 000 simulations et intervalle de confiance a 90 en traitill s pour diff rentes tailles du goulet en individus Colonne de gauche chantillonnage sur le lieu du goulet Colonne de droite chantillonnage en p riph
75. pr alablement peupl e qui ont t propos s dans litt rature II ne s agit pas d une revue exhaustive puisque nous pr sentons dans l ordre chronologique de leur publication uniquement les mod les qui nous paraissent les plus pertinents par rapport notre propre travail Rendine Piazza Cavalli Sforza American Naturalist 1986 Faisant suite un premier essai dans les ann es 70 Sgaramella Zonta et Cavalli Sforza 1973 l tude de Rendine ef al en 1986 aborde la probl matique de la transition n olithique en Europe 42 par le biais de simulations Cette etude fait suite a une s rie d articles Ammerman et Cavalli Sforza 1971 Menozzi et al 1978 Ammerman et Cavalli Sforza 1984 qui ont permis a ces auteurs de d finir la th orie de la vague d avanc e demique du N olithique europ en L article de Rendine et al 1986 visait simuler cette vague d expansion d mique afin de confronter la structure g n tique obtenue avec celle des populations europ ennes L volution de fr quences all liques est simul e dans deux populations l une compos e de chasseurs collecteurs m solithiques CC et l autre d agriculteurs AG Les simulations se d roulent dans une Europe virtuelle divis es en 840 cellules ou d mes plac es selon une matrice r guli re Figure 4 1 Les migrations ne peuvent avoir lieu qu entre d mes voisins II s agit donc d un mod le stepping stone en deux dimensions Kimura
76. prior to a simulation if one wants to automatically generate these outputs during the simulation These outputs are a temporal series of graphical representations of the state of a demographic parameter number of emigrants population densities or occupation Windows Bitmaps BMP or ASCII raster can be generated The output files are placed in two folders called respectively BMP and ASCII which are created in the same folder 159 SPLATCHE User Manual than the setting file The filename of each output file 1s composed by the name of the demographic variable followed by the number of generation at which it has been created Number of generations between each output files Beside the outputs for the intermediate states a series has always outputs for the initial and the final state of the simulation Checkboxes for the generation of BMP files Checkboxes for the generation of ASCII raster files 3 3 5 Main buttons Button to build a world It is during a building process that memory space is allocated and that carrying capacity and friction values are computed for each deme Button to launch a simulation If this button is grayed out it means that the world needs to be built or rebuilt 2 Button to show the graphical output window 3 4 Input files 3 4 1 Initial density and origin location A file called dens init txt in the examples is used to specify the place of origin of the simulated population This file co
77. proportional to the effective size of the whole population itself depending on the number of demes the migration rate between demes and the deme size Wakeley 1999 Additional realism has been recently incorporated by allowing for the occurrence of a potentially changing number of demes of unequal size connected by potentially changing rates of migration Wakeley 2001 Wakeley and Aliacar 2001 showing that coalescent events would accumulate over time in small demes with low migrations rates Wakeley 2001 Co alescent based approaches have also been developed to estimate nonhomogeneous and asymmetric migration rates among demes of unequal sizes Beerli and Felsenstein 1999 2001 albeit under the assumption that the sampled demes actually exchange migrants The development of more realistic models that incorporate demographic history may allow for the explanation of complex patterns that may be apparent in population genetic data A classical example of the influence of the demographic history of a population on its molecular diversity is a recent demographic expansion that leads to starlike phylogenies Slatkin and Hudson 1991 and to unimodal distributions of the number of pairwise difference or mismatch distributions Rogers and Harpending 1992 While this pattern could also be obtained by a complex mutation mechanism in the absence of large expansions for instance heterogeneity of mutation rates Lundstrom Tarav and Ward 1992
78. que celles faites pr alablement Nordborg 1998 Serre et al 2004 Cette faible contribution peut tre expliqu e par le fait que l hybridation se fait dans le front d avancee de la vague de migration des Hommes modernes au moment o ceux ci sont encore peu nombreux Ainsi les rares hybrides n andertaliens vont contribuer l expansion des Hommes modernes et leurs g nes seront fortement repr sent s dans la population finale Ce r sultat sugg re donc que la contribution des N andertaliens dans le patrimoine g n tique des humains modernes est faible voire nulle Il va l encontre de l hypoth se selon laquelle la trace d une hybridation importante aurait pu tre effac e par d rive g n tique Notre travail souligne l int r t de prendre en compte les mouvements des populations au cours du temps ainsi que leur subdivision En effet notre mod le implique un r alisme suppl mentaire par rapport ceux utilis s pr alablement qui ne consid raient que la fusion entre deux populations non subdivis es et statiques d un point de vue spatial Nordborg 1998 Serre et al 2004 5 2 1 Article Page suivante 98 Absence of admixture between modern humans and Neanderthals A range expansion of modern humans into Europe implies no admixture with Neanderthals Running title Absence of admixture between modern humans and Neanderthals tt Mathias Currat and Laurent Excoffier Computational and Molecular Po
79. simulation d mographique i L hypoth se est faite que chaque nouvelle g n ration d individus succ de enti rement la pr c dente sans qu il y ait de superposition entre deux g n rations successives 174 Migrations Les d mes sont arranges selon un mod le appel stepping stone en deux dimensions Kimura 1953 ce qui signifie qu un individu appartenant a un deme donn peut potentiellement migrer dans chacun des quatre demes voisins Ce modele prend donc en compte la disposition spatiale des sous populations Figure 9 2 Le nombre d emigrants est simplement une proportion m de la densit N et leur direction est calcul e en fonction de la friction F des cellules voisines voir la section 4 3 2 1 ainsi que l Annexe 1 pour les d tails Figure 9 2 Sch ma du mod le stepping stone 2D Base de donn es d mographique Toutes les tapes d mographiques ne sont pas sauvegard es dans la base de donn es virtuelle Seules le nombre d immigrants et la densit finale N sont stock s lors de chaque g n ration pour chaque deme La base de donn es contient donc D x G x 5 elements o D correspond au nombre de d mes et G au nombre de g n rations simul Le nombre 5 repr sente pour chaque d me la densit N ainsi que le nombre d immigrants N m M M m provenant de chacune des 4 directions Est Ouest Nord et Sud Le nombre d immigrants est stock contrairement au nombre d emigran
80. simultane dans chacune des populations La version modifi e de SPLATCHE permet de sp cifier dans quelle population un chantillon doit tre tir soit dans la population soit dans la population B soit ventuellement dans les deux la fois comme le montre la Figure 9 17 Dans les applications pr sent es aux chapitres 5 et 6 l echantillonnage est effectu uniquement dans la population survivante Hommes modernes ou N olithiques mais la possibilit d chantillonnage dans deux populations diff rentes peut tre int ressante dans des situations pour lesquelles des donn es g n tiques sont disponibles pour chacune des deux populations en comp tition CSSS TOR SES Ce APE CO SOS ST Population A ra eee rene gt ee Anc tre Genes commun chantillonn s MRCA Population B Boe ee ee ECC EEE EEE EEE ES EEE CDS K COOP EEE APCE EEE EEE EEE PER PET conne ee eee eee 000 ee ee ee eee een eue ee oro OPP ree eee errr EEE EEE ETES SEE SEE EEE TETE er ESS rere rere errr SEE ETS ESS SET rr rere er iter reer reer rrr reer rrr irri reer errr errr rss Figure 9 17 Sch ma d un arbre de coalescence pour 6 g nes dont 2 sont tir s de la population A et 4 de la population B 2 g nes dans un deme et 2 g nes dans un autre Annexe 4 4 Possibilite d extension a n populations L implementation d une seconde population a t r alis e de fa on a ce que dans le futur plus de deux populations diff rentes puissent volue
81. taux de natalit exc de le taux de mortalit et la taille de la population augmente Aux densit s sup rieures K le taux de mortalit exc de le taux de natalit et la population diminue K repr sente donc un quilibre Le dernier terme de l quation 3 2 permet de r guler l accroissement intrins que de la population En effet plus la densit de la population N se rapproche de la densit maximum du milieu K et plus la croissance sera faible pour tre finalement nulle lorsque la capacit du milieu est atteinte 1 Voir Tsoularis et Wallace 2002 pour une revue des diff rents types d quations logistiques 49 Les trois caract ristiques principales de l quation logistique sont Figure 4 3 i lim N K la population tend vers sa capacit de soutien t 00 ii Le taux de croissance relatif d cro t lin airement avec l accroissement de la densit et atteint 0 lorsque N K iii Au point d inflexion N est gal la moiti de K N K 2 et le taux de croissance absolu est son maximum et vaut rK14 4 3 1 2 Comp tition interpopulationnelle Afin de mod liser la comp tition entre deux populations nous avons d cid d utiliser le mod le de Lotka Volterra qui est le mod le classique de competition intersp cifique en cologie Il offre les avantages d tre relativement facile comprendre et a impl menter De plus il permet de mod liser de mani re satisfaisante les comportements d sir s
82. the sampled demes migrate to neighbouring demes and progressively diffuse in the environment They are brought back to the origin of the settlement process by the shrinking of the occupied portion of the simulated world which corresponds to the inverse of the assumed range expansion having started from East Africa range expansion on molecular diversity while varying para meters such as the carrying capacity and migration rates Ray et al 2003 Theoretical expectation of many statistics can be obtained with this simulation framework because thousands of coalescent simulations can be generated in a reasonable amount of time and later analysed with ARLEQUIN The role of particular environmental or demographic variables can then be thoroughly assessed by analysing the molecular diversity and obtaining the variance of the genetic processes By using heterogeneous carrying capa city and friction maps it is possible to consider very realistic situations in SPLATCHE Specific metapopulation models could be implemented and SPLATCHE could also be used to make prediction about the spatial range and molecular diversity of a set of population after a change in the environ ment man mediated or following a climatic change The graphical possibilities are also a major advantage of SPLATCHE The visualized superposition of the demographic and coalescent processes can lead to a better understand ing of some phenomenon for instance in the study of the
83. tout ce qui concerne les simulations g n tiques Cette classe contient toutes les caract ristiques n cessaires a une simulation g n tique notamment un vecteur de pointeurs de dimension n o n est gal au nombre d objets Cell simul s Chacun des pointeurs appartenant ce vecteur est dirig vers un objet TDeme dont la position correspond l index num rique Celllndex de l objet Cell correspondant L arbre de coalescence virtuel Ttree est galement un membre de TDemeCollection Ttree est un vecteur contenant 2n 1 TNode o n est le nombre de g nes chantillonn s dans le monde virtuel Chaque TNode repr sente un n ud de larbre de coalescence et poss de deux pointeurs descendants et un pointeur anc tre qui repr sentent les liens g n alogiques qui unissent les diff rents n uds de l arbre de coalescence gt pointe vers TDemeCollection _y repr sent par I eee eee eee ree eC reer reer EEE EEE EEE EEE EEE TEE EEE ETS EEE EST EE EEE ESS ES ETS rrr errr eee errr reece rrr errr rrrrr reer irre rer ETS EE EEE STE EEE TETE EE EE EEE EEE EST rece rrr reer errr reece errr ere rr rere e errr reer errr cece SEE rere errr rrr rrrr ree err rr ee eee rrr reece irre errr rr reer errr reer errr rere rrr rer errr reir Module g n tique Module TDemecollection d mographique Index unique Celllndex Demes vecteur de TDeme Tree ve s Vecteur de n uds _ TNodelList
84. underlying coalescent process depends mainly on the value of the product NW xX m and almost not on the absolute values of deme size or migration rate We note however that for a given low Nm value there is a slight decrease in the zero frequency class with larger N 80 Ray et al Table 1 Summary Statistics Describing the Pattern of Polymorphism Found in a Sample of 30 DNA Sequences Nm x Warn 5 Var 5 D 4 663 13 4 30 0 57 0 055 iA R 10 11 7 41 7 15 7 20 20 7 5 Q 56 9 85 9 1 77 50 7 8 8 3 76 4 97 6 2 25 100 7 9 7 8 5 2 88 0 2 40 200 8 0 7 6 90 8 72 8 2 48 250 8 0 7 5 93 1 74 6 2 51 S00 8 0 7 5 06 0 69 2 215 1000 8 0 7 3 96 9 71 4 2 57 NOTE PID lt 0 05 F PIF lt 0 05 0 03 1 56 0 00 0 26 0 42 0 01 0 87 3 63 0 29 1 00 11 38 0 99 1 00 15 93 1 00 1 00 19 61 1 00 1 00 21 81 1 00 1 00 23 13 1 00 1 00 23 98 1 00 The sequences are 300 bp drawn from a single deme after a spatial expansion that occurred t 27u 8 units of times ago In this case T 4 000 generations u 0 001 and the sampled deme was located in the center of the array of demes shown in figure LA and B at the same location as the origin of the expansion Mean number of differences between all pairs of sequence in the sample Number of segregating sites Tajima s D statistic Tajima 1989 Probability that Tajima s D statistic is found significant at the 3
85. variation and Irish origins Nature 404 351 2 Horai S Hayasaka K 1990 Intraspecific nucleotide sequence differences in the major noncoding region of human mitochondrial DNA Am J Hum Genet 46 828 42 Housley R A Gamble C S Street M Pettit P 1997 Radiocarbon evidence for the lateglacial human recolonisation of northern Europe Proc Prehist Soc 63 25 54 Hublin J J 1988 Le peuplement pal olithique de l Europe un point de vue pal obiog ographique Paper presented at Colloque international de Nemours Nemours Hublin J J 2002 Demographic crashes in Pleistocene Europe and Neanderthal evolution Paper presented at Human origins amp disease Cold Spring Harbor New York Hudson R R 1990 Gene genealogies and the coalescent process Vol 7 Oxford University Press oxford 202 Huntley B 1988 Glacial and holocene vegetation history 20 ky to present Europe In Huntley B Webb T eds Vegetation history Vol 7 Handbook of Vegetation Science Kluwer Academic Publishers pp 341 383 Hurles M E Veitia R Arroyo E Armenteros M Bertranpetit J Perez Lezaun A Bosch E Shlumukova M Cambon Thomsen A McElreavey K Lopez De Munain A Rohl A Wilson I J Singh L Pandya A Santos F R Tyler Smith C Jobling M A 1999 Recent male mediated gene flow over a linguistic barrier in Iberia suggested by analysis of a Y chromosomal DNA polymorphism Am J Hum Genet 65 1437 48 Hurles M E Jobling M A 2001
86. was used to calibrate the growth rates rps the rate of migration Mys and the Neanderthal carrying capacity Kpn as these three parameters have an influence on the speed of the migration wave Since modern humans arrived in Europe approximately 40 000 ago and occupied the whole continent by 27500 BP the colonization process lasted approximately 500 generations assuming an average generation time of 25 to 30 years Scenarios of modern human range expansion in Europe Among the many sets of parameter values leading to such a colonization time and the complete disappearance of Neanderthals we have retained the following scenarios Scenario A Origin of HS in a single deme of the Near East at the border between Saoudi Arabia and Jordany Mps Man 0 25 run 0 4 and Kpn 10 rus 0 4 Kps 40 Note that a value of Kyy of 10 corresponds to a total density of about 140 000 Neanderthals over Europe 0 016 individuals per km which is of the same order of magnitude as 107 Absence of admixture between modern humans and Neanderthals the rare available estimates 250 000 Neanderthals Under this scenario we have only considered admixture events between HN females and HS males such that 4s y 0 Six alternative scenarios have been considered Scenario B is identical to scenario A except that the HS origin is located in Iran Scenario C uses the same parameters as scenario A but the HS source is more diffu
87. where we show three random genealogies for three values of Nm 5 25 and 200 As could be inferred from figure 1 there are many recent coalescent events in demes sending only a few migrants to neighboring demes whereas recent coalescent events are rare in demes sending many migrants resulting in very long terminal branches in the genealogies Note that very similar gene genealogies with long terminal branches are observed in an unsubdivided population after a demo graphic expansion Slatkin and Hudson 1991 Rogers and Harpending 1992 The sampling location and the geographical location of the expansion have no effect on the pattern of molecular diversity in our homogeneous environment for large Nm values whereas we observe a slight reduction in genetic diversity for demes that are sampled in the periphery of the simulated population for low Nim values independent of the origin of the expansion table 2 Tajima s D statistic seems sensitive to the sampling location for low Nm values as demes sampled in the center show a significant negative D value in 22 to 26 of the cases at the 5 level whereas demes sampled in the periphery only show significant D values in 7 to 8 of the simulations Mismatch Distributions The empirical distributions of the number of differ ences between pairs of genes identified here as mismatch distributions for sake of brevity are shown in figure 3 for a subset of the cases described in table 1 In
88. 00 The history of european populations as seen by archaeology In Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeological Research University of Cambridge Cambridge pp 41 44 Ovchinnikov I V Gotherstrom A Romanova G P Kharitonov V M Liden K Goodwin W 2000 Molecular analysis of Neanderthal DNA from the nothern Caucasus Nature 404 490 493 Parson W Parsons T J Scheithauer R Holland M M 1998 Population data for 101 Austrian caucasian mitochondrial DNA d loop sequences Application of mtDNA sequence analysis to forensic case Int J Legal Med 111 124 132 Pennington R 2001 Hunter gatherer demography In Panter Brick C Layton RH Rowley Conwy P eds Hunter gatherers an interdisciplinary perspective Cambridge University Press pp 170 204 Pereira L Dupanloup l Rosser Z H Jobling M A Barbujani G 2001 Y chromosome mismatch distributions in Europe Mol Biol Evol 18 1259 71 Piazza A Rendine S Minch E Menozzi P Mountain J Cavalli Sforza L L 1995 Genetics and the origin of European languages Proc Natl Acad Sci U S A 92 5836 40 Piercy R Sullivan K M Benson N Gill P 1993 The application of mitochondrial DNA typing to the study of white Caucasian genetic identification Int J Legal Med 106 85 90 Pinhasi R Foley R A Lahr M M 2000 Spatial and temporal patterns in the Mesolithic Neolithic archaeological record of Euro
89. 00 SNPs ve f 100 SNPs freq 2 10 an D C Cc ab O D D LL mode 8 LL mode 20 Diff rences Diff rences Figure 3 2 Distribution mismatch moyenne ligne paisse pour 1000 simulations et intervalle de confiance a 90 lignes fines Colonne de gauche tous les SNPs sont consid r s Colonne de droite SNPs dont la fr quence de l all le le plus rare est sup rieure ou gale 10 La valeur du mode principal voir texte est donn e pour chaque figure 32 10 20 30 40 50 a Nm 2 6 l b Nm 100 A Se o a Figure 3 3 Exemples de g n alogies de genes chantillonn s A dans le cas d un petit Nm 2 B dans le cas d un grand Nm 100 Le choix des SNPs dont la fr quence est lev e dans la population cercles gris porte sur les mutations qui ont lieu sur les branches internes Il est repr sentatif des mutations points noirs qui s accumulent galement sur ces branches lorsque Nm est petit mais pas lorsqu il est grand Nous avons donc montr ici que les distributions mismatch tir es de SNPs permettent d estimer le Nm de la population chantillonn e seulement si le biais de recrutement est nul ou tres restreint Si ce biais est important aucune inference ne peut tre faite sur la d mographie de la population l aide des distrib
90. 00 ans que les Hommes modernes Homo sapiens sapiens colonisent le continent europ en Mellars 1992 Mellars 1998 Otte 2000 Stringer et Davies 2001 Klein 2003 d une part a partir des plaines de Russie qui ont servi de corridor et d autre part a partir du Proche Orient Bocquet Appel et Demars 2000a 2000b La pr sence de l Homme moderne en Europe est attest e principalement par des vestiges lithiques appartenant la culture aurigniacienne qui lui est associ e Cependant l origine exacte de l Homme moderne europ en n est pas encore connue le Moyen Orient a t longtemps candidat mais l Aurignacien du Levant y semble plus r cent L Asie centrale est un candidat actuellement examin mais il n a pas t trouv jusqu pr sent de site aurignacien ant rieur 35 000 BP Djindjian et al 1999 p 162 La diffusion de l Homme moderne en Europe a t extr mement rapide et a sans doute contribu a l extinction des H neandertalensis alors diss min s sur tout le continent Bien que la coexistence entre les deux populations dure plusieurs milliers d ann es 10 000 15 000 ans il semble qu il ne s agisse pas d une r elle cohabitation dans les m mes lieux mais plut t d une existence simultan e dans des r gions voisines Les H neandertalensis ont par exemple occup pendant pr s de 10 000 ans le sud de la p ninsule ib rique pendant que les H s sapiens peuplaient le nord de cette p ninsule Mellars 1998
91. 001 Steele et al 1998 As it is largely accepted that the Neolithic transition coincides with the beginning of a significant increase in the population size Bocquet Appel amp Dubouloz 2003 Cavalli Sforza amp Feldman 2003 Hassan 1979 Landers 1992 we have set Kpr to 800 a value 20 times larger than Kpc As K represents here the effective number of gender specific genes mitochondrial or Y chromosome the total density simulated for the 5 500 demes constituting Europe is about 880 000 HG and 15 million farmers which are in broad agreements with the estimated number of people living in the Paleolithic and the Neolithic in Europe respectively Biraben 2003 Note also that K values larger than 800 do not affect the results substantially results not shown While it has been estimated that 500 generations were necessary for HG to colonize Europe Bocquet Appel amp Demars 2000 the Neolithic transition was much more rapid and took roughly between 4 000 and 8 000 years Mazuri de Keroualin 2003 Price 2000 corresponding to 160 320 generations with a generation time of 25 years These colonization times were used to calibrate the growth r and migration m rates Values of rpc 0 4 re 0 8 and m 0 25 give colonization times in good agreement with figures mentioned above see Table 1 Note that a growth rate of 80 per generation is very high but is within the upper range of rates considered as plausible for the human species Ammerman
92. 1 I 1 1 I l I 1 1 I I 1 I 1 I I perc AT Shea oie 1 NS Re a ee RE I I I L I 1 1 I I 1 I I l I I 1 I 1 1 1 1 j T 1 1 1 1 I 1 1 Sagi tn Dae ot Cora a tae oh cle iets Eat SS Se ee eee ee a 1 l 1 1 1 I I 1 I 1 1 I 1 1 1 j 1 I I 1 1 1 1 1 Pagel ean E al Se Me a aN er E I 1 I 1 I I 1 I I I 1 1 1 1 1 j 1 1 1 1 1 I 1 2 1 I 1 1 1 I I 1 I 1 1 I L ro Lym 1 1 1 1 I 1 I 1 1 I 1 1 I I 1 I 1 1 I 1 I 1 1 I I I I f I f I 1 T C R sou re aa Ia UT ass hae ee ae ts NT TED I I I I I I I I I I I pak 1 I j T 1 I I 1 I I 1 I ae fee See R Seco ome eee Soba ota ass Sa I I 1 1 I 1 ET 1 1 i I 1 1 1 1 1 1 1 1 1 I 1 I 1 I 1 1 f I I 1 SSN mere og ley ras Dee FR lhe Wee eo ET tel Sa Ses pits Mie eg i oe a Te 1 1 1 1 1 i 1 1 1 1 1 1 1 i 2 1 I I entorse Shee E A E a E E e A E E ue 1 1 1 1 I 1 1 1 1 1 I 1 I I I I I 1 l 1 I I I I 1 I I I 1 I 1 1 I SSR nn RS rl ae SE l 1 1 1 I I 1 1 1 I 1 1 a 1 1 l I I 1 I I I 1 f 1 Tee ly pore a TON nn areal tt eee ae Sone eal prt nate pal e gla eas Pal a T 1 l 1 1 I T 1 I 1 1 I I I 1 1 I I I 1 I I I I js CC 4q ee en a a 1 1 1 1 1 1 1 I 1 1 1 I 1 1 I 1 1 l i I MESEN 1 I 1 I f I I I a We ees PS Gan oS lp Le ep Ten One eo ITU ea Sa MEN 1 1 1 1 1 1 1 I I 1 I 1 1 1 I 1 1 1 1 I I 1 1 1 1 I Hess sobosiue
93. 1988 0 1 1 0 0 006 0 015 Landers 1992 0 1 0 75 X7 5 0 25 0 5 Calafell et Bertranpetit 1993 0 2 0 3 Cavalli Sforza et al 1994 0 1 0 75 Young et Bettinger 1995 0 04 0 9 x22 0 5 Barbujani et al 1995 x10 Cavalli Sforza 1996 0 15 0 8 Fix 1997 0 015 0 2 0 3 0 9 Steele et al 1998 0 12 Anderson et Gillam 2000 0 026 Bocquet Appel et Demars 2000a 0 02 100 3 300 x3 x150 Zvelebil 2000 0 02 100 1 70 x0 7 x50 Zvelebil 2000 0 0024 0 9 Pennington 2001 0 04 0 08 0 5 Alroy 2001 0 03 0 07 Eswaran 2002 0 01 0 35 Binford 2001 Ray 2003 x10 Biraben 2003 Table 4 1 Estimations des densit s par km et des taux de croissance par g n ration des populations de chasseurs collecteurs CC et des populations n olithiques AG La plupart des informations dont nous disposons sur la d mographie des populations de chasseurs collecteurs pal olithiques et m solithiques sont tir es de comparaisons faites sur la base d observations de populations de chasseurs collecteurs contemporains Cependant rien ne nous permet d affirmer que les ethnies de chasseurs collecteurs actuelles ont une d mographie comparable aux populations du pass En effet alors que ces derni res exploitaient pratiquement tous les types de terrains Roebroeks 2001 les chasseurs collecteurs contemporains ne subsistent que par petits groupes et sont confin s dans des zones le plus souvent d favor
94. 1992 Population growth makes waves in the distribution of pairwise genetic differ ences Mol Biol Evol 9 552 569 Rogers A R and L B Jorde 1995 Genetic evidence on modern human origins Hum Biol 67 1 36 Rousset F 1996 Equilibrium values of measures of population subdivision for stepwise mutation processes Genetics 142 1357 1362 1997 Genetic differentiation and estimation of gene flow from F statistics under isolation by distance Genetics 145 1219 1228 Schneider S and L Excoffier 1999 Estimation of demographic parameters from the distribution of pairwise differences when the mutation rates vary among sites application to human mitochondrial DNA Genetics 152 1079 1089 Schneider S D Roessli and L Excoffier 2000 ARLEQUIN a software for population genetics data analysis Version 2 000 University of Geneva Geneva Switzerland Sherry S T A R Rogers H Harpending H Soodyall T Jenkins and M Stoneking 1994 Mismatch distributions of mtDNA reveal recent human population expansions Hum Biol 66 761 775 Slatkin M 1987 The average number of sites separating DNA sequences drawn from a subdivided population Theor Popul Biol 32 42 49 1995 measure of population subdivision based on microsatellite allele frequencies Genetics 139 457 462 Slatkin M and R R Hudson 1991 Pairwise comparisons of mitochondrial DNA sequences in stable and exponentially growing populations
95. 1998 Casalotti et al 1999 Quintana Murci et al 1999 Barbujani et Chikhi 2000 Hill et al 2000b Rosser et al 2000 Jusqu r cemment Richards et al 2002 aucun gradient de fr quence quivalent n avait t observ pour le genome mitochondrial Richards et al 1996 Richards et al 1998 Richards et al 2000 except le long de la M diterran e Simoni et al 2000 La presence de ces gradients a t principalement attribu e la diffusion des premiers agriculteurs originaires du Proche Orient Menozzi et al 1978 Ammerman et Cavalli Sforza 1984 Casalotti et al 1999 Barbujani et Chikhi 2000 Hill et a 2000b Rosser et al 2000 Quintana Murci et al 2003 Plus recemment des auteurs ont mis en doute cette interpretation en proposant que ces gradients r sultent soit de l arriv e des premiers Hommes modernes Richards et al 1996 Barbujani et al 1998 Barbujani et Bertorelle 2001 Barbujani et Dupanloup 2002 soit d un effet s lectif Fix 1996 Cette s lection pourrait avoir eu lieu sur des g nes de r sistance aux maladies infectieuses chez l Homme maladies transmises par des pathog nes venant des animaux Plus les agriculteurs ont t pres du lieu d origine de la domestication et plus longtemps ils auraient subi cette s lection Fix 1996 L observation de gradients de fr quences pour plusieurs locus diff rents est cependant un argument contre la s lection dont les effets se font g n ralement sen
96. 20 November 2003 It is now widely admitted that climatic changes had and still have a profound impact on the distribution and the genetic diversity of many animal and plant species e g Taberlet et al 1998 Hewitt 2000 Barnes et al 2002 Walther et al 2002 At any given time the distribution of a species and its diversity are heavily influenced by the environmental heterogeneity e g Brachet et al 1999 Wakeley amp Aliacar 2001 Hanski amp Ovaskainen 2003 For example spatial fluctuations in food resources can lead to major differences in the sizes of subpopulations and some landscape elements can act as barriers to migrations or in the contrary facilitate migration and act as corridors along which a larger amount of individuals can migrate Therefore due to the importance of the environment on real genetic processes we have developed a program called SPLATCHE for the simulation of sampled molecular diversity explicitly taking into account the spatial heterogeneity of the environment SPLATCHE is actually based on a two step simulation process environmental information is first used to simulate forward in time the demographic and migration history of a set of subpopulations and the resulting information is Correspondence Professor Laurent Excoffier Fax 41 31 631 48 88 E mail laurent excoffier zoo unibe ch These two authors have contributed equally to this work 2004 Blackwell Publishing Ltd 10 then used i
97. 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 99 56 58 59 60 61 62 63 64 Absence of admixture between modern humans and Neanderthals Barbujani G amp Dupanloup DNA Variation in Europe estimating the demographic impact of Neolithic dispersals in Examining the farming language dispersal hypothesis eds Bellwood P amp Renfrew C 421 431 McDonald Institute Monographs Cambrigs 2002 Excoffier L amp Schneider S Why hunter gatherer populations do not show sign of Pleistocene demographic expansions Proceedings of the National Academy of Sciences USA 96 10597 10602 1999 Ray N Currat M amp Excoffier L Intra deme molecular diversity in spatially expanding populations Mol Biol Evol 20 76 86 2003 Stringer C Modern human origins progress and prospects Philos Trans R Soc Lond B Biol Sci 357 563 79 2002 Eckhardt R B Wolpoff M H amp Thorne A G Multiregional evolution Science 262 973 4 1993 Wolpoff M H Hawks J amp Caspari R Multiregional not multiple origins Am J Phys Anthropol 112 129 36 2000 Djindjian F Koslowski J amp Otte M Le Pal olithique sup rieur en Europe 474 Armand Colin Paris 1999 Kozlowski J amp Otte M The formation of the Aurignacian Journal of Anthropological Research 56 513 524 2000 Alroy J multispecies overkill simulation of the end Pl
98. 35 179 196 Nagylaki T 1998 The expected number of heterozygous sites in a subdivided population Genetics 149 1599 1604 Nielsen R 2000 Estimation of population parameters and recombination rates from single nucleotide polymorphisms Genetics 154 93 1 942 Nordborg M 1997 Structured coalescent processes on different time scales Genetics 146 1501 1514 2001 Coalescent theory Pp 179 212 in D Balding M Bishop and C Cannings eds Handbook of statistical genetics John Wiley amp Sons New York Notohara M 1990 The coalescent and the genealogical process in geographically structured population J Math Biol 29 59 75 Pereira L I Dupanloup Z H Rosser M A Jobling and G Barbujani 2001 Y chromosome mismatch distributions in Europe Mol Biol Evol 18 1259 1271 Pritchard J K M T Seielstad A Perez Lezaun and M W Feldman 1999 Population growth of human Y chromo somes a study of Y chromosome microsatellites Mol Biol Evol 16 1791 1798 Reich D E and D B Goldstein 1998 Genetic evidence for a Paleolithic human population expansion in Africa Proc Natl Acad Sci USA 95 8119 8123 Rendine S A Piazza and L L Cavalli Sforza 1986 Simulation and separation by principal components of multiple demic expansions in Europe Am Nat 128 68 1 706 Rogers A 1995 Genetic evidence for a Pleistocene population explosion Evolution 49 608 615 Rogers A R and H Harpending
99. 4 24 Illustration A et sch ma B d un torre 89 4 5 4 Discussion Nous avons montr dans la section pr c dente 4 5 3 qu il existe trois p riodes principales o se produisent des coalescences S1 C7 et C2 Figure 4 25 lorsque deux expansions d mographiques et spatiales se succ dent dans la m me aire Le goulet d etranglement qui est cr au debut de la seconde expansion n olithique donne naissance une troisi me p riode C7 propice aux coalescences qui n existe pas dans le cas d une expansion unique Figure 4 25 Le nombre de coalescences qui a lieu durant cette p riode C7 est plus ou moins grand selon importance des param tres d mographiques dont les quatre plus influents sont par ordre d importance la valeur du param tre Nm de la seconde population N4agm lhybridation la localisation de l chantillon par rapport au goulet et le nombre d individus qui compose ce dernier Les autres param tres n ont qu une influence plus modeste Expansion simple B Expansion double Ts 4 mme Hl Til A We leat sili rps pos TE er a RE EE j p L C2 S1 C2 M CTI d S1 Figure 4 25 Exemples de g n alogies de g nes obtenus dans le cas d une simple A ou d une double B expansion d mographiqu
100. 4 3 Nous avons choisi de faire varier les param tres rac et rcc entre les valeurs 10 et 80 et nous avons retenu des densit de chasseurs collecteurs situ es entre 0 02 et 0 8 individus par km L intervalle de valeurs utilis pour la densit n olithique se situe entre 0 04 et 8 individus par km l utilisation de densit s sup rieures cet intervalle ne changent rien aux conclusions tir es de nos r sultats Il est cependant n cessaire de convertir ces densit s en individus par km en valeurs de capacit de soutien applicables nos d mes virtuels qui sont en nombres de g nes efficaces Sachant que la taille efficace d une population Nz est approximativement gale la moiti de sa taille de recensement N N 2 et que la surface d un deme repr sente 2 500 km le nombre de chasseurs collecteurs efficace est compris entre 25 et 1 000 et celui d agriculteurs entre 50 et 10 000 Les capacit s de soutien pour les chasseurs collecteurs estim es ici sont compatibles avec les estimations de la taille des groupes en connexion qui varient entre 150 et 1 000 individus Lee et DeVore 1968a Hassan 1981 Cavalli Sforza et King 1986 Roebroeks 2001 r partis en bandes de 25 Birdsell 1968 Landers 1992 Il faut noter que la capacit de soutien Kac pour les n olithiques est habituellement consid r e comme tant entre 2 fois et 50 fois plus grande que celle des chasseurs collecteurs soit entre 50 et 50 000 individus
101. 5 level estimated from 1 000 simulations Fu s Fe statistic Fu 1997 Probability that Fu s Fg statistic is found significant at the 5 level estimated from 1 000 simulations values fig 5 left column with K 500 and K 1 000 as compared with K 100 Note that no such effect is observed for large Nm values as shown in the right column of figure 5 This phenomenon may be due to the fact that with low N values implying a large m value several gene lineages may initially comigrate in the same deme and subsequently coalesce whereas with smaller m values gene lineages will migrate once at a time The comigration of genes in the same deme thus slightly Increases the probability of recent coalescent events leading to the slightly larger probabilities of no differences between genes sampled in demes of small size and exchanging a large fraction of genes with their few neighbors The age of the expansion seems to affect the pattern of diversity in a more drastic way for low than for large Nm values table 3 For Nm 500 Tajima s D and Fu s Fs statistics are very efficient in detecting departure from population equilibrium irrespective of the age of the expansion In contrast for Nm 10 Tajima s D statistic is much less powerful showing departure from equilibrium between only one fourth and one third of the cases For the same amount of gene flow the behavior of the test based on Fu s F statistic is markedly different
102. 5 Sch ma du mod le utilis pour simuler la d mographie de deux populations A et B Il s agit de deux matrices de d mes superpos es chacune repr sentant l une des populations Des migrations intrapopulationnelles sont possibles entre d mes voisins l int rieur de chaque couche et des migrations interpopulationnelles hybridation sont possibles entre d mes en vis vis appartenant a des couches diff rentes 193 Annexe 4 2 Relations ancestrales entre populations differentes La simulation de deux populations diff rentes implique galement l existence de deux origines une pour chacune d entre elles Un arbre de coalescence n ayant qu une seule racine il a donc fallu d finir les relations ancestrales entre les populations afin de permettre la simulation de donn es g n tiques Deux strat gies diff rentes ont t labor es cette fin Figure 9 16 Strategie 1 La seconde population B est issue d individus appartenant la premi re population A Pendant la phase d mographique a un temps choisi par l utilisateur t 0 dans Figure 9 16 un nombre n d individus appartenant a un deme de la population A migre dans le d me homologue de la population B alors que tous les autres d mes appartenant la matrice repr sentant la population B sont vides Cette strat gie illustre par exemple le cas du N olithique europ en chapitre 6 puisque des chasseurs collecteurs appartenant des demes du Proche Orient
103. 50 g nes efficaces Nous verrons dans la section 4 5 3 ce que nous pouvons dire de l influence de la taille de ce goulet 4 5 2 Estimation des param tres Avant de se lancer dans une s rie de simulations il importe de d finir un intervalle de valeurs r alistes pour chacun des param tres d mographiques du mod le Cet espace de valeurs de param tres raisonnables permettra d une part de limiter le nombre de simulations effectuer et d autre part de pallier l impr cision qui existe dans les estimations des variables d mographiques Nous allons donc passer en revue les valeurs attribu es dans la litt rature aux diff rents param tres 66 d mographiques des populations humaines et essayer de les convertir en valeurs utilisables a l aide de notre approche La Table 4 1 r sume les estimations des densit s et des taux de croissance tir es de la litt rature et mentionn es dans le texte ci dessous p e te D p ie Facteur Es pa a R f rence 1 2 Birdsell 1957 lt 1 0 Lee et DeVore 1968a 1 05 Mosimann et Martin 1975 0 01 1 0 lt 0 003 Hassan 1979 0 03 2 0 x27 lt 0 003 Hassan 1981 0 02 0 03 Hewlett et al 1982 0 01 1 0 3 288 x100 0 15 0 8 Ammerman et Cavalli Sforza 1984 th orie 0 02 0 4 x20 0 25 0 5 Ammerman et Cavalli Sforza 1984 simulations 0 28 Weiss 1984 0 04 1 07 x28 0 25 0 5 Rendine et al 1986 0 6 Winterhalder et al 1988 0 87 Belovsky
104. 6 18 4 6 8 10 12 14 16 18 Diff rences Diff rences Figure 4 21 Distributions mismatch moyennes simul es dans le cas d un chantillonnage sur le lieu d oirigne de l expansion n olithique ou en p riph rie de celle ci lorsque le taux d hybridation y varie En traitille l intervalle 90 Necm 10 Naam 17000 rcc 0 3 raa 0 5 et m 0 1 86 Echantillonnage local Echantillonnage peripherique 0 4 0 4 A Y B 0 3 0 3 LA Es N x g x s 5 5 5 0 2 4 A 0 00 2 ex oO D SO LL LL 0 1 0 4 6 8 10 12 14 16 18 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 0 4 C D 0 3 0 3 O a O O O 5 x 5 5 0 2 S 0 05 O 8 LL LL 0 1 0 T T T T 4 6 8 10 12 14 16 18 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 0 4 E F 0 3 0 3 O j Tru O CRE z z 0 20 2 A 2 0 2 D 02 oO D LL LL 0 1 0 1 0 0 l l l l l l fee oo g 4 6 8 10 12 14 16 18 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 0 4 0 3 0 3 b 1 00 2 S 0 2 S 0 2 3 P LL 0 1 0 1 0 T T T T T pomm 4 0 4 6 8 10 12 14 16 18 2 4 6 8 10 12 14 16 18 Differences Diff rences Figure 4 22 Distributions mismatch moyennes simul es dans le cas d un chantillonnage sur le lieu d origine de l expansion n olithique ou en p riph rie de celle ci lo
105. 840 cellules dans lesquelles ont lieu les simulations de Rendine et al 1986 Les inconv nients du mod le propos par Rendine ef al sont les suivants i La condition Nag lt 1 y doit toujours tre respect e pour que le nombre d migrants interpopulationnels ne d passe pas la taille de la population source CC dans le cas contraire la densit de la population CC devient n gative Les param tres peuvent tres ais ment choisis pour remplir cette condition dans un monde homog ne lorsque les valeurs de Kac et de y sont constantes mais cela devient probl matique dans un monde h t rog ne ou lorsque diff rentes combinaisons de param tres sont utilis es ii Le taux d acculturation y migrations interpopulationnelles au moment de la transition n olithique est un param tre inconnu et extr mement difficile estimer Or dans le travail de Rendine et al il est fix une valeur dont la pertinence est difficilement justifiable et dont la Signification n est pas claire nos yeux Il nous paraitrait plus ad quat d utiliser un mod le qui permette de faire varier le nombre de migrations interpopulationnelles afin d avoir une bonne repr sentativit de l influence de ce param tre iii Le nombre de migrants qui passent par acculturation de la population CC vers la population AG par deme et pendant la dur e d une simulation est d au moins 350 Il s agit donc d une grande 44 valeur Si l on traduit ces chiffres e
106. 99 443 9 199 Comas D Calafell F Bendukidze N Fananas L Bertranpetit J 2000 Georgian and kurd mtDNA sequence analysis shows a lack of correlation between languages and female genetic lineages Am J Phys Anthropol 112 5 16 Conard J N Bolus M 2003 Radiocarbon dating the appearance of modern humans and timing of cultural innovations in Europe new results and new challenges Journal of Human Evolution 44 331 371 Corte Real H B Macaulay V A Richards M B Hariti G Issad M S Cambon Thomsen A Papiha S Bertranpetit J Sykes B C 1996 Genetic diversity in the Iberian Peninsula determined from mitochondrial sequence analysis Ann Hum Genet 60 331 50 Crawford M H 1998 The origins of Native Americans Cambridge University Press Cambridge Currat M 1999 Etude de la variabilit allozymiques des Valaisans et des Walsers Dipl me de Biologie Universit de Gen ve Gen ve Currat M Trabuchet G Rees D Perrin P Harding R M Clegg J B Langaney A Excoffier L 2002 Molecular Analysis of the beta Globin Gene Cluster in the Niokholo Mandenka Population Reveals a Recent Origin of the betaS Senegal Mutation Am J Hum Genet 70 207 223 Dard P Schreiber Y Excoffier L Sanchez Mazas A Shi lsaac X Epelbouin A Langaney A Jeannet M 1992 Polymorphism of HLA class loci HLA A B C in the Mandenka population from eastern Senegal C R Acad Sci III 314 573 8 Dard P Lefranc M P Osipova L Sa
107. 999 I999 9999 3999 9999 o yo 9999 SIO So 99 29999 9999 Vo yoo 9 999 3 4 4 Dynamic simulations and conversion tables to obtain K and F It is possible in SPLATCHE to do dynamic simulations A dynamic simulation allows variation of carrying capacity and or friction value at different time during the course of a simulation In order to set at what time the changes occur different files are needed The two main files which are set through the settings files are typically called Dynamic K txt and Dynamic F txt On the first line of each of this file appears the number of changes during a simulation Then each line one per change is composed by the time of change in generations the filename of the corresponding table see below and an arbitrary description The three components of each line must be separated by a blank space For a non dynamic simulation only the first filename is considered regardless of the number indicated on the first line Example of Dynamic K txt file 2 0 dataSets_africa veg2K txt vegetation at time 0 500 dataSets_africa veg2K_500 txt doubling of vegetation at time 500 Each file name must targets to a valid corresponding table that makes the link between a particular vegetation category and a carrying capacity or friction value A corresponding table is composed of a vegetation category number followed by a carrying capacity or friction value and by a description The vegetation ca
108. Al Zahery N Semino O Benuzzi G Magri C Passarino G Torroni A Santachiara Benerecetti A S 2003 Y chromosome and mtDNA polymorphisms in Iraq a crossroad of the early human dispersal and of post Neolithic migrations Mol Phylogenet Evol 28 458 72 Ammerman A Cavalli Sforza L L 1971 Measuring the rate of spread of early farming in Europe Man 6 674 688 Ammerman A Cavalli Sforza L L 1984 The Neolithic transition and the genetics of populations in Europe Princeton University Press Princeton New Jersey Anderson D G Gillam C 2000 Paleoindian colonization of the Americas implications from an examination of physiography demography and artifact distribution American Antiquity 65 43 66 Anderson S Bankier A T Barrell B G de Bruijn M H Coulson A R Drouin J Eperon I C Nierlich D P Roe B A Sanger F Schreier P H Smith A J Staden R Young G 1981 Sequence and organization of the human mitochondrial genome Nature 290 457 65 Aoki K 1996 Modelling the spread of early farming and of the early upper palolithic in Europe In Omoto K Tobias PV eds The Origins and Past of Modern Humans Towards Reconciliation Vol 3 Recent Advances in Human Biology World Scientific Kyoto pp 206 227 Aoki K Shida M Shigesada N 1996 Travelling Wave Solutions for the Spread of Farmers into a Region Occupied by Hunter Gatherers Theor Popul Biol 50 1 17 Appenzeller T Clery D Culotta E 1998 Archeolo
109. Aris Brosou and Excoffier 1996 the study of mitochon drial DNA in many human populations suggests that most human populations have experienced Pleistocene demographic expansions Sherry et al 1994 Rogers 1995 Rogers and Jorde 1995 Harpending et al 1998 Excoffier and Schneider 1999 Schneider and Excoffier 1999 Similarly microsatellite data from the Y chromo some were better explained with models based on past expansion than on stationarity Pritchard et al 1999 In contrast analyses of Y chromosome single nucleotide polymorphism SNP did not provide any clear evidence for demographic expansions Pereira et al 2001 Studies with nuclear markers have also provided ambiguous results Signals of expansion were found in some but not in all populations analyzed for microsatellite data Reich and Goldstein 1998 Beaumont 1999 Goldstein et al 1999 SNP studies showed no signs of expansion when single populations were considered Nielsen 2000 Wake ley et al 2001 whereas signals of expansions were found in a subdivided population model Wakeley et al 2001 It is apparent that under existing demographic models it is difficult to establish a clear and consistent explanation for the observed patterns of human molecular diversity Discrepancies regarding signs of demographic expansions may be due to differences in demographic histories among regions Reich and Goldstein 1998 Goldstein et al 1999 and among ethnic groups food pr
110. CATIONS DU PROGRAMME SPLATCHE AFIN DE SIMULER LES INTERACTIONS ENTRE DEUX POPULATIONS DIFFERENTEG 2 0 cccccscececececececececeeecess 193 ANNEXE 4 1 DEUX MATRICES DE DEMES SUPERPOSEES ccececececacceccaccececucececececacececeueeeceveeass 193 ANNEXE 4 2 RELATIONS ANCESTRALES ENTRE POPULATIONS DIFFERENTES ice 194 ANNEXE 4 3 ECHANTILLONNAGE SIMULTANE DANS CHACUNE DES POPULATIONG 2cecesececececess 195 ANNEXE 4 4 POSSIBILITE D EXTENSION A N POPULATIONS ccccececcccccccccecececccececucacucuceueuecerenars 195 10 BIBLIOGRAPHIE caceitaces chncactvnedsiacacsandecnsiacavavndestndanoavetenusenceanaeoansindscateconuaacseananecadeebnoancctals 197 1 Introduction Generale L origine de notre esp ce Homo sapiens sapiens et la reconstruction de son histoire sont des sujets fascinants qui ont toujours captive les Hommes Les moyens utilis s pour retracer le passe des humains n ont cess d voluer et diverses disciplines se sont attelees a cette t che ardue Parmi les plus r centes la g n tique des populations a t d un apport inestimable a la comprehension de l volution d Homo sapiens sapiens Des approches permettant d utiliser les donn es g n tiques actuelles pour retracer l volution de l Homme ont ainsi t d velopp es et la complexit de ces techniques a rapidement augment au cours du temps De m me le type de donn es g n tiques tudi es a beaucoup volu passant des ph notypes par exemple les
111. Donnelly et Tavar 1995 Nordborg 2001 Cette approche permet de reconstruire en remontant dans le temps la g n alogie d une s rie de genes chantillonn s au pr sent jusqu leur anc tre commun le plus r cent leur MRCA Most Recent Common Ancestor Figure 9 3 Les lignages des genes ou leur g n alogie est reconstruite jusqu au moment ou deux d entre eux poss dent un anc tre commun Il s agit d un v nement de coalescence Cette coalescence a lieu dans un individu qui a transmis obligatoirement au moins deux copies d un m me g ne des descendants distincts Apr s chaque coalescence le nombre de lignages diminue d une unit Il est donc possible de continuer ce processus jusqu au moment o il n existe plus qu un seul lignage le MRCA Le temps qui s coule du pr sent jusqu au MRCA est appel TMRCA Time to the Most Recent Common Ancestor Lorsque n g nes sont chantillonn s n 1 v nements de coalescence ont lieu A la fin du processus un arbre de coalescence est constitu dont la racine est le MRCA et les branches terminales sont les g nes chantillonn s 176 MRCA Anc tre commun Passe evenement de coalescence TMRCA temps de lignages coalescence genes echantillonnes Figure 9 3 Exemple d un arbre de coalescence de cinq g nes chantillonn s L arbre de coalescence repr sente donc la g n alogie des g nes qu il ne faut pas confondre avec une g n
112. Figure 9 13 Distribution spatiale d v nements de coalescence apr s l expansion d une population originaire du Proche Orient fl che blanche 20 chantillons de 40 g nes sont chantillonn s 1 000 fois le long d un axe allant du Liban l Irlande Des ponts de terre artificiels sont simul s dans des endroits o le passage d individus est hautement probable la Manche Gibraltar etc Les cercles blancs soulignent les goulets spatiaux dans lesquels la densit de coalescence est importante ce qui correspond de forts effets fondateurs lors de la vague de migration 189 Annexe 3 3 Distribution des MRCA SPLATCHE permet galement la visualisation de la distribution spatiale des anc tres communs les plus r cents soit pour les g nes appartenant a un chantillon particulier x MRCAx soit pour la totalit des chantillons MRCA La visualisation des MRCAX avec x compris entre 1 et 5 pour 5 chantillons de 40 genes situ s a diff rents endroits de l Europe permet de souligner l importance des goulets spatiaux Figure 9 14 En effet la densit des MRCA est tr s forte apres un goulet dans la direction de la source de la population en expansion Figure 9 14A E Ceci s explique par le fait que de nombreuses coalescences ont lieu dans la r gion du goulet voir ci dessus et que par cons quent le nombre de lignages qui subsistent apr s le passage par le goulet est faible Il suffit que ces derniers lignages coalescen
113. HE dans un contexte relativement complexe Puis dans les chapitres 5 et 6 nous pr sentons galement deux recherches effectu es l aide d une version d riv e du programme SPLATCHE 3 Expansion spatiale dans un contexte inoccupe 3 1 Introduction Les expansions spatiales de populations ont t fr quentes pendant le Quaternaire non seulement pour l esp ce humaine mais galement pour de nombreux autres organismes En effet lors des p riodes glaciaires la r partition g ographique de nombreuses esp ces se r duit a des zones refuges de petite taille voir p ex Taberlet ef al 1998 Hewitt 2000 Lorsque le climat devient plus clement ces esp ces qui ont pass plusieurs g n rations avec des effectifs faibles colonisent de nouveaux territoires partir des zones refuges II s ensuit donc une expansion spatiale combin e une croissance d mographique souvent dans des zones inoccup es par le m me type d organisme Les cons quences d une expansion spatiale sur la structure g n tique d une population ont t encore tr s peu tudi es et nous nous y int ressons ici Dans ce chapitre nous exposons deux applications du logiciel SPLATCHE lui m me pr sent dans le chapitre 2 La premi re qui est pr sent e sous la forme d un article publi e dans Molecular Biology and Evolution en 2003 concerne l tude de la diversit g n tique intrapopulationnelle observ e apr s une expansion spatiale et d m
114. Il faut pr ciser que la grande fluctuation de radiocarbone atmosph rique entre 30 000 BP et 50 000 BP rend difficile la mise en place de chronologies fiables pendant cette p riode ainsi que l estimation des temps de coexistence entre Hommes modernes et N andertaliens Conard et Bolus 2003 Les raisons qui ont men la disparition des N andertaliens sont encore mal connues Les H s sapiens ont sans doute jou un r le dans cette extinction peut tre en confinant les H neandertalensis dans des environnements moins Le radiocarbone aussi apell carbone 14 ou C est utilis pour effectuer des datations allant jusqu a environ 40 000 ans L ge de certains objets stalagmite corail coquille ossement bois charbon peut tre estim en mesurant sa concentration en C puisque celle ci diminue de moiti tous les 5568 ans Les dates ainsi obtenues donn es en BP pour Before Present doivent cependant tre ajust es puisque la concentration de C dans l atmosph re varie au cours du temps et que son accumulation dans les restes fluctue donc galement Ces dates calibr es sont donn es en BC Before Christ AD Anno Domini ou encore en cal BP et peuvent varier de plusieurs milliers d ann es par rapport aux dates non calibr es voir par exemple Grimaud Herve et al 2001 pp 114 117 ou le site http carbon14 univ lyon1 fr pour plus de d tails 96 favorables leur capacit d adaptation tant r duite ils
115. Ray et al 2004 Par ailleurs SPLATCHE peut tre utilis pour pr dire la dispersion spatiale d une population en fonction de diff rents v nements SPLATCHE pr sente galement un int r t didactique important puisqu il permet de visualiser les composantes spatiales des g n alogies de g nes ANNEXE 3 et de faire directement la liaison entre leur topologie et l information apport e par les donn es mol culaires L utilisation de SPLATCHE n est bien videmment pas restreinte a l esp ce humaine puisque de nombreux types d organismes diff rents peuvent tre simul s pour autant que leur cologie corresponde aux mod les d mographiques propos s En dernier lieu SLATCHE est un logiciel volutif appel subir de nombreuses modifications dans le futur en fonction des diff rentes applications pour lesquelles il pourra tre utilis 2 2 1 Article Page suivante 1 Les microsatellites et STR sont des s quences d ADN de quelques paires de bases 1 6 qui sont r p t es plusieurs fois la suite Ils pr sentent l avantage d tre facilement amplifies l aide d une PCR Leur mode d volution est encore relativement mal compris Voir Zane et al 2002 pour plus de d tails Les RFLPs Restriction Fragment Length Polymorphism sont de courtes sequences d ADN de 3 a 6 qui sont reconnues et coup es par des enzymes de restriction gt Ces informations ainsi que le programme lui m me sont disponibles on l
116. SOP molecular typing of HLA C alleles in an Iranian population Tissue Antigens 59 525 30 Calafell F Bertranpetit J 1993 The genetic history of the Iberian peninsula a simulation Current Anthropology 34 735 745 Calafell F Underhill P Tolun A Angelicheva D Kalaydjieva L 1996 From Asia to Europe mitochondrial DNA sequence variability in Bulgarians and Turks Ann Hum Genet 60 Pt 1 35 49 Capelli C Redhead N Abernethy J K Gratrix F Wilson J F Moen T Hervig T Richards M Stumpf M P Underhill P A Bradshaw P Shaha A Thomas M G Bradman N Goldstein D B 2003 A y chromosome census of the british isles Curr Biol 13 979 84 Cappello N Rendine S Griffo R Mameli G E Succa V Vona G Piazza A 1996 Genetic analysis of Sardinia data on 12 polymorphisms in 21 linguistic domains Ann Hum Genet 60 Pt 2 125 41 Caramelli D Lalueza Fox C Vernesi C Lari M Casoli A Mallegni F Chiarelli B Dupanloup l Bertranpetit J Barbujani G Bertorelle G 2003 Evidence for a genetic discontinuity between Neandertals and 24 000 year old anatomically modern Europeans Proc Natl Acad Sci U S A 100 6593 7 Carvajal Carmona L G Soto I D Pineda N Ortiz Barrientos D Duque C Ospina Duque J McCarthy M Montoya P Alvarez V M Bedoya G Ruiz Linares A 2000 Strong Amerind white sex bias and a possible Sephardic contribution among the founders of a population in northwest Colombia Am J H
117. The second line is reserved for the legends Then each line defines a sample with 4 fields separated by tab our space character 1 Name of the population from which the sample has been drawn 2 Number of genes belonging to that sample 3 amp 4 Geographic location of the population latitude and longitude SPLATCHE will determine automatically in which particular deme falls the coordinates of the population The coordinates must belong to the geographical surface defined in the header file Example of a genetic input file sam for 6 samples in Africa 6 Name samplel sample2 sample3 sample4 samples sample6 169 SPLATCHE User Manual 4 4 Output files 13 on Figure 4 1 Various kinds of genetic output files can be generated by SPLATCHE 4 4 1 Arlequin files The genetic data generated by one simulation are directly output in an ARLEQUIN project file with the extension arp This file format allowing one to compute the data using the ARLEQUIN software in order to obtain different statistics see ARLEQUIN manual Schneider ef al 200a for more details If more than one simulation is performed using one demographic simulation which is usually the case then an ARLEQUIN batch file with extension arb is also generated listing all simulated files and allowing one to compute statistics on the whole set of simulated files Note also that the ARLEQUIN software has a file conversion utility
118. UNIVERSITE DE GENEVE FACULTE DES SCIENCES D partement d anthropologie et d cologie UNIVERSITE DE BERNE Institut de zoologie Professeur A Langaney Professeur L Excoffier Effets des expansions des populations humaines en Europe sur leur diversit g n tique THESE pr sent e a la Facult des sciences de l Universit de Gen ve pour obtenir le grade de Docteur s sciences mention biologique par Mathias Currat de Le Cr t FR Th se N 3544 GEN VE Atelier de reproduction de l Universit de Gen ve 2004 La Facult des sciences sur le pr avis de Messieurs L EXCOFFIER professeur et directeur de th se Universit de Berne D partement de zoologie A LANGANEY professeur ordinaire et co directeur de these D partement d anthropologie et cologie L CHIKHI docteur Universit Paul Sabatier Laboratoire Evolution et Diversit Toulouse France et Madame A SANCHEZ MAZAS professeur titulaire D partement d anthropologie et cologie autorise l impression de la pr sente th se sans exprimer d opinion sur les propositions qui y sont nonc es Gen ve le 10 ao t 2004 gt Sys Lviv Th se 3544 Le Doyen Pierre SPIERER a Christiane et Ren Resume Ce travail de these d crit l effet de l expansion spatiale et d mographique d une population humaine sur sa diversit g n tique au moyen d une approche par simulation Le logiciel d velopp dans le cadre de cett
119. a 1984 p 75 sur la base de donn es arch ologiques Fix en 1997 a utilis un taux de 80 dans d autres simulations et a titre de r f rence le taux de croissance mondiale pour les 50 derni res ann es est de 60 Pennington 2001 p 171 Il existe cependant des estimations beaucoup plus faibles de l ordre de 1 5 Coale 1974 Landers 1992 mais il s agit a nouveau d estimations sur le long terme 4 5 2 2 Densit s de population La plupart des estimations de densit de populations chasseurs collecteurs ont t faites l aide de donn es ethnographiques en observant les populations actuelles Ce sont cependant des valeurs observ es localement et dont il est difficile de faire une extrapolation moyenne pour l Europe pal olithique d autant plus que les estimations ethnographiques semblent tre assez optimistes pour valuer les densit s pr historiques Bocquet Appel et Demars 2000a 69 Chasseurs collecteurs Kcc D apr s les comparaisons ethnographiques les densit s des populations de chasseurs collecteurs contemporains vont de 0 02 100 individus par km Zvelebil 2000 par exemple entre 0 02 et 0 03 chez les pygm es Aka Hewlett et al 1982 Nous laissons volontairement de c t la valeur de 100 individus par km qui ne peut en aucun cas tre prise comme moyenne des chasseurs collecteurs pour l Europe comme le montre le simple calcul suivant la superficie du continent europ en est de 23 594 000
120. a m me aire g ographique repr sent e dans SPLATCHE par une cellule virtuelle voir page 173 3 2 Diversit mol culaire intrapopulationnelle la suite d une expansion spatiale La signature g n tique laiss e par une population dont la taille est pass e d un tr s petit un tr s grand nombre d individus a t passablement tudi e Slatkin et Hudson 1991 Figure 9 7A dans ANNEXE 2 ont notamment montr qu une expansion d mographique provoque une g n alogie de genes en forme de peigne star like Il en r sulte une distribution mismatch unimodale avec une forme en cloche alors que dans une population stationnaire la distribution mismatch est multimodale Rogers et Harpending 1992 Figure 9 7C Bien que l expansion spatiale d une population conduise galement un accroissement d mographique global la ressemblance entre la signature g n tique obtenue dans cette situation et celle obtenue dans le cas d une simple croissance d mographique dans une population non subdivis e tait inconnue Tres peu d attention avait en effet t accord e l influence de la dispersion spatiale d une population en expansion d mographique Nous nous sommes donc int ress cette question Dans un article publi en 2003 dans la revue Molecular Biology and Evolution nous d crivons la diversit mol culaire attendue dans un chantillon issu d une population ayant pass par une expansion d mographique et spatiale A l
121. ables l agriculture for t tropicale d sert qui sont tr s loign es des zones optimum qu ils exploitaient jadis Spielmann et Eder 1994 Pennington 2001 p 311 De plus les ethnies contemporaines sont 1 Voir Pennington 2001 pour une revue de la d mographie des ethnies actuelles de chasseurs collecteurs 67 soumises a la pression exerc e par l agriculture et les communaut s industrialis es voisines avec qui elles ont des contacts plus ou moins intensifs Spielmann et Eder 1994 Blurton Jones et al 2002 Ces voisins modernes r duisent d une part l aire d influence des ethnies de chasseurs collecteurs et d autre part leur transmettent de nouvelles maladies infectieuses Dunn 1968 Lee et DeVore 1968a Landers 1992 D un autre c t les donn es arch ologiques ne permettent pas d estimation pr cise des densit s de populations humaines avant leur s dentarisation c est pourquoi les donn es ethnographiques restent tout de m me les meilleurs estimateurs malgr leurs d fauts voir Ray 2003 p 32 pour une plus ample discussion ce sujet Comme nous l avons vu dans la section 4 3 le mod le d mographique utilis dans ce travail pour simuler la croissance d une population est une courbe logistique qui requiert deux param tres le param tre r qui permet de r guler la vitesse de croissance de la population le param tre K la capacit de soutien qui peut tre mise en relation avec la densit
122. according to a model initially developed to describe the interactions between Neanderthals and modern humans Currat amp Excoffier 2004 In brief density is logistically regulated within each deme either belonging to the F or HG layer and noted below with intrinsic rate of growth r and carrying capacity K The local growth is also regulated by a density dependent competition exerted by the population from the other layer competing for local resources according to a modified version of the Lotka Volterra model see Currat amp Excoffier 2004 for details Each generation a proportion m of individuals from 124 SNP diversity in Europe after a range expansion any given deme migrates to the neighboring demes from the same layer At equilibrium the local density N is equal to K and the number of migrants exchanged between deme is thus equal to Km which will be called Nim for coherence with previous work e g Ray et al 2003 HG contribution to the current genetic pool is simulated by a movement from the HG layer towards the F layer This movement can be due to two processes 1 adoption of Neolithic techniques by HG a process also called acculturation Ammerman amp Cavalli Sforza 1984 or 2 matings between Paleolithic and Neolithic individuals The children resulting from these two processes are assumed to belong to the F layer and have thus an HG ancestor at the former generation In the case of interbreeding the amount of gen
123. achmann J Giddings l R schoff B Czarnetzki A Push C M 2000 Genomic differentiation of Neanderthals and Anatomically modern man allows a fossil DNA based classification of morphologically indistinguishable hominid bones Am J Hum Genet 66 1927 1932 Schwartz J Tattersall I 1996 Significance of Some Previously Unrecognized Apomorphies in the Nasal Region of Homo neanderthalensis Proc Natl Acad Sci U S A 93 10852 10854 Seielstad M T Minch E Cavalli Sforza L L 1998 Genetic evidence for a higher female migration rate in humans Nat Genet 20 278 80 Semino O Passarino G Brega A Fellous M Santachiara Benerecetti A S 1996 A view of the neolithic demic diffusion in Europe through two Y chromosome specific markers Am J Hum Genet 59 964 8 Semino O Passarino G Oefner P J Lin A A Arbuzova S Beckman L E De Benedictis G Francalacci P Kouvatsi A Limborska S Marcikiae M Mika A Mika B Primorac D 207 Santachiara Benerecetti A S Cavalli Sforza L L Underhill P A 2000a The genetic legacy of Paleolithic Homo sapiens sapiens in extant Europeans a Y chromosome perspective Science 290 1155 9 Semino O Passarino G Quintana Murci L Liu A Beres J Czeizel A Santachiara Benerecetti A S 2000b MtDNA and Y chromosome polymorphisms in Hungary inferences from the palaeolithic neolithic and Uralic influences on the modern Hungarian gene pool Eur J Hum Genet 8 339 46 serre D Langaney A
124. age proportion of sampled genes whose ancestors can be traced to some Neanderthal lineages was then computed over 10 000 simulations The coalescent process allows one to simulate the process of genetic drift which could have led to the disapearance of Neanderthal 108 Absence of admixture between modern humans and Neanderthals sequences having been integrated in the Cro Magnon gene pool The likelihood of each interbreeding coefficient 7 is thus estimated for the different scenarios by the proportion of 10 000 simulations that lead to a Most Recent Common Ancestor of all 4 000 sampled mtDNA sequences being of modern human origin Acknowledgements Thanks to Nicolas Ray and Pierre Berthier for programming and computing assistance We are grateful to Monty Slatkin Arnaud Estoup and Grant Hamilton for their critical reading of the manuscript This work was supported by a Swiss NSF grant No 3100A0 100800 to LE 109 O nm mo O W P Scenario Absence of admixture between modern humans and Neanderthals Tables amp Figures Table 4 Expected proportion of Neanderthal lineages in the present modern human gene pool under 7 different demographic scenarios Upper limit of a 95 confidence interval for the average number of admixture events per deme which is still compatible with an absence of Neanderthal mtDNA genes in current Europeans Upper limit of a 95 confidence interval for the total number of admixture events having occurred o
125. agreement with figure LE and F the average mismatch distributions observed in demes with small Nm values show two modes whereas those observed in demes with large Nm values Nm gt 50 show a single mode The first mode in demes with low Nm values corresponds to the zero difference class which 1s due to pairs of genes with a recent ancestor whereas the second mode corresponds to pairs of genes having a common ancestor around the time of the onset of the spatial expansion The 90 empirical confidence in tervals for the mismatch distributions presented in figure 3 also show that the variance of the mismatch distributions 1s much larger for low than for large Nm values In figure 4 we report four random simulated mismatch distributions for demes with either low 10 or large 500 Nm values We see that while the average mismatch distribution for low Nm values is bimodal single realizations of the coalescent in such cases can lead to multimodal and very ragged distributions In contrast the mismatch distribu tions in demes with large Nm values are most often unimodal and closer to their expectation in agreement with the reduced variance shown in figure 3 In figure 5 we report the mismatch distributions obtained for very different combinations of carrying capacities K and m values leading to the same Nm value at equilibrium when N K It is clear from this figure that the average shape of the mismatch distributions and therefore the
126. agriculteurs chasseurs pasteurs Paris Errance 2003 in press Gilmour J S L Gregor J W 1939 Demes a suggested new terminology Nature 144 333 Gkiasta M Russell T Shennan S Steele J 2003 Neolithic transition in Europe the radiocarbon record revisited Antiquity 71 45 62 Gribchenko Y N Kurenkova E I 1999 Pleistocene environments and the dispersal of Paleolithic groupes in eastern Europe Anthropologie 37 79 87 Grimaud Herv D Serre F Bahain J J Nespoulet R 2001 Histoire d anc tres la grande aventure de la pr histoire Artcom Paris Gronenborg D 1999 A variation on a basic theme the transition to farming in southern central Europe Journal of World Prehistory 13 123 210 Hagelberg E 2003 Recombination or mutation rate heterogeneity Implications for Mitochondrial Eve Trends Genet 19 84 90 Haldane J B S 1949 Disease and evolution La Ricerca Scientifica Suppl 19 68 76 Hamilton G Currat M Ray N Heckel G Beaumont M Excoffier L 2004 Bayesian estimation of recent migration rates after a spatial expansion submitted 201 Hammer M F Karafet T Rasanayagam A Wood E T Altheide T K Jenkins T Griffiths R C Templeton A R Zegura S L 1998 Out of Africa and back again nested cladistic analysis of human Y chromosome variation Mol Biol Evol 15 427 41 Hammer M F Karafet T M Redd A J Jarjanazi H Santachiara Benerecetti S Soodyall H Zegura S L 2001 Hierarch
127. aissances encore tr s peu explor Nous avons ainsi d d velopper de nombreux outils informatiques comme le logiciel SPLATCHE qui n existaient pr alablement pas Des recherches et des exp riences ont t men es dans de nombreuses directions La th se de Nicolas Ray 2003 pr sente un grand nombre de ces aspects concernant principalement la recherche et la compilation en version num rique de donn es environnementales pass es et pr sentes ainsi que le d veloppement de mod les d mographiques et leur comportement dans un cadre virtuel Pour notre part nous avons t principalement confront la liaison des modules g n tiques et d mographiques ainsi qu la pertinence des mod les et des param tres utilis s Nous avons galement d r soudre un certain nombre de probl mes provoqu s par l extraction et la manipulation d un nombre gigantesque de donn es informatiques Par exemple 1 seul des 8 sc narios simulant le remplacement des Neandertaliens chapitre 5 g n re environ 100 000 fichiers de donn es g n tiques Un des principaux apprentissages que nous tirons de notre participation au projet Friction est la n cessit d une incr mentation graduelle de la complexit d un mod le Il est en effet indispensable de proc der tape par tape afin de comprendre l influence de chaque param tre sur les processus tudi s Le but final de ce travail tait l tude de l effet des principales expansions spat
128. alogical connection between the nodes of the tree in order to visu alize the coalescent tree spatially onto the simulated world iii the spatial distribution of the most recent common ancestor of all genes MRCA either for the whole tree or independently for each population sample Two addi tional output files also allow one to obtain for each sample the spatial distribution of all coalescent events and the time to the MRCA Type a The ability to translate environmental information into molecular diversity via a demographic model allows for a wide array of applications Using a very simple homo geneous world it has been possible to study the effect of a 2004 Blackwell Publishing Ltd Molecular Ecology Notes 4 139 142 t 600 t 800 t 1000 Fig 2 A graphical example of a coalescent simulation in a hypothetical case assuming that Africa has been colonized from a single deme located in Eastern Africa as shown by the black arrow on the lower right pane 1000 generations ago White arrows in the upper left pane indicate the locations of the sample demes at time zero each containing 30 genes The time f is expressed in number of generations from present and goes backward in time Darker demes have higher densities At all times white demes are those in which there is at least one gene lineage whose descendants can be traced forward to sampled genes One sees that going backward in time gene lineages initially located in
129. alogie d individus m me si les deux sont intimement li es voir par exemple Excoffier 1997 Hurles et Jobling 2001 Nichols 2001 Chaque copie d un g ne poss de une g n alogie sp cifique dont aucune ne ressemble a celle des individus comme l illustre la Figure 9 4 Dans cette figure les deux exemplaires du g ne repr sent par un rond noir que l on trouve la g n ration 3 ont par exemple un anc tre commun la g n ration 1 alors que le g ne repr sent par un rond gris ne laisse aucun descendant la g n ration 3 A G n alogie d individus OATIAE OMELO G n ration 1 m00 0 e m G n ration 2 gO G neration 3 B Genealogies de genes G n ration 1 G n ration 2 G n ration 3 Figure 9 4 Sch ma d une g n alogie d individus diploides pendant 3 g n rations A ainsi que les g n alogies de 4 copies diff rentes d un g ne B 177 La g n alogie d un gene s lectivement neutre d pend uniquement de l histoire d mographique de la population dans laquelle il se trouve et il est compl tement ind pendant du processus de mutation L tude de nombreuses g n alogies de g nes neutres permet donc de faire des inferences sur l histoire d mographique de la population dans laquelle ils sont chantillonn s L int r t principal de la th orie de la coalescence r side donc dans l tude de la d mographie d une population partir d un chantillon de ses g nes Il s agit de l a
130. an 15 000 years a replacement process that is still not fully understood An important question which remains to be assessed is whether Neanderthals could hybridize with modern humans and if they left some traces in the current modern human gene pool While this hypothesis is excluded under the Recent African Origin model RAO which postulates a complete replacement of former members of the genus by Homo sapiens it is central to the tenets of the multiregional hypothesis From a paleontological and archaeological point of view the debate is still open even if the supporters of the RAO model are gaining momentum over those supporting European regional continuity but see also Recent 99 Absence of admixture between modern humans and Neanderthals morphological studies support a clear distinction between Neanderthals and modern humans and genetic evidence such as the clear divergence and monophyly of the HN mtDNA control region suggested a clear separation of the HN and HS female lineages with a divergence time estimated to lie between 300 000 and 750 000 years ago The complete absence of Neanderthal mtDNA sequences in the current European gene pool attested from the study of more than 4 000 17 18 19 recorded sequences Strongly supported the absence of Neanderthal mtDNA leakage in the modern gene pool but it was argued that even if some HN genes could have passed in the ancient Cro Magnon ge
131. aphiques sont bien diff renci s Une expansion d mographique donne le plus souvent des arbres en forme de peigne avec de tr s longues branches terminales Figure 9 8B En revanche un population stationnaire pr sente une tr s grande variabilit dans la topologie des arbres avec une alternance de courtes et de longues branches terminales Figure 9 8A L augmentation du nombre de simulations g n tiques permet de tenir compte de la stochasticit des processus d mographiques et g n tiques 180 Population de taille constante Population ayant passe par une expansion d mographique 11 110 Nbre Nbre de de sites sites l 1 1 5 1 5 10 Fr quence dans un chantillon de 20 Fr quence dans un chantillon de 20 72 60 Nbre Nbre de de paire paire 0 5 10 0 5 10 20 Nombre de diff rences Nombre de diff rences Figure 9 7 Relation entre g n alogies de g nes et donn es mol culaires pour une population dont la taille est rest e constante au cours du temps colonne de gauche et pour une population ayant pass par une expansion d mographique colonne de droite A arbres de coalescence B spectres de fr quences all liques Allele Frequency Spectrum C distribution mismatch Figure modifi e a partir de Harpending et al 1998 B Population ayant pass par une A Population de taille constante expansion d mographique ce LL HN MU Figure 9 8 Exemples de 4 arbres de coalescence ind pe
132. as a demographic expansion in a single unsubdivided population Despite advances in analytical techniques that allow for estimates of population parameters in more realistic settings they may become intractable under complex evolutionary scenarios It appears therefore that co alescent simulations are still useful and necessary to investigate the effect of such complex scenarios such as nonconstant environments on various aspects of the molecular diversity of populations In this study we use a simulation framework to study the combined effect of Molecular Diversity in Spatially Expanding Populations 77 spatial and demographic expansions on patterns of within deme molecular diversity in a simple two dimensional landscape After simulating a wave of advance using a simple migration model with logistic regulation of deme size a coalescent approach is used to simulate the genetic diversity of a sample conditional on the demographic history of the population Different aspects of the molecular diversity are recorded and factors with the potential to affect molecular diversity place of origin local deme size size of gene flow between neighboring demes and sampling location are investigated and discussed Material and Methods To efficiently simulate the molecular diversity expected in a sample drawn from a deme belonging to a large subdivided population having gone through a recent spatial expansion we proceed in two steps We
133. ases and thus occurs in the ancestral deme when Nm 10 compared with 100 of the simulated cases when Nm 500 Patterns of Molecular Diversity We have studied different aspects of DNA sequence polymorphism within a single deme drawn from a pop ulation that has experienced a range expansion The results of the analysis of simulated samples are reported in table 1 for different levels of migration among neighboring demes A drastic difference is found between demes exchanging 20 migrants or less per generation and demes exchanging higher numbers of migrants Whereas the average number of pairwise differences only slightly increases with larger Nm values going from n 6 3 for Nm 5 to n 8 for Nm values gt 200 the number of segregating sites increases much more drastically going from 30 for Nm 5 to 96 9 for Nm 1 000 This difference can be attributed to the timing of the coalescent events which is indeed different for small or large Nm values Because a majority of coalescent events occur in the scattering phase for small Nm values and much later around the onset of the expansion for large 0 6 E 5 504 4 ic 02 Oo 0 2000 4000 generations 0 6 F o 5 0 4 02 0 4 ES 0 2000 4000 generations Fic 1 Summary of the dynamics of the spatial expansion process and its associated coalescent in a simulated subdivided population of 2 500 demes arranged as a two dimensional stepping stone 50
134. ation Because is smaller than 30 in our current simulations it is unlikely to affect the pattern of molecular diversity that is generated over thousands of generations The coalescent process stops when there is a single gene lineage left in the array of demes In the case when multiple gene lineages trace back to the ancestral deme at a time corresponding to the beginning of the forward simulation the backward coalescent process proceeds further in this single deme of density equal to its initial density 100 unless specified otherwise During the simulations we record the locations and times of all coalescent events For each simulated gene genealogy we simulate mutations on the branches of the genealogy according to a Poisson process with rate ut where u is the mutation rate and is the length in generations of a given branch In the present case we simulated an unbiased substitution process on a sequence of DNA of 300 bp with u 0 001 for the whole sequence assuming a finite site 20 mutation model without heterogeneity of mutation rates One thousand coalescent simulations were performed for each set of demographic parameters tested The distribution of a number of statistics were gathered from the simulated samples including the number of segregating sites S the average number of pairwise differences nr Tajima s D statistic Tajima 1989 Fu s Fs statistic Fu 1997 and the mismatch dis tribution All analyse
135. ation variation Range Constrainst for microsatellite generate Arlequin file Paup files or both 0 1 2 generate migration BMP generate density BMP generate occupation BMP generate migration ASCII generate density ASCII generate occupation ASCII OH OH OO OOOOO O 3 4 3 ASCII format for environmental data The environmental datasets that can be loaded into SPLATCH must be in ASCII raster format Two different datasets can be loaded The first one is the vegetation dataset defining to what type category of vegetation belongs each deme The second dataset is the roughness dataset defining continuous friction values such as friction computed from topography This format of the environmental dataset is composed of a header first six lines containing information on the file then a matrix of values in rows and columns The header information is as follow ncols number of columns nrows number of rows xllcorner longitude coordinate of the lower left deme yllcorner latitude coordinate of the lower left deme cellsize width of a deme cell size in same units than the coordinates 161 SPLATCHE User Manual NODATA value value indicating than a deme must not be considered like sea Example of an environmental dataset ncols 88 nrows 91 xllcorner 19 845388 yllcorner 36 897187 cellsize 0 83 NODATA value 9999 oee 99 Io S09 9 29999 SIII 2999 3999 9999 9909 999 SIO So 9 9
136. ber of parameters can be seen in Figure 4 1 4 2 1 General SPLATCHE BE General Settings Demographic outputs Genetic simulations Genetic samples file dataSets_square genes_middle sam 1 Browse Mutation model speciicities Data type DNA 6 No of linked loci 5 Total mutation rate Lys ransition fraction 0 33 Ga No of rate categories fi Coalescences simulation i Arlequin Nexus Both L F Coalescent tree simulation No of simulations 1 2 no of simulated generations 5000 Refresh rate 1 Zoom factor fe Do simulations oe Display a Active demes Windows Remaining lineages Coalescent events 45 Migration events fag Coalesce Ne 1 Simulations 1 Simulations Running Figure 4 1 Genetic module panel Demes where at least one gene is present appear in violet 167 SPLATCHE User Manual Sample file name location of the sam file Number of simulations to be carried out Maximum of generations after which the process stop if the genealogy has not been correctly reconstructed Refresh rate generation numbers after which the display window is updated Zoom factor of the display window Pas Be Te EX 4 2 2 Mutation model specificities For all kind of data 6 Type of genetic data to be generated It could be DNA RFLP Microsatellite or Standard See Genetic data type Section for more details Number of fully linked
137. cause the majority of individuals present at equilibrium are descendants from the first colonists Currat amp Excoffier 2004 Edmonds et al 2004 Our simulations show that a very small initial Paleolithic contribution in each deme 0 125 on average is enough to lead to a situation where most of the current gene pool can be traced to the Paleolithic Table 1 The proportion of European who are descendant from the first farmers from the Levant decreases very quickly with distance from the Neolithic source as the lineages of Neolithic origin are rapidly diluted along the axis of colonization Figure 3 Under our simulation conditions an average local Paleolithic contribution larger than 0 375 will indeed be enough to prevent Neolithic lineages to diffuse over the whole Europe These results imply that under our model of a progressive range expansion of Neolithic farmers with possible genetic exchange and competition with local Paleolithic hunter gatherers it is very unlikely that the Paleolithic contribution be globally smaller than 50 If that was the case e g Chikhi et al 2002 lt 30 it would imply that Neolithic would have had virtually no genetic contact with local populations like under a pure DD model Global surveys of mtDNA molecular diversity Richards et al 1996 Richards et al 2000 and the simulations of mtDNA mismatch distributions argue against such a low contribution of Paleolithic populations to the modern gene pool Ind
138. ccinctement dans ce manuscrit bien que leur d veloppement ait constitu une partie tres importante de notre travail De m me les nombreux outils compl mentaires n cessaires a la manipulation et l extraction des innombrables donn es g n r es par nos simulations parfois plusieurs centaines de milliers de fichiers differents ne sont pas d crits dans ce manuscrit Il s agit en effet de scripts Linux et d un programme en langage C WinReadSum dont l int r t scientifique est tres limite 1 Dans ce travail nous utiliserons pr f rentiellement le terme chasseurs collecteurs au terme chasseurs cueilleurs Il est employ pour d finir les individus appartenant aux populations dont le mode de subsistance est bas sur la chasse la cueillette et la p che Nous ne ferons pas de distinction entre chasseurs collecteurs m solithiques et pal olithiques 2 mi i h P ta Ah G re fais Nous utiliserons le terme agriculteurs pour d finir les individus n olithiques qui ont adopt la totalit des composantes d finissant les soci t s agropastorales modernes savoir lagriculture l levage la s dentarisation et la poterie d apr s Mazuri de Keroualin 2001 2 Realisation d un logiciel permettant de simuler des donn es g n tiques en fonction de param tres d mographiques et environnementaux 2 1 Introduction Comme nous l avons d j soulign dans l introduction g n rale de nombreuses tudes associent
139. ce est grande particulierement lorsque y est faible mais de plus leur forme peut tre modifi e par le cadre temporel ou par le taux de mutation 4 5 3 7 Forme du monde Afin d viter que les r sultats pr sent s ne soient le fruit d effets de bord dus la forme de notre monde nous avons doubl toutes les simulations effectu es jusqu ici en utilisant un monde non plus carr mais en forme de torre Figure 4 24 Les cellules situ es de chaque c t du monde peuvent communiquer avec les cellules du c t oppos Les r sultats observ s montrent des diff rences que l on peut consid rer comme n gligeables lorsque y gt 0 En revanche lorsque y 0 et que le lieu d chantillonnage est diff rent de l origine de l expansion on observe une l g re r duction de lhomozygotie attendue Les valeurs observ es sont interm diaires entre celles obtenues dans le monde carr pour un lieu d chantillonnage diff rent du lieu d expansion et celles obtenues pour un lieu d chantillonnage identique au lieu d expansion Ceci s explique facilement par le fait que dans un monde en torre les g nes chantillonn s ont plus de possibilit s de migration que dans un monde carr ils auront donc moins tendance se retrouver dans les m mes demes au front de la vague d expansion et les coalescences qui ont lieu entre la p riode S1 et C1 lors d un chantillonnage en p riph rie du lieu du goulet sont moins importantes A Figure
140. cececesseeccenscceceeeeceesens 143 8 CONCLUSION GENERALE ET PERSPECTIVES ccccccccccccccsssseccccccccececcceesseccecsccceeececeeeees 149 9 ANNEXES 2000 0 cccccccecenccscececsecnncnesenenececensescensenescecncncscncncnsncecnenancnssececscenecenenecenscansasesesnsasesenceces 153 ANNEXE 1 MANUEL D UTILISATION DE SPLATCHE cccccecececcccccscscscececececeeecseeeeeeees 155 ANNEXE 2 ASPECTS TECHNIQUES DU PROGRAMME SPLATCHE 2cccecececeeeseeeees 173 ANNEXE 2 1 MODULE D MOGRAPHIQUE ecccccececeececececececenecececenecccececeuececececeuececeee 173 ANNEXE 2 2 WODULEGENE TOQUE A 2 ue es een do te ta anima 176 Annexe 2 2 1 Processus de coalescence ccccecccccececcccecccucuececececuceaeueseceeeaeaecenststeaenetsnstetenenerars 176 Annexe 2 2 2 G n ration de la diversit g n tique ss 179 Annexe 2 2 3 G n ration de SNPS ccc ececcececececcccccececcecececucuecenececacceaeaecenseseaeaenenstsuseaenetstsnetenenenaes 182 ANNEXE 2 3 IMIPEIMENTATION ESS RS tn dette aa a aaa iin 183 Annexe 2 3 1 Principales Classes ii ns nn Mann rt Rs ne 183 ANNEXE 3 VISUALISATION DE LA COALESCENCE uuu ccccccccccecscecececececccececceceeeeeceeneeeees 187 ANNEXE 3 1 ARBRE DE COALESCENCE cise ie easter eas 2 RU massed Aidosaean ee tae 187 ANNEXE 3 2 DISTRIBUTION DES EVENEMENTS DE COALESCENCE cccccecececececececececececececcavavars 188 ANNEXE 3 3 DISTRIBUTION DES MR OA a tn an tte dites andre tie a aline 191 ANNEXE 4 MODIFI
141. cement time of HN by HS see Table 1 Note that the cohabitation period at any given place shown as a narrow black band on Figure 1 is limited to 7 37 generations depending on the scenario listed in Table 1 corresponding to about 175 to 925 years assuming a generation time of 25 years The Neanderthal contribution to the current European gene pool as a function of admixture rates The expected proportion of Neanderthal genes in the gene pool of modern humans was estimated by coalescent simulations and is reported in Table 1 for different rates of admixture between Neanderthals and modern humans At odds with previous estimates our simulations show that even for very few admixture events the contribution of the Neanderthal lineages in the current gene pool should be very large Figure S4 For instance in scenario A with a four fold advantage in exploitation of local resource by modern humans a single fertile admixture event in one deme out of 10 over the whole period of coexistence between HN and HS should lead to the observation of 38 of HN genes in the present mtDNA HS gene pool case A in Table 1 This proportion would be lower but still amount to 15 if the advantage of modern humans was reduced to 1 6 times over Neanderthals with the same admixture rate case E in Table 1 With higher but still relatively low levels of admixture a majority of Neanderthal genes should be expected in the current European gene pool Table 1
142. certaines sont fortement d battues Dans ce climat d incertitude la g n tique apporte de nouveaux l ments de r ponse certaines interrogations soulev es par les autres disciplines Le sequengage de portions d ADN tir es d os de N andertaliens a notamment permis d aborder sous un nouvel angle la question d ventuels changes g n tiques entre ces derniers et les premiers Hommes modernes Dans ce chapitre nous essayons d estimer le taux d hybridation entre N andertaliens et Hommes modernes qui est compatible avec les donn es g n tiques actuelles Nous utilisons pour cela l approche par simulation pr sent e dans le chapitre pr c dent 4 Cette tude est pr sent e sous la forme d un manuscrit soumis publication 5 2 Contribution des N andertaliens au patrimoine g n tique des Hommes modernes Sur le continent europ en les successeurs d Homo erectus ont d velopp des caract ristiques sp cifiques qui culminent avec la forme classique d Homo neandertalensis dont l apparition date d environ 120 000 ans Klein 2003 Les H neandertalensis sont vraisemblablement end miques a l Europe occidentale et leur aire de r partition se serait petit a petit agrandie jusqu atteindre le Proche Orient il y a environ 80 000 ans Figure 5 1 Hublin 1988 Klein 2003 95 Figure 5 1 Aire de r partition approximative des N andertaliens figure modifi e a partir de Klein 2003 C est seulement entre 45 000 ans et 30 0
143. ces tudes sont pr sent s dans les chapitres 5 et 6 sous la forme de deux manuscrits soumis publication Ces deux grandes p riodes de transition d mographique ont potentiellement pu laisser des traces dans la structure g n tique actuelle des populations europ ennes Elles coincident avec la diffusion de nouvelles technologies dans l ensemble du continent europ en a partir d une petite r gion Cette diffusion s est vraisemblablement accompagn e d importants mouvements de populations qui peuvent tre mod lis s comme l expansion spatiale d une population partir d une source donn e Cette expansion spatiale s accompagne d une croissance globale de la taille de la population Si l effet d une simple croissance d mographique sur la structure g n tique des populations a d j t passablement tudi tr s peu d informations sont disponibles sur l influence de la diffusion spatiale d une population en croissance Dans ce travail nous nous sommes donc int ress la composante spatiale de l expansion d une population et ses effets sur la structure g n tique Dans le chapitre 3 nous avons tout d abord tudi l effet sur la diversit g n tique d une expansion spatiale dans une aire inoccup e L effet d une telle expansion est particuli rement int ressant notamment dans les cas d v nements de sp ciation ou de recolonisation post glaciaire a partir d une zone refuge Les deux v nements d mographiqu
144. cette th se Une population subdivis e ayant pass par une expansion spatiale et d mographique pr sente une diversit mol culaire diff rente en fonction du nombre de migrants chang s entre les sous populations qui la composent le param tre Nm Cette observation permet d expliquer par une simple diff rence de densit les diff rences observ es dans la diversit mol culaire des populations de chasseurs collecteurs contemporains et dans les populations post n olithiques section 3 2 La trace d une expansion pal olithique de la lign e m le en Europe peut tre ind celable dans les distributions mismatch tablies avec des donn es de type SNP section 3 3 Sous l hypoth se d une vague de migration des hommes modernes depuis le sud ouest de l Asie le patrimoine mitochondrial europ en actuel ne peut r sulter que d une hybridation extr mement faible voire nulle avec les N andertaliens Par cons quent ces derniers ne font pas partie de nos anc tres directs mais appartiennent une esp ce distincte de la n tre dont la lign e s est teinte chapitre 5 Des gradients de fr quences all liques entre le Proche Orient et le nord ouest de l Europe peuvent avoir t g n r s aussi bien par la vague de migration des premiers Hommes modernes il y a 40 000 ans que par celle des premiers agriculteurs il y a 10 000 ans L observation de tels gradients n est donc pas une preuve de la diffusion d mique du N oli
145. ck es dans une base de donn es Il est ensuite possible d extraire et de visualiser un grand nombre d informations sur la d mographie de la population partir de cette base de donn es notamment les directions de migrations pr f rentielles ainsi que l volution des densit s ENTREES CALCULS SORTIES Programme SPLATCHE Cartes Phase 1 environnementales Simulations d mographiques Param tres d mographiques Base de donn es R sultats graphiques d mographiques d mographiques Phase 2 Param tres Simulations R sultats graphiques g n tiques g n tiques g n tiques R sultats des donn es g n tiques simul es R sultats g n tiques Programme ARLEQUI N analys s Figure 2 1 Sch ma g n ral des entr es des calculs et des sorties li s au programme SPLATCHE partir de la base de donn es d mographiques g n r e pendant la phase 1 il est possible de simuler des donn es g n tiques pour un certain nombre d chantillons tir s de la population virtuelle Le nombre et la localisation de ces chantillons sont d finis par l utilisateur ainsi que le type de donn es g n r es s quence d ADN microsatellite fr quence all lique RFLP La cr ation de ces donn es g n tiques se fait l aide de l approche par coalescence voir Annexe 2 2 1 qui permet la simulation de la diversit des g nes d individus chantillonn s Cette approche permet donc de r duire c
146. comme nous le verrons ci dessous Lotka et Volterra ont d fini un mod le de comp tition intersp cifique qui est une extension du mod le de croissance logistique Volterra 1926 Lotka 1932 Ce mod le inclut la fois les effets de la comp tition intrapopulationnelle et ceux de la comp tition entre les populations A et B C Ra Ae Eq 4 9 Nae Nat ley K A K N a N Mans Na sd o le coefficient de competition ays repr sente l effet que la population B exerce sur la population A Begon et al 1996 pp 274 278 B Le terme d gNzg diminue le taux d accroissement de la population A au fur et a mesure que la densit de la population B en competition augmente Cette diminution est plus ou moins forte selon l importance de la competition interpopulationnelle repr sent e par a On peut voir aa comme l effet inhibiteur d un individu de la population B sur un individu de la population A compare l effet inhibiteur d un individu de la population A sur un autre individu de la m me population A a peut prendre diff rentes valeurs Si Qag O cela signifie que la population B n exerce aucune competition sur la population A donc pas de comp tition interpopulationnelle dans ce sens l Qag 1 cela signifie qu un individu de la population B exerce autant de competition sur un individu de la population A qu un autre individu de cette m me population A En d autres termes que la comp tit
147. configurations prot iques aux g notypes mutations port es par les s quences d ADN La g n tique a permis d aborder de fa on compl mentaire les probl matiques propos es par les arch ologues les pal ontologues et m me par les linguistes Le Laboratoire de G n tique et de Biom trie LGB de l Universit de Gen ve dans lequel nous avons r alis cette th se s est notamment sp cialis dans une approche interdisciplinaire visant tudier la variabilit g n tique des populations humaines Excoffier et al 1987 Excoffier 1988 Sanchez Mazas 1990 Dard et al 1992 Currat 1999 Poloni 1999 Dard et al 2001 Renquin et al 2001 Buhler et al 2002 ainsi que l influence de la g ographie et de la linguistique sur cette diversit Excoffier et al 1991 Poloni 1991 Dupanloup de Ceuninck 1999 Sanchez Mazas 2000 Sagart et al 2004 La rapide avanc e des techniques de laboratoire a permis depuis une vingtaine d ann es la cr ation de bases de donn es mol culaires utilis es pour retracer l histoire de notre esp ce Ces donn es mol culaires ont notamment pu appuyer l hypoth se d une origine unique d Homo sapiens Sapiens sans doute en Afrique hypoth se connue sous le nom de Out of Africa Stringer et Andrews 1988 par oppostion a une origine multiple ou multir gionale Weidenreich 1946 Wolpoff 1989 Cette derni re th orie propose que l volution vers la forme finale de l Homme moderne s es
148. contribution inf rieure a 25 Richards 2003 Nous avons choisi de simuler les deux mod les propos s DDM et CDM ainsi qu une s rie de sc narios interm diaires pour lesquels la contribution des chasseurs collecteurs a la constitution de la population n olithique varie Nous avons simul l arriv e des premiers Hommes modernes en Europe de la m me mani re que dans la recherche du chapitre pr c dent 5 suivie de la diffusion du N olithique a partir de la zone d origine de l levage et de l agriculture au Levant Lev Yadun et al 2000 Ce mod le inclut la fois de la comp tition et des changes g n tiques entre chasseurs collecteurs et agriculteurs Un flux g nique est simul uniquement depuis les chasseurs collecteurs vers les agriculteurs symbolisant les cons quences soit des mariages mixtes soit de l acculturation adoption des techniques n olithiques par les chasseurs collecteurs Ces changes g n tiques ne peuvent avoir lieu que pendant la phase de cohabitation entre les deux populations puisque les chasseurs collecteurs disparaissent apr s quelques g n rations de contact avec les agriculteurs sous l effet de la comp tition Nos simulations constituent la premi re d monstration formelle que des gradients de fr quences all liques peuvent tre g n r s par l expansion pal olithique des premiers europ ens modernes et qu ils sont quasiment ind pendants de la contribution de ceux ci au patrimoine g
149. cts of colonization processes on genetic diversity differences between annual plants and tree species Genetics 154 1309 21 Barbujani G amp Bertorelle G 2001 Genetics and the population history of Europe Proc Natl Acad Sci USA 98 22 5 Barbujani G amp Dupanloup 2002 DNA Variation in Europe estimating the demographic impact of Neolithic dispersals In Examining the farming language dispersal hypothesis ed P Bellwood amp C Renfrew pp 421 431 Cambridge McDonald Institute Monographs Barbujani G amp Pilastro A 1993 Genetic evidence on origin and dispersal of human populations speaking languages of the Nostratic macrofamily Proceedings of the National Academy of Science 90 4670 3 Barbujani G Sokal R R amp Oden N L 1995 Indo European origins a computer simulation test of five hypotheses Am J Phys Anthropol 96 109 32 Biraben J N 2003 L volution du nombre des hommes Population et Soci t s 394 1 4 Bocquet Appel J P amp Demars P Y 2000 Neanderthal contraction and modern human colonization of Europe Antiquity 74 544 552 Bocquet Appel J P amp Dubouloz J 2003 Traces pal oanthropologiques et arch ologiques d une transition d mographique n olithique en Europe Bulletin de la soci t pr historique fran aise 100 699 714 Casalotti R Simoni L Belledi M amp Barbujani G 1999 Y chromosome polymorphisms and the origins of the European gene pool Proc R Soc Lond B Biol Sc
150. d the average level of genetic diversity x within deme observed after a spatial expansion is different from that expected in a subdivided population at equilibrium Several studies have indeed shown that the average coalescence time between a pair of genes should only depend on the total size of the population if demes are all either directly or indirectly interconnected Slatkin 1987 Strobeck 1987 Hey 1991 and if the number of demes is constant Nagylaki 1998 Examination of table 1 suggests that demes with low levels of gene flow should show lower average levels of diversity both lower nm and lower S values than demes with high gene flow after a spatial or range expansion Also note that what we call low levels of gene flow are still cases where Nm is much greater than 1 which is generally the value above which spatially arranged demes are assumed to evolve as a single unit e g Maruyama 1971 This result underlines the need to further study spatial models of populations out of equilibrium Another prediction that may reveal differences between models of demographic and spatial expansions is the relationship between the geographical location of the sample and its genetic diversity Results shown in table 2 suggest that demes sampled in the periphery of the present population range may show slightly reduced levels of molecular diversity for low Nm values regardless of the origin of the expansion This may be due to the fact tha
151. dans la population 30 d un plus grand nombre de sites polymorphes S lorsque Nm est grand compense la valeur plus elevee du mode principal lorsque Nm est petit Nm 2 0 8 0 8 06 a 10 SNPs 06 b 10 SNPs freq 2 10 DO O O C Cc L 04 gL oO oO D D LL LL 0 2 0 cal 0 8 0 2 4 6 8 10 12 084 0 2 4 6 8 10 12 Diff rences Diff rences ial ns d 50 SNPs freq gt 10 s freq 2 c 50 SNPs F aran j O O C Cc 04 L a D LL LL mode 21 0 10 20 30 40 50 0 10 20 30 40 50 Diff rences Diff rences 0 4 0 4 e 100 SNPs f 100 SNPs freq 2 10 DO O O C Cc DO DO g D 02 0 2 mode 40 mode 51 0 10 20 30 40 50 60 70 80 90 0 10 20 30 40 50 60 70 80 90 Differences Diff rences Figure 3 1 Distribution mismatch moyenne ligne paisse pour 1 000 simulations et intervalle de confiance a 90 lignes fines Colonne de gauche tous les SNPs sont consid r s Colonne de droite SNPs dont la fr quence de l all le le plus rare est sup rieure ou gale 10 La valeur du mode principal voir texte est donn pour chaque figure Le biais de recrutement correspond la sous repr sentation des SNPs dont la fr quence est faible dans la population tudi e voir page 182 Ce choix revient s lectionner des mutations qui se trouvent sur les branches internes de la g n alogie des g nes Lorsque Nm est petit alors le biais de recrutement ne change quasiment r
152. de coalescence Cette repr sentation permet de mettre en vidence les r gions dont les densit s de coalescence sont lev es traduisant ainsi des effets fondateurs importants La Figure 9 13 presente la distribution spatiale des coalescences obtenues apres 1 000 simulations en Europe lorsque 800 g nes sont a chaque fois chantillonn s sur un axe situ entre le Liban et l Irlande La simulation consiste en l expansion d mographique et spatiale d une population originaire du Proche Orient fl che blanche dans une aire homog ne pour les facteurs environnementaux De nombreuses coalescences ont lieu dans le deme source de cette population comme l indique le pixel plus clair pr s de la fl che blanche La densit de coalescence est particuli rement forte dans les r gions ou les possibilit s de dispersion des lignages sont r duites comme dans les r gions de la Manche et du Detroit du Bosphore cercles blancs que nous nommerons goulets spatiaux Il est egalement possible d observer des pixels plus clairs le long de l axe d echantillonnage Ces points correspondent aux localisations des chantillons et repr sentent les coalescences r centes qui ont lieu dans ces chantillons lors de la phase de disparition S7 ou scattering phase Wakeley 1999 2001 Les sections 3 2 et 4 5 3 permettent de mieux comprendre la dynamique temporelle des v nements de coalescence 188 Densit s de coalescence 0 Min
153. de chasseurs collecteurs contemporains et dans celles des populations post N olithique peut tre simplement expliqu e par une diff rence de densit s En effet l expansion d mographique et spatiale d une population subdivis e dont les d mes changent un nombre important de migrants grand Nm montre une diversit intrapopulationnelle semblable celle laiss e par une croissance d mographique instantan e dans une population non subdivis e Cette signature est identique celle observ e chez les populations contemporaines qui sont pass es par une croissance d mographique lors du N olithique En revanche les populations actuelles de chasseurs collecteurs dont les densit s sont g n ralement tr s faibles montrent une diversit intrapopulationnelle identique celle laiss e par la diffusion d une population subdivis e dont la combinaison de la taille des d mes et du taux de migration est faible petit Nm Nous avons galement montr qu il n est pas possible d exclure une expansion pal olithique de la lign e m le europ enne sur la base des distributions mismatch du chromosome Y contrairement a ce qui a t propose par Pereira et al 2001 et Dupanloup et al 2003 Cette expansion pourrait avoir t accompagn e d un taux de migration plus faible pour les hommes que pour les femmes depuis le N olithique Cette derni re hypoth se reste cependant v rifier avec des donn es sans biais de recrutement porta
154. de param tres Beaumont et al 2002 afin d estimer leurs valeurs les plus probables Parmi les param tres suppl mentaires qui pourraient tre consid r s dans une tude ult rieure figure videmment l h t rog n it de l environnement Dans le cadre de ce travail il nous a paru suffisant de ne proc der des simulations que dans un monde homog ne Il serait cependant tr s int ressant de savoir si l utilisation d un environnement h t rog ne pour la v g tation et la topographie permettrait d obtenir des informations compl mentaires ou au contraire ne ferait qu obscurcir la compr hension des ph nom nes Les cartes de pal ov g tation de l Europe qui ont t r cemment num ris es pour 4 p riodes diff rentes LGM 20 000 BP Dryas r cent 11 000 BP d but de l Holoc ne 8 000 BP et pr sent potentiel 3 000 BP Ray et Adams 2002 Ray 2003 pp 75 76 pourraient tre utilis es dans ce but De m me les cours d eau et les c tes pourraient tre pris en consid ration comme voies de migration pr f rentielles des chasseurs collecteurs Anderson et Gillam 2000 Tolan Smith 2003 et comme zones favorables a l tablissement des agriculteurs Fiedel et Anthony 2003 Nous n avons pas consid r dans ce travail la glaciation maximum du dernier cycle glaciaire commenc il y a environ 120 000 ans dont le pic LGM se situe aux alentours de 20 000 21 000 BP Sherratt 1997 Pendant cette p riode les temp ratu
155. densit s Ce qui ralentit sa dispersion dans les autres cellules On peut dire que les 4 mod les pr sent s ici montrent globalement les m mes caract ristiques avec des temps de cohabitation qui ne varient que faiblement d un mod le l autre De tels carts peuvent cependant tre obtenus ind pendamment avec n importe lequel des quatre mod les en faisant varier leurs param tres d mographiques Les mod les qui utilisent des taux de comp tition d pendant des densit s M2 et M4 poss dent un avantage sur les mod les qui utilisent des taux de comp tition fix s M7 et M3 puisque ces derniers impliquent un jugement de valeur a priori sur les populations Nous avons donc d cid de ne pas retenir les mod les M7 et M3 pour la suite de cette tude L ajout d un temps de cohabitation forc entre les deux populations peut se justifier d un point de vue historique Cependant les temps de cohabitation effectifs observ s pour le mod le M2 se rapprochent passablement de ceux observes pour le mod le M4 mais le M2 poss de l avantage de simuler une disparition moins abrupte de la population ce qui semble plus r aliste De plus lorsque K8 gt Ka le mod le M4 se comporte quasiment comme le M3 M4 n utilise donc pratiquement pas la capacit de variation de taux de comp tition d pendant de la densit Par cons quent nous avons d cid d carter galement ce mod le au profit du M2 afin de simplifier le nombre de cas a
156. dertal genetic diversity Nat Genet 26 144 6 2000 Caramelli D et al Evidence for a genetic discontinuity between Neandertals and 24 000 year old anatomically modern Europeans Proc Natl Acad Sci U S A 100 6593 7 2003 Schmitz R W et al The Neandertal type site revisited interdisciplinary investigations of skeletal remains from the Neander Valley Germany Proc Natl Acad Sci U S A 99 13342 7 2002 Sykes B The molecular genetics of European ancestry Philos Trans R Soc Lond B Biol Sci 354 131 8 discussion 138 9 1999 Handt O Meyer S amp von Haeseler A Compilation of human mtDNA control region sequences Nucleic Acids Research 26 126 12 1998 Serre D et al No Evidence of Neandertal mtDNA Contribution to Early Modern Humans PLoS Biol 2 E57 2004 Relethford J H Absence of regional affinities of Neandertal DNA with living humans does not reject multiregional evolution Am J Phys Anthropol 115 95 8 2001 Hagelberg E Recombination or mutation rate heterogeneity Implications for Mitochondrial Eve Trends Genet 19 84 90 2003 Nordborg M On the probability of Neanderthal ancestry Am J Hum Genet 63 1237 40 1998 Bocquet Appel J P amp Demars P Y Neanderthal contraction and modern human colonization of Europe Antiquity 74 544 552 2000 Gutierrez G Sanchez D amp Marin A A reanalysis of the ancient mitochondrial DNA sequences recovered from Neandertal bones Mol Biol Evol 19 1359 66
157. dies have focused on island or stepping stone models within homogeneous environments Focus ing on a finite island model Wakeley 1999 2001 has shown that the coalescent process in a subdivided population could be divided into two distinct phases when the number of demes is large much larger than the number of sampled genes Going backward in time the first phase called the scattering phase is usually rapid and ends when all sampled genes are located in different demes It is characterized by a series of initial coalescent events with migration events scattering the gene lineages into different demes The second phase called the collecting phase is usually much longer and describes the coalescent process between the end of the scattering phase and the ultimate coalescent event This phase is characterized by a large number of migration events and a few coalescent events that are only possible when a gene Key words mismatch distribution spatial expansion demograph ic expansion human evolution mitochondrial DNA subdivided population E mail laurent excoffier zoo unibe ch Mol Biol Evol 20 1 76 86 2003 DOT 10 1093 molbev msg009 2003 by the Society for Molecular Biology and Evolution ISSN 0737 4038 18 lineage has migrated into a deme already occupied by another gene lineage Interestingly the coalescent during the collecting phase is similar to that of an unsubdivided population but on a timescale
158. distribu a la communaut scientifique et qu il permette d aborder des questions diverses La pr histoire d Homo sapiens sapiens en Europe nous a paru tre un cadre particuli rement adapt l utilisation de SPLATCHE D une part l Europe est sans conteste le continent pour lequel l histoire des populations humaines est la mieux connue d un point de vue arch ologique mais galement g n tique D autre part les variations climatiques qui ont affect ce continent sont galement abondamment document es Finalement des hypoth ses relativement bien d finies ont t propos es pour expliquer l histoire du peuplement humain de ce continent Deux sujets d tudes distincts ont rapidement merg premi rement le remplacement des N andertaliens par les premiers Hommes modernes lors de leur arriv e en Europe il y a environ 40 000 ans Stringer et Andrews 1988 deuxi mement le passage d une conomie de subsistance principalement bas e sur la chasse la p che et la collecte de denr es sauvages une conomie de production agricole Cette transition connue sous le nom de N olithique Lubbock 1865 a d but au Proche Orient il y a environ 10 000 ans revue d taill e par Mazuri de Keroualin 2003 Nous proposons dans ce travail de fournir un cadre th orique l interpr tation de la structure g n tique europ enne en fonction des hypoth ses mises pour ces deux v nements d mographiques majeurs Les r sultats de
159. dle East to North western Europe can be generated equally well by the Neolithic expansion process that occurred 8 000 3 000 BC or by the expansion of the first modern human in Europe 45 000 30 000 BP It is important to recognize that AFCs are not generated by the different amounts of Paleolithic lineages in the current demes along the expansion path Figure 3 since clines are present even in total absence of such lineages as in the case of a pure DD model y 0 In fact the occurrence of these AFCs is relatively independent of the contribution of Paleolithic lineages into the current gene pool of Europeans Table 1 The expected frequency of AFCs under a pure cultural diffusion when the F layer does not exist i e Table 1 last line is even larger than under pure DD model y 0 due to the fact that founder effects are stronger in small populations Since the presence of AFCs is thus independent of the proportion of Neolithic lineages in the population they cannot be invoked as a pure support to the 129 SNP diversity in Europe after a range expansion DD theory Barbujani amp Bertorelle 2001 Barbujani et al 1995 and only the dating of the AFCs would perhaps allow the support of one model rather than another Paleolithic contribution to the European genetic pool The nature of the founders of a population is important to determine its final genetic composition Heyer 1995 Heyer amp Tremblay 1995 Milinkovitch et al 2004 be
160. dscape In Rockman M Steele J eds Colonization of unfamiliar landscapes The archaeology of adaptation Routledge London pp 203 221 Helgason A Hickey E Goodacre S Bosnes V Stefansson K Ward R Sykes B 2001 mtDna and the islands of the North Atlantic estimating the proportions of Norse and Gaelic ancestry Am J Hum Genet 68 723 37 Helgason A Hrafnkelsson B Gulcher J R Ward R Stefansson K 2003 A Populationwide Coalescent Analysis of Icelandic Matrilineal and Patrilineal Genealogies Evidence for a faster Evolutionary Rate of mtDNA Lineages than Y Chromosomes Am J Hum Genet 72 00 00 Hewitt G 2000 The genetic legacy of the quartenary ice ages Nature 405 907 913 Hewitt G M 1996 Some genetic consequences of ice ages and their role in divergence and speciation Biological Journal of the Linnean Society 58 247 276 Hewitt G M 2001 Speciation hybrid zones and phylogeography or seeing genes in space and time Molecular Ecology 10 537 549 Hewlett B Van de Koppel J M H Cavalli Sforza L 1982 Exploration ranges of Aka pygmies of the Central African Republic Man 17 418 430 Hill E W Jobling M A Bradley D 2000a Y chromosome variation and Irish origins In Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeological Research University of Cambridge Cambridge pp 81 88 Hill E W Jobling M A Bradley D G 2000b Y chromosome
161. e S1 coalescences r centes scattering phase C1 coalescences au moment de l expansion n olithique contraction 1 C2 coalescences au moment de l expansion pal olithique contraction 2 Le temps tr s court 400 g n rations qui s coule entre l expansion n olithique et le pr sent conduit a des branches terminales de l arbre qui sont aussi tr s courtes Les mutations n ont pas le temps de s accumuler sur ces branches pas plus qu elles n ont le temps de s accumuler sur les branches terminales qui se font partir des coalescences de la p riode S1 Ceci implique que les signatures g n tiques intrapopulationnelles de ces deux p riodes de coalescences s additionnent et ne permettent pas de les diff rencier La signature des p riodes de coalescence S1 et C1 sur la distribution mismatch est l apparition d une importante classe 0 homozygotie qui correspond au premier mode de la distribution Les distributions mismatch obtenues lors d un remplacement complet de la premi re population pal olithique sont donc identiques celles obtenues par une unique expansion dans une population de faible Nm section 3 2 En revanche lorsque la contribution g n tique de la population pal olithique est importante les distributions mismatch simul es sont semblables celles obtenues apr s la diffusion d une seule population de grand Nm Or il suffit d une faible contribution indig ne dans chaque deme pour que leur con
162. e s explique par le fait que le nombre de SNPs donc de sites polymorphes S est identique dans les deux cas mais que la forme de la g n alogie est diff rente Figure 3 3 Lorsque Nm est grand les mutations se r partissent principalement sur les branches terminales qui sont tr s longues Il y a par consequent tr s peu de g nes identiques mais leur diff renciation est mod r ment importante lorsqu ils sont compar s deux a deux A l oppos la longueur importante des branches internes dans les g n alogies obtenues avec un petit Nm implique que la majorite des mutations s accumulent sur ces branches internes Il en r sulte que les g nes pris par paires sont soit identiques soit tres differents Lorsque Nm est petit le mode principal de la mismatch reflete la grande diff renciation qui existe entre une partie des genes sa valeur augmente avec la diminution de Nm Cette variation du mode principal des distributions mismatch en fonction du Nm ne s observe pas avec des sequence d ADN article 3 2 1 Figure 3 car avec ces derni res le nombre de sites polymorphes S nest pas fix La taille totale de l arbre de coalescence augmente avec Nm et par consequent S galement article 3 2 1 Table 1 Pour la m me longueur de s quence la pr sence 1 Il ne s agit pas ici d homozygotie r elle puisque le locus simul est haplo de mais nous utilisons cependant ce terme pour d crire la proportion de s quences identiques attendue
163. e 4 5 Evolution des densit s des populations A trait gris et B trait noir au cours du temps selon le mod le 2 Lotka Volterra avec taux de comp tition d pendants des densit s a Disparition de la population A car Kg gt Ka b Equilibre stable entre les deux populations car Kg Ka La densit initiale de B Ngo est gale a 2 individus Mod le M3 Cohabitation forc e puis comp tition avec taux fix s Il est possible que la competition entre deux populations ne se d roule pas directement lors de l arriv e de la seconde dans une aire d j peupl e Par exemple certains auteurs pensent que les n olithiques ne sont pas directement entr s en competition avec les chasseurs collecteurs lorsqu ils se sont install s dans les m mes r gions Pinhasi et al 2000 L installation primaire des communaut s n olithiques se serait faite dans des zones diff rentes de celles occup es par les chasseurs collecteurs dans les zones les plus favorables l agriculture et l levage Ce ne serait que dans une seconde phase lorsque leurs effectifs auraient augment que les agriculteurs auraient commenc empi ter sur les territoires des chasseurs collecteurs et que la comp tition interpopulationnelle aurait alors d but Dans l optique de mod liser cette p riode de cohabitation pendant laquelle aucune competition ne s exerce entre les deux communaut s nous avons d velopp le mod le suivant 54 K DIE 2 a siN
164. e Ohare die is pont 4 2 3 GO A 110 eee RET eee RT eee Re ARE Oe ee tee or ee een eee er ee hee ener rene eee een 4 3 INPUT TILES ne en de tn imite it ein Sade ae tn 4 3 1 GENETIC SOMOS SERRES REA ne en es RE OUTPU TE TICES sali oie i alsa ni a edit Mea aa 4 4 1 PAU CO MUI CS a serncat rears oy cana ee Samacee are ate 4 4 2 IN XMS JU CS iran oi eo teas tug gO sida ae Se cared arses cere GA AA 4 4 3 COGlES CENCE GIST IDUMION FOS Sauer te cialis teas nn Nestea i ties nn hh eek ea lea Acai nt et 4 4 4 COOL ES CENT CCS TCS RS RE oad ide Nake enacts abt TM ice 4 4 5 MRC de Osc Mis dates ee din Le no 4 4 6 OMR FU CS ESS RSR RS Mens dite item None 5 ACKNOWLEDGEMENTS siicitesesisssestssscatsseessiicscessessasesasradsdencses sousdetsasiaescoes eudecesescausdeseesisedtesteesdsoscepeseaesbesisene 6 DOWNLOAD SITES zienna naie iin datestaeoasnuceeaidedoacedades eustendes e a REFERENCES tin ni se ir ss nn hs nn estime 156 SPLATCHE User Manual 3 Demographic and spatial expansion module 3 1 Principles The demographic and spatial expansion module allows to simulate a demographic and spatial expansion from one or many initial populations The simulation uses discrete time and space The unit of time is the generation while the unit of the 2D space is a cell also called a deme Each deme has the same size and can be considered as a homogeneous subpopulation The spatial model used in SPLATCHE 1s the 2D stepping stone model Kimura amp Weiss 1964 which
165. e can incorporate Neanderthal genes by a density dependent admixture process If this happens a certain fraction of the local HS gene pool at equilibrium will consist of genes of HN origin and therefore these Neanderthal genes will have the possibility to be among the HS colonizers of new HS demes or to be exchanged with surrounding HS demes Compared to an instantaneous admixture model we have thus a much more rapid dilution of the modern human gene pool due to the amplification of the Neanderthal introgressed genes during the logistic growth of the HS deme Paleodemographic paleontological and archeological data were used to calibrate the parameters of our competition and admixture model In our simulations the replacement of Neanderthals by modern humans in about 500 generations corresponding to about 15 000 years is only possible if the carrying capacity of modern humans is larger than that of Neanderthals which is equivalent to assuming that they had better abilities to exploit local resources potentially due to their superior technology Several sets of parameters were found compatible with the known replacement dynamics of the Neanderthal and with available paleodemographic data on Neanderthal and human populations and six scenarios A to F have been studied as listed in Table 1 The admixture rate which is the parameter of interest in this study was allowed to vary and only marginally influenced the cohabitation period and the repla
166. e distributions mismatch ainsi que d tudier l effet du biais de recrutement sur ces distributions Dans un deuxi me temps nous discuterons ces r sultats en fonction des donn es connues pour les populations europ ennes 3 3 1 Simulations de s ries de SNPs pour diff rents types d expansion Nous avons proc d une s rie de simulations selon le m me sch ma que celui d crit dans la section pr c dente 3 2 soit dans un monde virtuel carr 50x50 homog ne pour les facteurs environnementaux K et F L expansion spatiale d une population dont le Nm est soit petit Nm 2 soit grand Nm 100 est simul e depuis le deme central lt 25 25 gt pendant 4 000 g n rations Ces deux types de populations repr sentent respectivement une population de chasseurs collecteurs actuels petit Nm et une population post n olithique grand Nm Diff rents effectifs de SNPs 10 50 et 100 sont simul s et leur distribution mismatch tablie Ci dessous nous 29 pr sentons les r sultats divis s en deux cat gories 1 r sultats pour lesquels tous les SNPs g n r s sont utilis s aucun biais de recrutement 2 r sultats pour lesquels seuls des sites dont la fr quence all lique est sup rieure ou gale 10 sont tudi s afin de tenir compte du biais de recrutement voir page 182 Nos simulations montrent qu il est possible d obtenir des informations sur la d mographie des populations en utilisant
167. e du peuplement humain Th se Universit de Gen ve Gen ve Sanchez Mazas A Butler Brunner E Excoffier L Ghanem N Ben Salem M Breguet G Dard P Pellegrini B Tikkanen J Lefranc G Langaney A Butler R 1994 New data for AG haplotype frequencies in Caucasoid populations and the selective neutrality of the AG polymorphism Hum Biol 66 27 48 Sanchez Mazas A 2000 The Berbers of North Africa Genetic Relationships according to HLA and other polymorphisms In Arnaiz Villena A ed Prehistoric Iberia Genetics Anthropology and Linguistics Kluwer Academic Plenum New York pp 65 77 Sanchez Mazas A 2001a Les origines de l homme au coeur de ses g nes Pour la science 289 84 91 Sanchez Mazas A 2001b African diversity from the HLA point of view influence of genetic drift geography linguistics and natural selection Hum Immunol 62 937 48 Schillaci M A Froehlich J W 2001 Nonhuman primate hybridization and the taxonomic status of Neanderthals Am J Phys Anthropol 115 157 66 Schmitz R W Serre D Bonani G Feine S Hillgruber F Krainitzki H Paabo S Smith F H 2002 The Neandertal type site revisited interdisciplinary investigations of skeletal remains from the Neander Valley Germany Proc Natl Acad Sci U S A 99 13342 7 Schneider S Roessli D Excoffier L 2000 Arlequin a software for population genetics data analysis User manual release 2 000 Geneva Scholz M Bachmann L Nicholson G J B
168. e etude est presente de fa on d taill e Il est ensuite utilis pour d crire la diversit g n tique attendue dans une population qui est pass e par une phase d expansion d une part dans une aire inoccup e et d autre part dans une aire d j peupl e Cette m thodologie est ensuite appliqu e a deux cas particuliers d expansion en Europe celle des Hommes modernes entre 45 000 et 30 000 BP et celle des populations n olithiques entre 10 000 et 5 000 BP Ces recherches ont montr que la contribution des Neandertaliens au patrimoine g n tique des humains modernes est vraisemblablement minimale et que les gradients de fr quences all liques observes dans les populations europ ennes ne sont pas une preuve de la migration des premiers agriculteurs n olithiques depuis le Proche Orient Remerciements La r alisation de cette these n aurait pas t possible sans l aide et les encouragements de nombreuses personnes Leur soutien a pris des formes tres diverses et je tiens a leur temoigner ici ma plus profonde gratitude Laurent Excoffier a t la fois l instigateur et le superviseur des recherches pr sent es dans cette these La qualite de mon travail doit beaucoup a son encadrement dynamique et motivant a sa haute competence et sa rigueur scientifique Sa soif de d couverte et de changement m a offert la possibilit de traverser la Sarine r guli rement et de savoir ce que Toggelli veut dire Je le remercie galement
169. e flow A between the two layers depends on the density of the individuals in layer F and HG in a given deme as A y 2N N N N deme where y controls the fecundity of the matings between individuals of the two layers As discussed below a pure DD model assumes that there was no genetic interaction between hunter gatherers and farmers and therefore that y 0 In that case previous hunter gatherers go extinct only due to their competition with Neolithic people Less extreme demic diffusion models have been implemented corresponding to different values of O lt y lt 1 as reported in Table 1 The value of y 1 corresponds to the maximum amount of gene flow that can be simulated in our model and means that HG individuals reproduce indistinctly with HG or F individuals It corresponds to the movement of 20 HG lineages per deme on average over the whole Europe As a limiting case a pure cultural transition was also simulated for which the F layer does not exist and where Kpc was simply multiplied by 20 within each deme This demographic increase began at time 400 generations and was applied gradually from the Neolithic source deme at a speed corresponding to the scenario with y 0 Parameter calibration We gauged the parameters of our model from available paleo demographic information The carrying capacity of male or female hunter gatherers Kpc before the Neolithic was set to 40 corresponding to a density of 0 064 individuals per km Alroy 2
170. e fois de plus l impr cision autour de ce param tre Babujani Sokal Oden American Journal of Physical Anthropology 1995 Barbujani ef al 1995 ont galement simul les interactions entre chasseurs collecteurs pal olithiques et agriculteurs en d veloppant leur propre cadre de simulation Le mod le utilis dans cet article a n anmoins t passablement influenc par celui de Rendine et al 1986 sur de nombreux points L volution de la densit de la population n olithique se fait de la m me mani re selon une croissance logistique quation 4 1 alors que la densit de chasseurs collecteurs est fix e au d part 114 individus et diminue uniquement sous l effet des migrations interpopulationnelles Figure 4 2 Les migrations interpopulationnelles apellees acculturation dans cet article ont la m me signification que dans l tude de Rendine et al 1986 mais sont mod lis es de fa on diff rente En effet le nombre absolu de migrants S qui passent de la population CC vers la population AG lors de chaque g n ration est le produit de la probabilit de contact entre chasseurs collecteurs et agriculteurs et de la probabilit qu une acculturation d coule d un tel contact S Noy aeo Eq 4 5 Nac ga Nec Barbujani et al 1995 ont introduit un surplus de r alisme en utilisant des probabilit s de migrations diff rentes dues aux barri res g ographiques telles que les montagnes ou les mers Cependant seuls 3
171. e frequency clines AFC can be generated by a succession of founders effects along the axis of diffusion of an expansion wave Austerlitz et al 2000 Barbujani et al 1995 Fix 1997 However our results show that such clines can only be generated for alleles that are selected to be relatively frequent over the whole range of the studied area It therefore suggests that these clines will only be observed for alleles that are older than or that have occurred in the initial phase of the expansion possibly at the front of the wave of advance Edmonds et al 2004 In that sense an ascertainment bias in favor of SNPs with frequent minor alleles will show frequency clines in about 50 of the cases after an expansion Table 1 whereas no or a non significant number of clines will be observed without ascertainment bias This difference can perhaps explain the fact that AFCs have been commonly observed for classical markers Menozzi et al 1978 Sokal et al 1991 STR and SNPs i e Chikhi et al 1998 Rosser et al 2000 in Europe but not for mtDNA when unascertained complete sequence data are used Richards et al 1996 Richards et al 1998 Note that when ascertainment is artificially exerted on mtDNA sequence for instance by defining haplogroups on the basis of old mutations defining mtDNA lineages a geographic structure and gradient of haplogroup frequencies begins to be observed Richards et al 2002 Our simulations suggest that AFC from the Mid
172. e number of members of the Genus Homo who have ever lived and some evolutionary implications Human Biology 56 637 649 Whitfield L S Sulston J E Goodfellow P N 1995 Sequence variation of the human Y chromosome Nature 378 379 80 Whittle A 1996 Europe in the Neolithic the creation of new worlds Cambridge University Press Cambridge UK Willis K J Whittaker R J 2000 Perspectives paleoecology The refugial debate Science 287 1406 7 Winterhalder B Baillargeon W Cappelletto F 1988 The population ecology of hunter gathers and their prey Journal of Anthropological Archaeology 7 289 328 Wolpoff M 1996 Human Evolution McGraw Hill New York Wolpoff M H 1989 Multiregional evolution the fossil alternative to Eden In Mellars P Stringer C eds The Human Revolution Biological perspectives in the Origins of Modern Humans Princeton University Press Princeton pp 62 108 Wright S 1943 Isolation by distance Genetics 28 114 138 Young D A Bettinger R L 1995 Simulating the global human expansion in the late pleistocene Journal of Archaeological Science 22 89 92 Zane L Bargelloni L Patarnello T 2002 Strategies for microsatellite isolation a review Mol Ecol 11 1 16 Zhivotovsky L A Rosenberg N A Feldman M W 2003 Features of evolution and expansion of modern humans inferred from genomewide microsatellite markers Am J Hum Genet 72 1171 86 Zvelebil K V 1989 On the transition to farming in
173. e rates estimated with our model Our finding that even minute amounts of interbreeding between Neanderthals and modern humans should lead to a massive introgression of Neanderthals mtDNAs into the Cro Magnon gene pool is somehow counter intuitive and deserves further explanations The massive introgression process is actually due to both the progressive dilution of the invading gene pool into that of the pre existing population and to the amplification of introgressed Neanderthal genes during the early stage of the logistic growth of demes at the front of the range expansion This process bears some resemblance to the success of mutations arising in the wave front of an expanding population but here interbreeding is comparable to a recurrent mutation process In order to assess the importance of the period of logistic growth compared to a mere dilution process we have modeled a range expansion process where a newly founded deme reaches instantaneously its carrying capacity and where a given proportion of genes is recruited from the local Neanderthal gene pool The results of those simulations also reported in Table 1 and in Figure 1 as case G show that without logistic growth much larger interbreeding rates would be necessary to have the same impact on current human diversity Under this scenario the absence of Neanderthal mtDNA sequences in present Europeans is still compatible with a maximum of about 1 850 fertile breedings between Neandert
174. e serait donc possible que pendant une courte p riode au moment de l arriv e des premiers colons dans une zone d serte C est exactement ce qui se passe avec le mod le de croissance logistique puisque la valeur de r n est atteinte que pendant les premi res g n rations Figure 4 3 la croissance d mographique diminuant par la suite sous l effet de la limitation des ressources locales C est donc seulement au front de la vague d expansion qu une croissance instantan e gale la valeur de r peut avoir lieu Steele et al 1998 sugg rent cependant que les estimations tir es de comparaisons ethnographiques sont tr s 1 Toutes les valeurs de taux de croissance mentionn es dans ce travail sont donn es en g n rations 68 loign es de la valeur maximum du taux de croissance car les populations de chasseurs collecteurs actuelles sont proches de leur capacite de soutien Les nombreuses estimations qui ont t faites sur la base du peuplement du continent am ricain situent g n ralement le taux de croissance entre 12 et 90 Belovsky 1988 Winterhalder et al 1988 Steele et al 1998 Anderson et Gillam 2000 Alroy 2001 m me si des estimations ant rieures font tat de valeurs inf rieures 3 Hassan 1981 ou sup rieures gt 100 Birdsell 1957 Mosimann et Martin 1975 Les estimations du taux de croissance a long terme de la population humaine sont g n ralement beaucoup plus basses 0 3 0 6 puisqu elle font l
175. e the two types of economies coexisted over larger areas like 300 700 years in the North of the Alps and the Jura Gallay 1994 800 years in Cantabria and 400 years in Portugal Arias 1999 or 200 years in Franche Compte Jeunesse 1998 128 SNP diversity in Europe after a range expansion Our simulations were performed in a homogeneous environment with y identical in every deme regardless of its location While this assumption may seem unrealistic at a regional scale it is quite reasonable at a continental scale since the speed of HG colonization and that of the Neolithic transition can be regarded as quite regular at this level Ammerman amp Cavalli Sforza 1984 Bocquet Appel amp Demars 2000 It would be interesting to test in future studies the influence of some heterogeneity of the migration wave and to incorporate with much additional work and computer power more realism in the simulation such as an heterogeneous environment subject to temporal fluctuations Adams amp Faure 1997 spatial heterogeneity in y inferred from archaeological information Lahr et al 2000 maritime migrations along the Mediterranean coasts Zilhao 2001 or contractions re expansion during ice ages and long distance dispersal It however appears necessary to understand the genetic signature expected under a relatively simple demographic scenario before considering more complex ones Allele Frequency clines and influence of ascertainment bias Allel
176. e variables est important Nao Ngo Ka KB ra et rg Yas et yga Sort des limites de nos comp tences En revanche la comprehension du syst me est possible grace a des simulations Avant d utiliser ce mod le dans un monde constitu de cellules h t rog nes il est donc important de choisir les param tres de mani re ad quate afin qu ils correspondent a l tat final d sir Nous ne sommes cependant pas confront ce probl me dans le cadre de cette th se puisque nous n utilisons qu un cas particulier du mod le pour lequel le monde est homog ne et Kg est toujours plus grand que Ka Cela implique que la population A dispara t dans toutes les situations 4 3 3 Cycle d mographique complet Le mod le d mographique incluant la fois la comp tition intrapopulationnelle et interpopulationnelle ainsi que les migrations intrapopulationnelles et l hybridation a t impl ment dans le logiciel SPLATCHE pour qu chaque g n ration et dans chaque cellule un cycle d mographique se passe selon les phases ci dessous Les d tails de cette impl mentation sont pr sent s dans l ANNEXE 4 Phase 1 Hybridation interpopulationnelle Les hybrides issus de parents appartenant des populations diff rentes sont supprim s de la population et ajout s la population B et vice versa selon N ai N E ne 2 7 SN i YorNa Eq 4 19 Nae Noa et 2N N N ai Net a N E A j 7 N E YaNa 60 Phase 2 R gulat
177. eanderthals and modern humans Table 5 Upper limits of the number of admixture events and initial contribution of Neanderthals Maximum number of Maximum Neanderthal initial Scenario Maximum number of l i a admixture events over the input into modern human admixture events per deme b DC whole Europe gene pool A 0 0144 50 0 036 B 0 0097 34 0 024 C 0 0161 56 0 040 D 0 0344 120 0 086 E 0 0282 99 0 070 F 0 0159 56 0 040 G 0 5322 1863 1 330 Absence of admixture between modern humans and Neanderthals Figure 1 Illustration of the simulation of the range expansion process of modern humans into Europe from the Near East at six different times Simulations begin 1 600 generations ago with a part of Europe already colonized by Neanderthals shown as a light grey area and an origin of modern human expansion indicated by a black arrow pane a Panes b e show the progression of the wave of advance of modern humans into Europe at different times before present The black band at the front of the expansion wave represents the restricted zone of cohabitation between modern humans and Neanderthals 111 Absence of admixture between modern humans and Neanderthals GGG e cic Nec SOGGGC6C666 CERCLE Cie ele ielelc cic SOEGGQ6666S86 Cy CS Gc Ce cf cecce ecececcee exececcecece eeececcece esecececcee Ge CEEC Le vwuew Ceo tS SSSss Gooeeocue ebebeb oteo tp LLL Dh PPL Lats verve oe hs
178. eaten ceed e a 42 4 3 MOD LE DEMOGRAPHIQUE PROPOSE cccececececcececeeaeeeseeceaueusueacaueueususauauauseceuauaueesevavaueeneuas 48 4 3 1 R gulation d mographique intra d me 48 4 3 1 1 Comp tition intrapopulationnelle ss 49 4 3 1 2 Competition interpopulationnelle sisi 50 4 3 1 3 Mod les de comp tition d velopp s ss 51 4 3 1 4 Comparaison entre les mod les de comp tition propos s ccccceceeeeceeseeeeeeseaeeeeeeseeeeeeees 56 LOU MOa fee ee a ee Ac can Re er at ct Eee Le 58 4 3 2 1 Migrations intrapopulationnelles ss 58 4 3 2 2 Migrations interpopulationnelles ou hybridation cccccceeeeeeeeceeeeeeeeeeeeeeeeueeeeeeeaeeeeeeeeesseaes 59 4 3 3 Cycle d mographique complet 60 4 3 3 1 Ordre des phases de r gulation et de migration ccccccceeeeeeceeceeeeeeeeeceeeeneeeeeeeeaeeeeeeeeesaaaes 61 4 3 3 2 Simulation typique de l volution de deux populations dans la m me aire 61 4 4 AVANTAGES DE L APPROCHE PROPOS E cceccececeeceeeecuceuseeeecueeuseeeeseuaeeueeeeueaesevaueusaeeeeuneesaees 63 4 5 COMPORTEMENT DU MODELE 484 fu das masse ude ice toute tee bade te ee Enr a eaea 64 4 5 1 Schema de SIMUIANION EE ALAN he es 65 49 2 EsSs matonaesS parametro S eaii a A TAA E E e estate 66 45 271 TAUX d CrOISSANCR eccrine ia eae 68 4 5 2 2 Densit s de population sise 69 4 5 2 3 Migrations intrapopula
179. ectangles with the mouse cursor left button down 3 Second panel showing the histories of the number of emigrants in the four directions 4 Button allowing to save the graph in Windows Metafile format 165 SPLATCHE User Manual 4 Genetic module 4 1 Principles Genetic simulations are always preceded by a demographic simulation Indeed a genetic simulation uses the demographic information stored in the data base generated during the demographic phase The genetic phase is based on the coalescent theory initially described by Kingman 1982a 1982b and developed in other papers Ewens 1990 Hudson 1990a Donelly et Tavar 1995 This theory allows the reconstruction of the genealogy of a series of sampled genes until their most recent common ancestor MRCA For neutral genes the genealogy essentially depends on the demographic factors that have influenced the history of the populations from whom the genes are drawn The implementation of the coalescent theory is a modified version of SIMCOAL Excoffier et al 2000 The principal difference with SIMCOAL 1s that the demographic information used by genetic simulations do not come anymore from the migration matrix and historical events but from the data base generated during the demographic simulation The genetic simulation itself follows the procedure described in Excoffier et al 2000 and consists in two phases 1 Reconstruction of the genealogy The recon
180. ecular Ecology Notes pr sente le programme SPLATCHE et souligne ses applications potentielles SPLATCHE est un logiciel qui permet de g n rer des donn es g n tiques pour une population selon un sc nario d mographique donne Ce sc nario peut tre conditionn par des informations environnementales telles que la vegetation la topographie ou lhydrographie SPLATCHE se divise en deux parties 1 simulation de la d mographie d une population 2 simulation de la structure g n tique de cette population Si la phase 1 peut tre utilis e de mani re ind pendante par exemple pour tudier les principales voies de migrations d une esp ce donn e il nen est pas de m me pour la phase 2 qui ne peut se d rouler qu la suite de la premi re phase Les simulations se d roulent dans un monde virtuel d fini par l utilisateur l aide de cartes num riques repr sentant l aire g ographique d int r t Cette aire g ographique virtuelle est ensuite divis e en un certain nombre de cellules en fonction de la r solution d sir e Annexe 2 1 Il est ensuite possible de simuler la dispersion d une population partir d une cellule source Les densit s et les migrations des individus appartenant cette population sont conditionn es par les donn es environnementales propres a chaque cellule Toutes les migrations d individus ainsi que l volution des densit s de population l int rieur de chaque cellule au cours du temps sont sto
181. ed by ancient remains and the manners and customs of modern savages Williams and Norgate London Lundstrom R Tavare S Ward R H 1992 Modeling the evolution of the human mitochondrial genome Math Biosci 112 319 35 Malaspina P Cruciani F Ciminelli B M Terrenato L Santolamazza P Alonso A Banyko J Brdicka R Garcia O Gaudiano C Guanti G Kidd K K Lavinha J Avila M Mandich P Moral P Qamar R Mehdi S Q Ragusa A Stefanescu G Caraghin M Tyler Smith C Scozzari R Novelletto A 1998 Network analyses of Y chromosomal types in Europe northern Africa and western Asia reveal specific patterns of geographic distribution Am J Hum Genet 63 847 60 Mal cot G 1948 Les Math matiques de l H r dit Masson Paris Mal cot G 1955 The decrease of relationship with distance Cold Spring Harbor Symp Quant Biol 20 52 53 Malyarchuk B A Derenko M V 2001 Mitochondrial DNA variability in Russians and Ukrainians implication to the origin of the Eastern Slavs Ann Hum Genet 65 63 78 Marjoram P Donnelly P 1994 Pairwise comparisons of mitochondrial DNA sequences in subdivided populations and implications for early human evolution Genetics 136 673 683 Mazuri de Keroualin K 2001 La premi re n olithisation de l Europe une r valuation des modalit s du peuplement Th se Universit de Gen ve Gen ve Mazuri de Keroualin K 2003 Gen se et diffusion de l agriculture en Europe agricu
182. ed for Y chromosome and mtDNA can be at least partly due to an ascertainment bias when selecting Y chromosome SNPs for studying European populations Introduction Two opposing scenarios have been invoked to account for the spread of agriculture in Europe The demic diffusion DD model assumes that the Neolithic transition diffused in Europe from the Middle East by an important movement of population Ammerman amp Cavalli Sforza 1984 without much contact with local Paleolithic populations On the contrary the Cultural Diffusion CD model assumes that the Neolithic transition occurred mainly through the transmission of agricultural techniques Zvelebil amp Zvelebil 1988 without large movements of populations Archaeological evidence suggests that the dynamics of the spread of agriculture over Europe has been complex 122 SNP diversity in Europe after a range expansion with a succession of migration phases and local admixture e g Arias 1999 Gronenborg 1999 Mazuri de Keroualin 2003 Zvelebil 1986 Genetic evidence has been inconclusive so far on the amount of Paleolithic lineage incorporated into the current European gene pool despite a considerable amount of genetic data available on European populations This is disappointing since the DD and the CD models lead to quite different predictions concerning the amount of the current European gene pool tracing back to Paleolithic or Neolithic populations Under the CD model the curr
183. eed examination of Figure 4 reveals that in absence of exchange with hunter gatherers mismatch distributions should often be multimodal and have a mode closer to zero in populations sampled far from the Neolithic source On the contrary most European mismatch distributions are smooth and unimodal Excoffier amp Schneider 1999 and the mode of mismatch distributions is quite homogeneous across Europe Excoffier 2004 as expected when the contribution of Paleolithic lineages becomes important Moreover previous dating of demographic expansion for European populations pointed towards 40 000 years ago or more Comas et al 1996 Excoffier amp Schneider 1999 in keeping with a Paleolithic expansion Influence of ascertainment bias on SNP diversity Ascertainment bias has also a drastic effect on the shape of mismatch distributions inferred from linked SNPs as they become highly multimodal for relatively large amounts of acertainment bias minor allele frequency gt 10 Therefore this kind of ascertainment bias can erase a signature of demographic or range expansion It is interesting to note that it is precisely the conclusion that was drawn from the analysis of 22 linked Y chromosome SNPs showing bimodal mismatch distribution Pereira et al 2001 where the absence of expansion signal was attributed to a smaller male than female effective size Dupanloup et al 2003 Note however that bimodal mismatch distributions can also be obtained und
184. een Neanderthals and modern humans giving even more credit to the Recent African Origin hypothesis 37 38 to the expense of the multiregional hypothesis of human evolution implying a complete replacement of previous members of the Homo genus by modern humans Methods Digital map of Europe The geographical region encompassing Europe the Middle East and North Africa has been modeled as a collection of 7 500 square cells of 2 500 km each arranged on a two dimensional grid whose shape corresponds to the contour of the European and Mediterranean landmass Each cell harbors two demes one potentially occupied by modern humans Homo sapiens HS and one potentially occupied by Neanderthals Homo neanderthalensis HN Given the estimated range distribution of Neanderthals HN demes were allowed in only 3 500 cells mainly located in the lower part of Europe and in the Near East see Figure 1a Three land bridges have been artificially added to allow the settlement of Great Britain and Sicily Simulation of the colonization of Europe by modern humans At the beginning of the simulation 1 600 generations ago corresponding to 40 000 years ago when assuming a generation time of 25 years the HN demes are all filled at their carying capacity Kyy and the population HS is assumed 105 Absence of admixture between modern humans and Neanderthals to be restricted to a single deme in the Near East at a position corresp
185. effect of migration corridor or spatial bottlenecks on genetic diversity or the discovery of spatial regions that show an excess of migrants or of coalescent events Finally the edu cational value of SPLATCHE should be underlined as many insights can be gained by visualizing the movements of genes through space and time in a realistic environment 2004 Blackwell Publishing Ltd Molecular Ecology Notes 4 139 142 12 Executable Windows version of SPLATCHE user guide and example files can be downloaded from http cmpg unibe ch software splatche Depending on the size of the simulated world and the number of generations large amounts of RAM are required to guarantee reasonable exe cution time For instance a simulation of 10 000 demes over 4000 generations requires about 400 Mb of free RAM Acknowledgements We are grateful to Stefan Schneider and Pierre Berthier for their computing assistance This work was supported by a Swiss NSF grant no 31 054059 98 to LE References Barnes I Matheus P Shapiro B Jensen D Cooper A 2002 Dynamics of Pleistocene population extinctions in Beringian brown bears Science 295 2267 2270 Brachet S Olivieri I Godelle B ef al 1999 Dispersal and metapopula tion viability in a heterogeneous landscape Journal of Theoretical Biology 198 479 495 Excoffier L Novembre J Schneider 5 2000 srmMcoaL a general coalescent program for the simulation of molecular data in interconnected p
186. effectu es ant rieurement 6 La simulation dynamique de la population A Dans les tudes ant rieures le r le de la population chasseurs collecteurs est r duit au mieux une presence au d but de l expansion spatiale et d mographique de la population B Aucune attention n est port e sur l influence de la dynamique spatiale de la population A sur la structure g n tique L influence de l environnement sur les param tres d mographiques tels que les densit s ou les migrations Le milieu ne joue en effet pratiquement aucun r le dans les tudes pr alables 4 5 Comportement du mod le Nous avons d cid d tudier l influence des diff rents param tres de notre mod le sur les donn es g n tiques dans un cadre g ographique et temporel identique celui utilis dans le chapitre 3 La r utilisation de ce cadre permet d une part de nous appuyer sur les obervations du chapitre 3 pour tester l influence des nouveaux param tres sur les g n alogies et sur la diversit mol culaire et d autre part de comparer les observations obtenues apr s lexpansion d une population dans une aire pr alablement vide avec celles obtenues par la m me expansion dans une aire d j peupl e i Computational and Molecular Population Genetics Laboratory l Universit de Berne 64 4 5 1 Schema de simulation A la diffusion d une population d Homo sapiens sapiens dans un monde vide il y a environ 100 000 ans comme dans la
187. egacy of Paleolithic Homo sapiens sapiens in extant Europeans a Y chromosome perspective Science 290 1155 9 Sokal R R Oden N L amp Wilson C 1991 Genetic evidence for the spread of agriculture in Europe by demic diffusion Nature 351 143 5 141 SNP diversity in Europe after a range expansion Soodyall H Jenkins T Mukherjee A du Toit E Roberts D F amp Stoneking M 1997 The founding mitochondrial DNA lineages of Tristan da Cunha Islanders Am J Phys Anthropol 104 157 66 Steele J Adams J M amp Sluckin T 1998 Modeling Paleoindian dispersals World Archeology 30 286 305 Wakeley J 1999 Nonequilibrium migration in human history Genetics 153 1863 71 Wakeley J Nielsen R Liu Cordero S N amp Ardlie K 2001 The discovery of single nucleotide polymorphisms and inferences about human demographic history Am J Hum Genet 69 1332 47 Young D A amp Bettinger R L 1995 Simulating the global human expansion in the late pleistocene Journal of Archaeological Science 22 89 92 Zilhao J 2001 Radiocarbon evidence for maritime pioneer colonization at the origins of farming in west Mediterranean Europe Proc Natl Acad Sci U S A 98 14180 5 Zvelebil M 1986 Review of Ammerman amp Cavalli Sforza 1984 Journal of Archaeological Science 13 93 95 Zvelebil M amp Zvelebil K V 1988 Agricultural transition and Indo European dispersals Antiquity 62 574 583 142 7 Discussion g n rale
188. eistocene megafaunal mass extinction Science 292 1893 1896 2001 Bocquet Appel J P amp Demars P Y Population Kinetics in the Upper Palaeolithic in western Europe Journal of Archaeological Science 27 551 570 2000 Steele J Adams J M amp Sluckin T Modeling Paleoindian dispersals World Archeology 30 286 305 1998 Barbujani G Sokal R R amp Oden N L Indo European origins a computer simulation test of five hypotheses Am J Phys Anthropol 96 109 32 1995 Lotka A J The growth of mixed populations two species competing for a common food supply Journal of the Washington academy of Sciences 22 461 469 1932 Volterra V Variations and fluctuations of the numbers of individuals in animal species living together Reprinted in 1931 in Animal Ecology ed Chapman R N Mc Graw Hill New York 1926 Begon M Harper J L amp Townsend C R Ecology 1068 Blackwell Science Oxford 1996 Lee R B amp DeVore I Problems in the study of hunters and gatherers in Man the hunter eds Lee R B amp DeVore I 4 12 Aldine Publishing Company Chicago 1968 Coale A J The history of the human population Scientific American 231 40 51 1974 Hassan F A The peopling of the World in Demographic archaeology 193 208 Academic Press New York 1981 Ammerman A amp Cavalli Sforza L L The Neolithic transition and the genetics of populations in Europe 176 Princeton University Press Princeton New
189. elle de la population de chasseurs collecteurs Kac gt Kcc comme il est commun ment admis Hassan 1979 1981 Rendine et al 1986 Langaney et al 1990 Landers 1992 Barbujani et al 1995 Cavalli Sforza 1996 Pennington 2001 Diamond et Bellwood 2003 Gallay 2004 Dans ce cas de figure l tat final du syst me correspond a la disparition des chasseurs collecteurs ce qui correspond une observation av r e dans la plupart des r gions de l Ancien Monde et notamment en Europe Expansion N olithique Expansion Pal olithique e eaor s POLLLLLELELELEE annnnnnnnnnnng Migration A N aon D C O E AG Goulet CC 5 Nac D gi ios gt lt a yA 400 Temps en g n rations 4000 Figure 4 10 Sch ma des simulations dans un monde carr homog ne pour K et F friction et constitu de 2 500 d mes 65 Dans certains cas des migrations interpopulationnelles hybridation peuvent avoir lieu a partir de la population CC vers la population AG a un taux y Figure 4 10 Ces migrations repr sentent la fois les mariages mixtes entre ces deux populations et l adoption de l agriculture par les chasseurs collecteurs Les enfants issus de ces deux processus appartiennent a la population AG et poss dent au moins un anc tre dans la population CC Si on ne peut videmment pas exclure que des changes g n tiques aient eu lieu dans les deux sens nos simulations ont confirm que cela n a quas
190. ement le remplacement des Neandertaliens par Homo sapiens sapiens chapitre 5 ainsi que la transition n olithique europ enne chapitre 6 Avant de proc der ces recherches il tait important de bien cerner le comportement du mod le et l influence des diff rents param tres impliqu s sur les donn es g n tiques Cette exploration du mod le a t effectu e dans le contexte des populations humaines selon un sch ma identique celui utilis dans le chapitre 3 De cette mani re nous avons pu cerner les diff rences qui existent dans la diversit mol culaire d une population qui a colonis une aire vide ou une aire d j peupl e Nous avons ainsi montr qu il suffit d une tres faible incorporation d individus appartenant a la population indig ne dans chaque d me pour que la signature mol culaire obtenue lors de la colonisation d une aire peupl e ressemble celle obtenue lors de la colonisation d une aire vide En revanche si le remplacement de la population indig ne est complet ou presque complet alors les signatures r sultant de chacune des deux expansions spatiales sont visibles dans la structure g n tique Ces signatures se traduisent par deux modes distincts dans les distributions mismatch qui r sultent des coalescences tres fr quentes qui ont lieu pendant les p riodes d expansion II faut pr ciser que plus les deux expansions sont proches temporellement et plus il devient difficile de distinguer leurs signatur
191. ent genetic pool should mainly results from hunter gatherers lineages while the Near East Neolithic lineages should be prevalent in the European genetic pool under the DD model The Neolithic contribution to the current European gene pool has been estimated using various approaches and has led to contradicting results Depending on the markers used and the type of analyses performed it varies from a Neolithic contribution smaller than 25 Richards 2003 to values larger than 50 Barbujani amp Dupanloup 2002 Chikhi 2002 The analysis of classical nuclear markers and Y chromosomes has also often revealed the presence of allele frequency clines AFC along a South East to North West axis Barbujani amp Pilastro 1993 Chikhi et al 1998 Menozzi et al 1978 Rosser et al 2000 Sokal et al 1991 These frequency gradients have been interpreted as a signature of a demic diffusion model Ammerman amp Cavalli Sforza 1984 Menozzi et al 1978 but some authors have argued they could have been created by the arrival of the first hunter gatherers in Europe Barbujani amp Bertorelle 2001 Richards et al 1996 although this hypothesis has never been formally tested These two causes of gradient formation are actually difficult to distinguish since the first Paleolithic populations colonized Europe 40 000 years ago using approximately the same path as the Neolithization process 10 000 years ago Bocquet Appel amp Demars 2000 The pattern of mtDNA di
192. ent than the reverse situation Recent range expansions of Neolithic populations The present approach could certainly be used to model the spread of Neolithic farmers and the extinction of hunter gatherer practice in Europe in order to get estimates of the contribution of the Paleolithic populations to the current gene pool of present Europeans While this estimation is beyond the scope of the present paper the present simulations suggest that even in case of low levels of interbreeding the Paleolithic gene pool should be at a majority in current European populations This point is important as it implies that if Neanderthal lineages would have been present among the Paleolithic populations they should have persisted after the spread of the 104 Absence of admixture between modern humans and Neanderthals Neolithic in Europe Previous estimations of the Neolithic contribution to the current European genetic pool reach about 50 Assuming that the Neolithic farmers had themselves no Neanderthal component into their gene pool which is extremely conservative and actually not supported by our simulations see Figure 2 it implies that our estimates of the initial input of HN into the modern pool would have to be roughly multiplied by two but still be very small 0 07 for scenario A Note also that the simulation of a pure acculturation process which amounts to increasing the carrying capacity of populations after the Neolithic by a fact
193. er a pure DD model Figure 5a but this model was shown above to be unlikely from the analysis of mtDNA It follows that observed differences between the mismatch 130 SNP diversity in Europe after a range expansion distributions obtained from mtDNA sequences and from Y chromosome SNPs can be explained by the mere selection of frequent Y chromosome SNPs which is also supported by the observation of allele frequency clines for these markers and not for mtDNA sequences Acknowledgements Thanks to Nicolas Ray and Pierre Berthier for their programming and computing assistance We are also grateful to Montgomery Slatkin and Estella Poloni for stimulating discussion on the subject and to Grant Hamilton for his careful reading of the manuscript This work was supported by a Swiss NSF grant No 3100A0 100800 to LE 131 Table amp Figures SNP diversity in Europe after a range expansion Table 1 Statistics computed after the simulation of various amount of interactions between Paleolithic and Neolithic populations Paleolithic contribution y a LP 0 00 0 0 05 1 0 10 2 0 15 3 0 25 5 0 50 10 0 75 15 1 00 20 Demographic variables HG F Coha col col b 470 260 TT 470 260 7 7 470 255 7 6 470 250 7 4 470 245 7 3 470 240 7 0 470 230 6 7 470 220 5 6 470 260 Neolithic Contribution 1 00 0 00 0 48 0 13 0 30 0 10 0 12 0 04 0 07 0 02 0 03 0 01 0 01 0 00 0 00 0 00 0 00 Allele Frequency Clines 9 Bias
194. er avec une amplitude satisfaisante le nombre de migrants interpopulationnels S 8000 Nac 6000 4000 TT 2000 Ncc 0 i 0 50 Temps en g n rations Figure 4 2 Evolution des densit s de chasseurs collecteurs en gris et d agriculteurs en noir au cours du temps avec les valeurs de param tres tir s de Barbujani et al 1995 Soit Kec 114 Kac 7560 rac 0 5 et y 0 00024 Trait fin S mais est toujours tres petit et donc indiscernable sur cette figure Bien que le mod le de Barbujani et al 1995 soit le plus d taill r alis ce jour certains aspects paraissent assez peu r alistes notamment la dynamique des chasseurs collecteurs qui est tout simplement absente Aoki World Scientific 1996 Aoki 1996 a galement abord la mod lisation des interactions entre chasseur cueilleurs et n olithiques mais de mani re analytique Son mod le utilise l apport d une troisi me population AC qui correspond aux chasseurs collecteurs convertis aux techniques n olithiques Aoki fait donc la distinction entre la population n olithique issue de la population d origine AG et celle AC constitu e des n olithiques descendant par assimilation des chasseurs collecteurs Le mod le utilis peut tre d crit comme N Nes Nc AcoNocs 1 a IN Nic Lo Nici Eq 4 6 CC Nuc T Nact Ness Ne T deN aea ares YNoos Nice 7 Nici AG Nuc Naos N oia Ni T de Ts K AG ou
195. er une mutation Cela signifie qu un g ne chantillonn qui se trouve au bout d une tres longue branche terminale aura une grande probabilit d avoir des mutations propres et d tre tr s diff renci des autres g nes Le taux de mutation est choisi en fonction du nombre de locus li s qui constituent l haplotype n haplotypes mut s Un haplotype al atoire HR LIP JET EE EE CE SP Le ee CE Fe Ke 0000 PIP Figure 9 6 Exemple d arbre de coalescence Les points repr sentent des mutations al atoires le long des branches de l arbre aboutissant a des s quences mut es SPLATCHE offre donc la possibilit de g n rer des donn es mol culaires lesquelles d pendent de la topologie d un arbre de coalescence topologie elle m me influenc e par la d mographie de la population La Figure 9 7 illustre la forme caract ristique des arbres de coalescence dans le cas de deux d mographies de populations diff rentes stationnaire ou ayant pass par une croissance d mographique ainsi que les donn es mol culaires obtenues sous la forme de distributions mismatch et de distributions de fr quences all liques La Figure 9 8 montre que des r plications ind pendantes d arbres de coalescence selon un sc nario d mographique donn sont sujettes une grande variance puisque la stochasticit du processus est grande Cependant la topologie g n rale des arbres reste tout de m me reconnaissable si les sc narios d mogr
196. ere Rute Bucho Barbara Arredi Jose Manuel De Abreu Nunes Je tiens aussi remercier les membres du CMPG et plus particuli rement ceux avec qui j ai eu le plaisir de collaborer dans le cadre du projet Friction Samuel Neuenschwander Grant Hamilton Guillaume Laval Seraina Klopfstein et Daniel Wegmann ainsi que Jean Claude Nicod Carlo Largiader Gerald Heckel Thomas Giger Irene Keller ainsi que les nombreux diplomants Les membres du D partement d Anthropologie et d Ecologie de l Universit de Gen ve a commencer par son ancien directeur Alain Gallay mais galement Marie Besse Laurence lsaline Stahl Gretsch Pierre Yves Nicod Jocelyne Desideri Genevieve Perr ard et Karoline Mazuri de Keroualin m ont fait b n ficier de leurs comp tences en arch ologie et en anthropologie Le personnel technique et administratif du d partement n a pas m nag ses efforts pour que les miens puissent tre focalis s sur la recherche Je tiens remercier particuli rement Jean Gabriel Elia Marisa Andosilla Leila Gaude Marie Noelle Lahouze Davaud Val rie Mirault Georges Puissant et Jacques Koerber ainsi que Serge Aeschlimann Yves Reymond Elvire Martinez et Micheline Vautravers Laure Fleury Christiane Currat et Sandrine Giroud ont pris la peine de relire consciencieusement certaines parties de ce manuscrit et ont pu ainsi viter que la plus grande partie de mes petites faiblesses en fran ais n apparaissent dans sa versi
197. es 39 4 Expansion spatiale dans un contexte occupe 4 1 Introduction Le peuplement pr historique de l Europe est marque par deux transitions d mographiques importantes dat es d environ 45 000 ans et 10 000 ans Biraben 1979 Outre le d but d une croissance d mographique ces deux v nements ont en commun la diffusion de nouvelles technologies depuis le sud est de l Europe en direction du nord ouest du continent Djindjian et al 1999 La premi re transition correspond a l arriv e des Hommes modernes Homo sapiens sapiens dans une Europe alors habit e par Homo neandertalensis Ces derniers vont dispara tre en moins de 15 000 ans laissant la place aux Hommes modernes Mellars 1992 Bocquet Appel et Demars 2000b Klein 2003 Si ces deux populations ont coexist dans certaines r gions pendant plusieurs si cles voire plusieurs mill naires Stringer et Grun 1991 Mellars 1998 l importance de leurs changes culturels et plus particuli rement g n tiques est toujours discut e Hublin 1988 Duarte et al 1999 Klein 2003 La seconde transition correspond a la diffusion des techniques agropastorales depuis le Proche Orient Lev Yadun et al 2000 Mazuri de Keroualin 2001 Ces techniques ont t en partie amen es en Europe par des nouveaux immigrants issus des premiers agriculteurs proche orientaux L importance de ce flux migratoire est cependant discut e puisque dans certaines r gions les chasse
198. es taux d acculturation utilis s ailleurs Rendine et al 1986 Calafell et Bertranpetit 1993 Barbujani ef al 1995 au param tre y utilis ici Nous faisons varier y entre O pas d hybridation et 1 tous les individus ont la m me probabilit de se marier quelle que soit leur population d origine 4 5 2 5 Temps de cohabitation Toujours dans le but de calibrer notre mod le il est n cessaire de conna tre quels sont les intervalles r alistes du temps de cohabitation entre chasseurs collecteurs et n olithiques dans une aire donn e qui correspond un d me dans nos simulations La Table 4 2 recense les p riodes de temps entre l arriv e des premiers elements n olithiques et la disparition des derniers elements m solithiques dans diff rentes r gions d Europe Ces temps de chevauchement sont difficilement comparables entre eux car la taille des r gions tudi es varie consid rablement Ils permettent cependant de se faire une id e de leur ordre de grandeur Except la zone 1 Figure 4 12 constitu e de l Anatolie de la Turquie asiatique et de Chypre ou la p riode d installation du n olithique est plus longue il s agit de la mise en place primaire des l ments constituant le n olithique Mazuri de Keroualin 2001 il faut au maximum 1100 ans pour avoir un changement total d conomie dans chacune de ces zones Table 4 2 La c te atlantique est constitu e des r gions dans lesquelles la cohabitation entre com
199. es issus des premiers agriculteurs du Proche Orient alors la contribution indig ne lors du N olithique ne peut avoir t que tr s faible voire nulle 1 00 Echantillonnage local 0 Echantillonnage p riph rique a O0 0 60 0 40 0 20 Proportion de g nes n olithiques O O oO 0 1 0 2 03 04 05 06 07 0 8 09 1 Taux d hybridation y Figure 4 20 Proportion de genes n olithiques dont les anc tres sont issus de la population AG initiale en fonction de y pour un chantillonnage sur le lieu de l expansion n olithique en noir ou en p riph rie en blanc Nous avons montr que l une des cons quences d un remplacement des chasseurs collecteurs lors de la transition n olithique est une homozygotie attendue importante dans les populations due aux effets combin s des coalescences des p riodes S7 et C7 Figure 4 14 Cette homozygotie attendue visible dans les distributions mismatch dispara t avec l augmentation de y d autant plus vite que l echantillonnage est effectu en p riph rie de la source n olithique En effet c est dans le front d avancee n olithique que se passe la cohabitation entre agriculteurs et chasseurs collecteurs et c est galement pendant cette cohabitation que de I hybridation est possible Par consequent plus les g nes se trouvent longtemps dans le front de la vague d avancee et plus leur probabilit d tre issus de la populat
200. es qui nous pr occupent dans ce travail concernent deux populations distinctes les N andertaliens et les Hommes modernes dans un cas les chasseurs collecteurs et les agriculteurs dans l autre La version de base de SPLATCHE ne permettant pas de simuler simultan ment deux populations diff rentes nous avons donc d proc der des modifications qui sont d crites en d tails dans l ANNEXE 4 Parall lement il a fallu d velopper un mod le d mographique qui permette de mod liser de mani re r aliste les interactions entre deux populations notamment la comp tition et les changes g n tiques entre elles chapitre 4 Lors des deux v nements d mographiques qui nous pr occupent ici l expansion spatiale d une population invasive s est faite dans une aire d j occup e par une autre population Nous avons donc test les consequences dans les donn es mol culaires de la diffusion d une population dans un contexte occup chapitre 4 Avant cela il a t n cessaire de cerner les valeurs les plus ad quates pour les diff rents param tres du mod le partir des estimations faites pour les populations humaines contemporaines ou pr historiques Tous les d veloppements n cessaires la simulation de deux populations en interaction dans la m me aire g ographique sont pr sent s dans le chapitre 4 Il faut noter que les aspects techniques relatifs l impl mentation du programme SPLATCHE ne sont mentionn s que su
201. es respectives Appliqu es aux populations europ ennes ces observations sugg rent que la transition n olithique sur ce continent na pas pu se faire avec un remplacement tr s important de la population indig ne comme propos par le mod le initial de diffusion d mique Ammerman et Cavalli Sforza 1984 En effet si le remplacement des chasseurs collecteurs m solithiques avait t important pendant le N olithique on s attendrait a trouver une classe O importante ainsi qu une grande variance dans les distributions mismatch tir es des populations europ ennes ce qui n est pas le cas Cette comparaison ne porte cependant que sur l inspection visuelle des donn es provenant d un seul locus et ne permet donc pas une estimation pr cise de la contribution indig ne lors du N olithique Notre m thodologie peut tre galement utilis e dans de nombreux autres contextes que ceux qui sont pr sent s dans ce chapitre ou dans les chapitres 5 et 6 notamment dans le cadre d tudes sur l incorporation introgression du g nome d une esp ce envahie dans celui d une esp ce invasive Bernatchez et al 1995 Shaw 2002 sur la diffusion de nouvelles mutations Klopfstein in prep ou sur d autres esp ces ou sous esp ces en comp tition 93 5 Expansion des Hommes modernes en Europe 5 1 Introduction L Europe et le Proche Orient font partie des r gions pour lesquelles l histoire des Hommes est la plus abondamment docume
202. ess would certainly reinforce the difference in recent deme size between the two types of communities and contribute to the extreme raggedness of hunter gatherer mismatch distributions But we feel that a realistic model of population differentiation should necessarily take into account the subdivision of human populations Therefore a scenario with global demographic growth and subsequent bottlenecks to explain observed differences between patterns of diversity in food producing and food gathering populations appears much less par 84 Ray et al simonious and less likely than simply taking into account the finite spatial structure of the demes and the low census size of hunter gatherers Distinction Between Spatial and Demographic Expansions We find that although spatial expansions also involve a demographic increase at the level of the population as a whole they do not necessarily lead to a molecular signature similar to that of sudden demographic expan sions in unsubdivided populations This is the case only if the amount of gene flow is large between neighboring demes For relatively low levels of gene flow Nm lt 20 recent coalescent events and therefore multimodal mis match distributions can be expected in a quite large fraction of simulations table 1 even if the global size of the population has been increased by several orders of magnitude after the expansion The dependence between the amount of gene flow between demes an
203. et al 1998 Nous n avons malheureusement pas les moyens de tester de fa on ad quate cette hypoth se ici puisque nous ne connaissons pas l importance du biais de recrutement des donn es provenant du chromosome Y Si dans le futur il tait possible de soustraire ce biais des donn es du Une soci t patrilocale est une soci t dans laquelle ce sont les femmes qui se d placent pour se marier alors que les terres sont h rit es par la lign e masculine voir p ex Oota et al 2001 37 chromosome Y et que la forme des distributions mismatch pour ce systeme restait multimodale alors il serait possible de soutenir l hypoth se selon laquelle le Nm de la lign e m le actuel est plus faible que celui de la lign e femelle Ceci ne peut tre r alis que par le sequengage de portions d ADN compl tes pour la partie non recombinante du chromosome Y et pour de nombreuses populations De telles sequences permettraient non seulement la comparaison entre les signatures mol culaires des lign es f minines et masculines mais galement l estimation de leur Nm L utilisation de SPLATCHE associ e une approche d estimation bayesienne p ex Beaumont et al 2001 devrait permettre dans le futur de telles estimations pour les populations r elles humaines ou non 3 5 Conclusion Les recherches pr sent es dans ce chapitre ont permis de montrer que la diff rence observ e dans les distributions mismatch des populations
204. eurs collecteurs pal olithiques ait eu lieu en direction des zones refuges permanentes dont les deux principales seraient 1 le sud ouest de la France et la Cantabrie Housley et al 1997 Bocquet Appel et Demars 2000a 2 les plaines centrales de la Russie et de l Ukraine Housley et al 1997 Gribchenko et Kurenkova 1999 et ventuellement la r gion du Caucase Lordkipanidze 1999 Ces contractions et expansions d mographiques se sont potentiellement traduites par des modifications de la structure g n tique des populations europ ennes Lahr et Foley 1998 Roebroeks 2003 Certaines tudes effectu es sur les polymorphismes mol culaires des populations europ ennes ont d ailleurs mentionn des traces pouvant s apparenter a la signature d une r expansion post glaciaire des populations humaines Torroni et al 1998 Semino et al 2000a Torroni et al 2001 Underhill et al 2001 Cependant pour Barbujani et Chikhi 2000 si l influence des colonisations post glaciaires avait vraiment ete importante il ne serait pas possible de distinguer de gradients de frequences continentaux entre le sud est et le nord ouest de l Europe L influence des contractions et des expansions sur la structure g n tique des populations est un sujet qui pourrait tre id alement tudi l aide du programme SPLATCHE pour autant qu une mod lisation satisfaisante du mouvement des individus vers les zones refuges soit d velopp e La simulatio
205. fell et al 1996 Comas ef al 1996 Corte Real ef al 1996 Francalacci et al 1996 Comas et al 2000 Malyarchuk et Derenko 2001 Nasidze et Stoneking 2001 Expansion pal olithique Expansion paleolithique Pi 100 000 ans soa 40 000 ans 0 2 0 2 gt Signature N olithique A Signature Pal olithique e Ensemble Fr quence Fr quence 0 1 0 1 0 2 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Diff rences Diff rences Figure 4 23 Distributions mismatch cercle noir lors d un remplacement complet de la population CC sous l effet combin des signatures d expansions n olithique losanges blancs et pal olithique triangle gris A expansion pal olithique il y a 4 000 g n rations 100 000 ans B expansion pal olithique il y a 1 600 g n rations 40 000 ans Toutes les observations faites pr c demment et relatives aux effets des param tres d mographiques sur les g n alogies sont toujours valables lorsque le cadre temporel est modifi r sultats non montr s Une expansion plus r cente de la population CC rapproche la p riode S1 de la p riode C2 Figure 4 14 Il en r sulte un raccourcissement des arbres de coalescence dont la topologie g n rale reste semblable celle observ e lors d une expansion pal olithique ancienne puisque elle est ind pendante du taux de mutation En revanche la forme des distributions mismatch est passablement diff
206. ficant cline In order to simulate different amounts of ascertainment bias we have conducted separate analyses on SNPs with overall minor allele frequency among the 20 samples of at least 5 or at least 10 The molecular diversity of a mtDNA sequence of 300bp was also simulated for the same samples assuming a mutation rate of 0 00125 per generation for the whole sequence 33 of divergence par million years Heyer et al 2001 Soodyall et al 1997 The genetic variability of the samples was analyzed using the program ARLEQUIN Schneider et al 2000 Results Distinction between cultural CD and demic DD diffusion models The molecular signature obtained under various scenarios depends on the spatio temporal dynamics of the sampled lineages Under a pure DD model without genetic exchange between Neolithic and Paleolithic populations y 0 and going backward in time the ancestors of the sampled lineages first coalesce or disperse in the F layer Figure 1a Then they are brought back to the place of origin of the Neolithic expansion by the shrinking Neolithization wave Figure 1b c some of them pass through the spatial and demographic bottleneck constituted by the Neolithic source The lineages that did not coalesce during this bottleneck can disperse again in the HG layer Figure 1d Finally the lineages are brought back towards the place of origin of the Paleolithic expansion Figure 1e f This dynamics results in three main periods of
207. files An example of settings files aisre provided with SPLATCHE settings square txt with the corresponding data files in the folder called dataSets square The example file is a simple square world constituted by 50x50 demes see Ray ef al 2003a The setting file is composed of 29 parameters An example corresponding to settings square txt is given below Each line starts with the value of the parameter followed by a blank a double slash and then the description of the parameter dataSets_square dens_init txt pop source file dataSets_square simplesquare asc vegetation file dataSets_square simplesquare asc roughness file dataSets_square Dynamic_K txt Conversion table Vegetation gt K dataSets_square Dynamic_F txt Conversion table Vegetation gt F 3 demographic model 1 3 700 number of generations 0 10 growth rate 0 20 migration rate 0 allow Initial Density overflow 0 1 1 static or dynamic environment 0 1 0 ffENOLCE OF Eri chion tybe 0s vegetation Liroughn ss Lopogqrapay 2 both dataSets_square genes_middle sam original genetic sample file 1 number of genetic simulations 10000 maximum number of simulated generations 0 Genetic Data Type 0 DNA 1 RFLP 2 MICROSAT 3 STANDARD 300 number of linked loci 0 001 total mutation rate 33 fraction Of substitutions being transitions for DNA Gamma A for DNA mutation variation number of Categories for DNA mut
208. first use a forward simulation scheme to generate the demography density and gene flow of a two dimensional array of demes initially empty except for a single deme assumed to be at carrying capacity We then use this resulting demographic information to simulate the molecular di versity of a set of DNA sequences drawn from a single deme using a coalescent backward approach Demographic Simulations Simulations were performed in a subdivided popula tion consisting of 2 500 demes arranged in a two di mensional stepping stone lattice of 50 X 50 demes At the beginning of a simulation a single deme of this population is occupied with a density equal to 100 unless specified otherwise This ancestral deme is the source of an isotropic spatial expansion In our simulations we have considered just two potential locations for this ancestral deme one was located at the center of the lattice at position lt 25 25 gt and the other located near the periphery at position lt 5 5 gt After the onset of the spatial expansion process the range of the population increases due to ongoing exchange of migrants between occupied demes and their neighbors Emigrants are sent from a given deme having density N at time f to neighboring demes at rate m so that N m emigrants are sent outwards at each generation If a gene is sent to an occupied deme the movement results in gene flow If not the movement results in the colonization of a new deme The
209. for exporting input data files into several other format like BIOSYS PHYLIP or GENEPOP so that files produced by SPLATCHEcould be also analyzed by these softwares after file conversion 4 4 2 Nexus files Three other types of file produced by Friction are compatible with the NEXUS file format two files with the trees extension are automatically produced and list all the simulated trees with branch lengths expressed either 7 in units of generations scaled by the population size N and therefore representing the true coalescent history of the sample of genes or ii in units of average number of substitutions per site and therefore representing the realized mutational tree These two files could be visualized with the software TREEVIEW Page 1996 For each simulation a file with paup extension could be generated This file lists all the simulated genes together with their true genealogical structure This file can be analyzed with David Swofford s PAUP software 1999 A PAUP batch file with extension bat is also generated 4 4 3 Coalescence distribution files A bitmap representing the spatial distribution of the coalescent events for all the simulations joined is automatically created with the TotNumCoal bmp termination This maps can also be visualized by means of the button Draw Coalescence 15 on Figure 4 1 on the interface In setting the coalescence checkbox 16 on Figure 4 1 similar bitmap
210. galement de nombreux essais avant d obtenir des combinaisons de param tres qui permettent la simulation r aliste de deux des v nements d mographiques majeurs qui ont affect notre esp ce sur le continent europ en Ces valeurs sont en effet tir es d estimations arch ologiques ou ethnologiques provenant de la litt rature et qui ne sont souvent pas tr s pr cises section 4 5 2 Il a donc fallu proc der la simulation d un tr s grand nombre de cas diff rents afin de compenser l incertitude qui existe autour du choix de ces param tres Seuls les r sultats les plus repr sentatifs sont pr sent s dans ce travail L approche par simulation que nous utilisons ici n cessite donc une puissance informatique importante pour tudier de mani re satisfaisante l espace des r sultats possibles Nous avons heureusement pu b n ficier d un cluster de 40 ordinateurs pour mener bien nos recherches et il n aurait pas t possible de le faire dans un temps raisonnable sans ce mat riel La simulation de la colonisation d une aire d j peupl e par une nouvelle population a montr qu il suffit de tr s peu d changes g n tiques entre les nouveaux arrivants et les autochtones pour que le g nome de la population invasive incorpore une grande proportion du g nome de la population envahie C est le cas lorsque la population autochtone dispara t comme dans les deux tudes pr sent es dans ce chapitre mais cette incorporation d
211. gical Research University of Cambridge Cambridge pp 31 39 Verhulst P F 1838 Notice sur la loi que la population suit dans son accroissement Curr Math Phys 10 113 Vignal A Milan D SanCristobal M Eggen A 2002 A review on SNP and other types of molecular markers and their use in animal genetics Genet Sel Evol 34 275 305 Volterra V 1926 Variations and fluctuations of the numbers of individuals in animal species living together Reprinted in 1931 In Chapman RN ed Animal Ecology Mc Graw Hill New York Wahl L M Gerrish P J Saika Voivod 2002 Evaluating the impact of population bottlenecks in experimental evolution Genetics 162 961 71 209 Wakeley J 1999 Nonequilibrium migration in human history Genetics 153 1863 71 Wakeley J 2000 The effects of subdivision on the genetic divergence of populations and species Evolution 54 1092 1101 Wakeley J 2001 The coalescent in an island model of population subdivision with variation among demes Theor Popul Biol 59 133 44 Wakeley J Aliacar N 2001 Gene genealogies in a metapopulation Genetics 159 893 905 Wall J D 2000 Detecting ancient admixture in humans using sequence polymorphism data Genetics 154 1271 9 Watson E Bauer K Aman R Weiss G von Haeseler A Paabo S 1996 mtDNA sequence diversity in Africa Am J Hum Genet 59 437 44 Weidenreich F 1946 Apes giants and man University of Chicago Press Chicago Weiss K M 1984 On th
212. gor 1939 Par exemple avec le logiciel ARCVIEW ESRI 1998 173 la fa on dont les param tres F et K peuvent tre calcul s en fonction des donn es environnementales sont donn es dans Ray 2003 chapitre 3 Unit de temps Les simulations se font par une succession d it rations temporelles qui correspondent des g n rations discr tes Lors de chaque g n ration quatre tapes Figure 9 1 ont lieu successivement dans chacun des d mes qui composent le monde virtuel 1 R gulation de la densit N selon une croissance logistique 2 Calcul du nombre effectif d migrants E 3 Calcul de la direction de migration pour chaque emigrant 4 Mise jour de la densit N au temps 1 en fonction du nombre d migrants E et t 1 d immigrants provenant des cellules voisines N 1 N E I Evolution de la densit Le nombre d individus qui peuplent un d me peut voluer au cours du temps selon diff rents mod les d mographiques Ces mod les sont d crits de fa on d taill e dans ANNEXE 1 ainsi que dans Ray 2003 D but Initialisation des tailles de populations Croissance logistique Calcul du nombre effectif Effectu toutes d migrants les n g n rations Effectu Dynamisme environnemental chaque Calcul de la direction de g n ration migration pour chaque migrant Mise jour des densit s de tous les d mes Fin Figure 9 1 tapes principales d une
213. gray and Paleolithic layer HG in light gray demes at six different periods before present under a pure DD model y 0 P origin of the Paleolithic expansion and F origin of the Neolithic expansion Dashed lines the axe along which 20 demes are samples for 40 genes Black spots on the light gray zone represent HG lineages and white spots on the dark gray zone represent F lineages The black band at the front of the Neolithic expansion represents the Mesolithic zone where Neolithic and Paleolithic populations coexist 133 na K S NO Coalescent events frequency SNP diversity in Europe after a range expansion Neolithic wave C7 DD y 0 z Paleolithic wave C2 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Time in generation Figure 2 Temporal distribution of the coalescent events under the pure DD model y 0 when there is no genetic interaction between hunter gatherers and farmers in black and when y 1 the maximum amount of gene flow allowed in grey S7 correspond to the scattering phase see text C7 and C2 to the contraction phases occurring during the Neolithic and the Paleolithic expansions respectively The small variations in the distributions are due to spatial bottlenecks Currat 2004 Frequency of neolithic lineages O0 O iN N y N A A s SSL 0 123 4 5 6 7
214. gy Transitions in Prehistory Science 282 1441 1458 Arias P 1999 The origins of the Neolithic along the Atlantic coast of continental Europe Journal of World Prehistory 13 403 464 Aris Brosou S Excoffier L 1996 The impact of population expansion and mutation rate heterogeneity on DNA sequence polymorphism Mol Biol Evol 13 494 504 Barbujani G Sokal R R 1991 Genetic population structure of Italy Il Physical and cultural barriers to gene flow American Journal of Human Genetics 48 398 411 Barbujani G Pilastro A 1993 Genetic evidence on origin and dispersal of human populations speaking languages of the Nostratic macrofamily Proceedings of the National Academy of Science 90 4670 3 Barbujani G Whitehead G N Bertorelle G Nasidze I S 1994 Testing hypothesis on processes og genetic and linguistic change in the Caucasus Hum Biol 66 843 864 Barbujani G Sokal R R Oden N L 1995 Indo European origins a computer simulation test of five hypotheses Am J Phys Anthropol 96 109 32 Barbujani G Stenico M Excoffier L Nigro L 1996 Mitochondrial DNA sequence variation across linguistic and geographic boundaries in Italy Hum Biol 68 201 15 197 Barbujani G Bertorelle G Chikhi L 1998 Evidence for Paleolithic and Neolithic gene flow in Europe Am J Hum Genet 62 488 92 Barbujani G Chikhi L 2000 Genetic population structure of europeans inferred from nuclear and mitochondrial DNA polymorphisms I
215. h bouring demes see Ray 2003 for details The sending of migrants to unoccupied demes results typically in a wave of advance of the whole population as shown on Fig 2 The velocity and the shape of the edge of this wave depend on various parameters of the model such as F K m and r see Ray 2003 A modified version of the sIMCOAL program Excoffier ef al 2000 has been integrated into SPLATCHE and it is used to generate the molecular diversity of one or several sam ples All former specifications of sIMCOAL are available except the historical events formerly used to resize deme sizes and migration patterns between demes Now instead of manually setting the sizes of the demes and the pattern of migrations prevailing between demes at different time 11 Coalescent simulation Fig 1 Schematic view of the two step simulation processes demography and coalescent necessary to generate genetic diversity at a given locus The left pane illustrate the fact that forward demographic simulations are carried out from spatial information on potential carrying capacities 1 i a b and friction in different environment The 1 resulting simulated deme densities and immigration rates are used to perform coale scent simulations right pane Mutations following a given model are then sprayed on the coalescent tree to generate molecular diversity and are shown as black dots on the gene genealogy Ge
216. hal females and Cro Magnon males corresponding to a maximum initial input of 1 2 Neanderthal genes into the European Cro Magnon population This figure is 20 times larger than when assuming 103 Absence of admixture between modern humans and Neanderthals an initial logistic growth of newly founded populations but still about 20 times smaller than when assuming a single admixture event and an instantaneous settlement of Europe by modern humans It implies that the final contribution of the invaded population on the gene pool of the invading population does not only depend on the total amount of gene flow but also and to a larger extent at which time this gene flow occurred Introgressed invaders Another important result of this study is to show that an expanding population or species should have its own genome invaded by that of the invaded population if interbreeding is possible Interestingly this phenomenon could explain some documented cases of mitochondrial DNA introgression e g Our model indeed predicts that introgression would occur preferentially in species having gone through a range expansion and that the introgressing genome would be that of the invaded population and not that of the invasive species Of course this result should only apply to the part of the genome that is not under selection or that is not linked to the selective advantage of the invaders If the mitochondrial genome of modern humans was involved
217. he tmrca extension The TMRCA are given on generation units with the bigger number corresponding to the end time of the simulation 4 4 6 Other files The gen file summarize statistics about the data such as the mean coalescence times the mean number of pairwise differences within and among demes and the mean length of the trees 5 Acknowledgements We are grateful to Stefan Schneider and Pierre Berthier for their computing assistance The development of the SPLATCHE program was possible through a Swiss NSF grant n 31 054059 98 6 Download sites SPLATCHE http cmpg unibe ch software splatche SIMCOAL http cmpg unibe ch software simcoal ARLEQUIN http cmpg unibe ch software arlequin TREEVIEW http taxonomy zoology gla ac uk rod treeview html PAUP http paup csit fsu edu 7 References Currat M in prep These D partement d Anthropologie et d Ecologie Universit de Gen ve Currat M Ray N amp Excoffier L 2004 SPLATCHE a program to simulate genetic diversity taking into account environmental heterogeneity Molecular Ecology Notes 4 1 139 142 Donnelly P amp Tavar S 1995 Coalescents and genealogical structure under neutrality Annu Rev Genet 29 401 421 Ewens W J 1990 Population Genetics Theory The Past and the Future In Kluwer Academic Publishers Mathematical and Statistical developments of Evolutionary Theory 177 227 S Lessar Dordrecht Excoffier L No
218. heterogeneity Molecular Ecology Notes 4 139 142 Djindjian F Koslowski J amp Otte M 1999 Le Pal olithique sup rieur en Europe Paris Armand Colin Dupanloup l Pereira L Bertorelle G Calafell F Prata M J Amorim A amp Barbujani G 2003 A recent shift from polygyny to monogamy in humans is suggested by the analysis of worldwide Y chromosome diversity J Mol Evol 57 85 97 Edmonds C A Lillie A S amp Cavalli Sforza L L 2004 Mutations arising in the wave front of an expanding population Proc Natl Acad Sci U S A 101 975 9 Excoffier L 2004 Patterns of DNA sequence diversity and genetic structure after a range expansion lessons from the infinite island model Mol Ecol 13 853 64 Excoffier L amp Schneider S 1999 Why hunter gatherer populations do not show sign of Pleistocene demographic expansions Proceedings of the National Academy of Sciences USA 96 10597 10602 Fix A G 1997 Gene frequency clines produced by kin structured founder effects Hum Biol 69 663 73 Gallay A 1994 A propos de travaux r cents sur la N olithisation de l Europe de l ouest L Anthropologie 98 576 588 Gronenborg D 1999 A variation on a basic theme the transition to farming in southern central Europe Journal of World Prehistory 13 123 210 Hassan F A 1979 Demography and archaeology Annual Review of Anthropology 8 137 160 Heyer E 1995 Mitochondrial and nuclear genetic contribution of female founders to a
219. hypoth se que l humanit est pass e de fa on exponentielle de quelques milliers d individus il y a 100 000 ans environ 5 10 millions la fin du pal olithique Coale 1974 Hassan 1981 Landers 1992 Ces valeurs ne sont pas du tout incompatibles avec celles tir es d observations ethnographiques ou bas es sur le peuplement de l Am rique puisque comme nous l avons d j mentionn sur une longue dur e une population passe plus de temps l quilibre qu en croissance Ainsi le taux de croissance long terme est faible alors que pendant la ou les p riode s de croissance ce taux est beaucoup plus important Les valeurs ponctuelles g n ralement retenues ou mentionn es lors de simulations sont de l ordre de 20 30 Rendine et al 1986 Calafell et Bertranpetit 1993 Cavalli Sforza et al 1994 N olithique rac Il est g n ralement admis que le taux de croissance des agriculteurs est sup rieur a celui des chasseurs collecteurs Zvelebil et Zvelebil 1988 Jackes et al 1997 m me si ce changement s est peut tre effectu lentement notamment par un accroissement du taux de natalit plus important que du taux de mortalit Coale 1974 Rendine et al 1986 Calafell et Bertranpetit 1993 ainsi que Barbujani et al 1995 ont par exemple utilis un taux de croissance de 50 pour la population n olithique dans leurs simulations qui est une estimation grossi re faite par Ammerman et Cavalli Sforz
220. i 266 1959 1965 Cavalli Sforza L L amp Feldman M W 2003 The application of molecular genetic approaches to the study of human evolution Nat Genet 33 Suppl 266 75 Chikhi L 2002 Admixture and the demic diffusion model in Europe In Examining the farming language dispersal hypothesis ed P Bellwood amp C Renfrew pp 435 447 Cambrigs McDonald Institute Monographs Chikhi L Destro Bisol G Bertorelle G Pascali V amp Barbujani G 1998 Clines of nuclear DNA markers suggest a largely neolithic ancestry of the European gene pool Proc Natl Acad Sci U S A 95 9053 8 Chikhi L Nichols R A Barbujani G amp Beaumont M A 2002 Y genetic data support the Neolithic demic diffusion model PNAS 99 11008 11013 Comas D Calafell F Mateu E Perez Lezaun A amp Bertranpetit J 1996 Geographic variation in human mitochondrial DNA control region sequence the population history of Turkey and its relationship to the European populations Mol Biol Evol 13 1067 77 Currat M 2004 Effets des expansions des populations humaines en Europe sur leur diversit g n tique In Thesis Departement d Anthropologie et Ecologie Geneve Universit de Geneve Currat M amp Excoffier L 2004 Model of range expansion of modern humans in Europe supports no admixture with Neanderthals submitted Currat M Ray N amp Excoffier L 2004 SPLATCHE a program to simulate genetic diversity taking into account environmental
221. i R 1998 mtDNA analysis reveals a major late Paleolithic population expansion from southwestern to northeastern Europe Am J Hum Genet 62 1137 52 Torroni A Bandelt H J Macaulay V Richards M Cruciani F Rengo C Martinez Cabrera V et al 2001 A Signal from Human mtDNA of Postglacial Recolonization in Europe Am J Hum Genet 69 844 52 Tremblay M Vezina H 2000 New estimates of intergenerational time intervals for the calculation of age and origins of mutations American Journal of Human Genetics 66 651 8 Tsoularis A Wallace J 2002 Analysis of logistic growth models Math Biosci 179 21 55 Underhill P A Shen P Lin A A Jin L Passarino G Yang W H Kauffman E Bonne Tamir B Bertranpetit J Francalacci P Ibrahim M Jenkins T Kidd J R Mehdi S Q Seielstad M T Wells R S Piazza A Davis R W Feldman M W Cavalli Sforza L L Oefner P J 2000 Y chromosome sequence variation and the history of human populations Nat Genet 26 358 61 Underhill P A Passarino G Lin A A Shen P Mirazon Lahr M Foley R A Oefner P J Cavalli Sforza L L 2001 The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations Ann hum Genet 65 43 62 Van Andel T H 2000 Where received wisdom fails the Mid Palaeolithic and early Neolithic climates In Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeolo
222. iales des populations europ ennes sur leur structure g n tique Avant de proc der la simulation de sc narios aussi complexes que l arriv e des premiers hommes modernes ou la diffusion des populations n olithiques il a t n cessaire d tudier des situations beaucoup plus simples afin de bien comprendre les processus impliqu s C est pour cette raison que nous avons commenc nos recherches par la simulation d une seule population dans un monde carr et 143 homog ne chapitre 3 M me si une telle aire est compl tement irr aliste elle permet de comprendre le comportement des processus g n tiques dans l espace ces r sultats tant ensuite interpretables dans un cadre r el Nous avons ensuite augment a chaque fois la complexit des simulations et le nombre de param tres consid r s par exemple en incorporant une seconde population chapitre 4 puis une structure g ographique chapitres 5 et 6 afin de cerner l influence de chacun d eux Nous n avons pas encore utilis toutes les potentialit s du logiciel SPLATCHE notamment l h t rog n it de l environnement et sa fluctuation au cours du temps et notre travail peut tre consid r comme un point de d part une approche globale sur lequel pourront se baser des tudes ult rieures Dans le cas des tudes expos es dans les chapitres 5 et 6 il a t n cessaire de proc der non seulement de nombreuses recherches bibliographiques mais
223. ical patterns of global human Y chromosome diversity Mol Biol Evol 18 1189 203 Hammer M F Blackmer F Garrigan D Nachman M W Wilder J A 2003 Human population structure and its effects on sampling Y chromosome sequence variation Genetics 164 1495 509 Handt O Meyer S von Haeseler A 1998 Compilation of human mtDNA control region sequences Nucleic Acids Research 26 126 12 Harpending H Sherry S T Rogers A R Stoneking M 1993 The genetic structure of ancient human populations Current Anthropology 34 483 496 Harpending H 2001 Book reviews Archaeogenetics DNA and the population prehistory of Europe Am J Phys Anthropol 116 177 179 Harpending H C 1994 Signature of ancient population growth in a low resolution mitochondrial DNA mismatch distribution Hum Biol 66 591 600 Harpending H C Batzer M A Gurven M Jorde L B Rogers A R Sherry S T 1998 Genetic traces of ancient demography Proc Natl Acad Sci U S A 95 1961 7 Harris D R 1996 The origins and spread of agriculture and pastoralism in Eurasia University College London Press London Hartl D L Clark A G 1997 Principles of Population Genetics Sinauer Associates Inc Sunderland Massachusetts Hassan F A 1979 Demography and archaeology Annual Review of Anthropology 8 137 160 Hassan F A 1981 The peopling of the World In Demographic archaeology Academic Press New York pp 193 208 Hazelwood L Steele J 2003 Colonizing new lan
224. ien aux distributions mismatch si ce n est que la valeur du mode principal est l g rement plus lev e Figure 3 1 b d et f Ceci s explique par le fait que lorsque Nm est faible les branches internes de l arbre de coalescence sont longues les 31 mutations ont donc une plus grande probabilit de s y accumuler Par cons quent la s lection des SNPs avec les plus hautes fr quences all liques sera alors plus ou moins repr sentative de la configuration de la g n alogie Figure 3 3a En revanche lorsque Nm est grand le biais de recrutement provoque un premier mode important dans les distributions mismatch Figure 3 2 b d et f qui r sulte de l utilisation des mutations qui se trouvent sur les branches internes de l arbre En effet lorsque Nm est grand la majorite des mutations s accumulent sur les branches terminales de l arbre Par cons quent l tude des mutations les plus fr quentes n est pas repr sentatif de la configuration de la g n alogie Figure 3 3b Nm 100 0 6 mode 0 0 6 a 10 SNPs b 10 SNPs freq 2 10 as d 04 mode 2 O O C C O ab gt D O LL LL 0 2 4 0 0 2 4 6 8 10 12 06 Diff rences 0 6 Diff rences c 50 SNPs d 50 SNPs freq 2 10 0 4 0 4 b ob 2 L mode 4 S g D mode 10 0 2 0 0 2 4 6 8 10 12 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 0 6 en 0 6 Nr Diff rences Diff rences aa e 1
225. igin of the Neolithic Figure 3 Even when y 1 there is still 1 of Neolithic lineages in the Anatolian sample close to the source of the Neolithic Note that under the simulated conditions a Neolithic cline is observed at the continental level only when y is smaller than 0 15 corresponding to about 3 HG incorporated per deme on average It is also important to note that even for values of y as low as 0 05 1 HG incorporated per deme during the whole cohabitation period the majority of the current European gene pool is of Paleolithic ancestry Table 1 Figure 3 This results is virtually not affected by the size and the spread of the Neolithic source for instance when it consists of a subdivided population of 25 demes Currat 2004 Molecular diversity within demes The patterns of molecular diversity can be obtained by adding mutations on top of coalescent trees whose structures are readily perceived in Figure 2 for y equal to 0 and 1 Under a pure DD model y 0 a large proportion of mismatch distributions are multimodal have a large variance and present an important proportion of identical pairs of sequences Figure 4a b The homozygosity class 0 in mismatch distributions increases with the distance between the sampling area and the Neolithic source because the number of coalescent events occurring during the C7 phase will also increase When y increases the difference between samples located close or far from the Neolithic so
226. ikelihood estimation of migration rates and effective population numbers in two populations using a coalescent approach Genetics 152 763 773 2001 Maximum likelihood estimation of a migration matrix and effective population sizes in n subpopulations by using a coalescent approach Proc Natl Acad Sci USA 98 4563 4568 Donnelly P and S Tavar 1995 Coalescents and gene alogical structure under neutrality Annu Rev Genet 29 401 421 Excoffier L J Novembre and S Schneider 2000 SIMCOAL A general coalescent program for the simulation of molecular data in interconnected populations with arbitrary demography J Hered 91 506 510 Excoffier L and L Schneider 2000 The demography of human populations inferred from patterns of mitochondrial DNA diversity Pp 101 108 in C Renfrew and K Boyle eds Archaeogenetics DNA and the population prehistory of Europe McDonald Institute for Archeological Research Cambridge Excoffier L and S Schneider 1999 Why hunter gatherer populations do not show sign of Pleistocene demo graphic expansions Proc Natl Acad Sci USA 96 10597 10602 Fu Y X 1997 Statistical tests of neutrality of mutations against population growth hitchhiking and backgroud selection Genetics 147 915 925 Goldstein D B G W Roemer D A Smith D E Reich A Bergman and R K Wayne 1999 The use of micro satellite variation to infer population structure and demo graphic his
227. iment aucune influence sur les r sultats lorsque la population CC dispara t apres quelques g n rations de contact comme c est le cas ici Par cons quent nous avons d cid de ne consid rer qu un flux g nique allant dans le sens de la population CC vers la population AG comme l ont fait d autres auteurs avant nous Rendine et al 1986 Barbujani et al 1995 Aoki 1996 Aoki et al 1996 La Figure 4 11 illustre schematiquement l volution des densit s des populations CC et AG ainsi que les hybridations selon le cas particulier du mod le que nous utilisons ici soit Kec lt Kac et hybridation uniquement de CC vers AG Scc ac 200 Nac 150 Kec lt Kac gt Disparition de CC Densit O 0 20 40 60 80 100 Temps en g n rations Figure 4 11 Sch ma de l volution des densit s des populations CC en gris et AG en noir au cours du temps ainsi que des hybridations allant uniquement de CC vers AG trait fin Kec lt Kac L influence du goulet d tranglement n olithique tant sans aucun doute sous estim e de par le fait que notre mod le ne tol re qu une seule coalescence par g n ration nous avons modifi ce dernier de mani re ce qu un maximum de 10 coalescences soient possibles pendant la g n ration pendant laquelle a lieu le goulet g n ration 400 Lorsque la taille du goulet n est pas explicitement mentionn e il s agit alors d un goulet constitu d un seul deme contenant
228. imulations the values of y leading to a given average number of admixture events per deme e g 1 500 1 100 1 10 1 2 etc have been found Coalescent simulations During 1 600 generations the two populations evolve according to the model described above HS progressively invades the territory of the Neanderthals due to its larger carrying capacity When demes are reached by the HS expansion wave HN and HS coexist during several generations in the same cell and HN disappears under the effect of competition Such a typical demographic transition is shown in Figure S5 together with the amount of admixture between HN and HS resulting in the integration of Neanderthal genes in the HS gene pool For each scenario and for different values of the amount of interbreeding 7 the demography of more than 14 000 demes is thus simulated for 1 600 generations and recorded in a database The density of all demes the number of migrants exchanged between demes from the same population as well as the number of admixture events resulting in gene movements between Neanderthals and modern humans are recorded This demographic database is then used to simulate the genealogy of samples of 40 genes drawn from 100 demes representing a total of 4 000 modern human genes distributed over all Europe and corresponding approximately to the current sampling effort of 171862 The coalescent simulations proceed as described previously European mtDNA sequence The aver
229. individus chantillonn s A l inverse lorsque Nm est grand la majorite des coalescences se d roulent dans la r gion de la source de l expansion au moment du d but de celle ci article 3 2 1 Figure 1 Les liens de parent entre la plupart des individus tir s d un chantillon remontent alors a l origine de la population Au niveau des g n alogies de g nes et des donn es mol culaires un grand Nm se traduit par des arbres en peigne avec de longues branches terminales article 3 2 1 Figure 2 et par cons quent par des distributions mismatch unimodales et une faible variance article 3 2 1 Figure 3 Un petit Nm donne lieu a une combinaison de courtes et de longues branches terminales et par consequent a des distributions mismatch multimodales et une grande variance Les Statistiques utilis es habituellement pour d tecter une expansion d mographique telles que D Tajima 1989a 1989b et Fs Fu 1997 ne sont efficaces que lorsque le Nm associ aux d mes est grand article 3 2 1 Table 1 M me si une population est pass e par une expansion spatiale D et Fs la detectent tr s difficilement lorsque le Nm de cette population est faible Nous montrons donc que la croissance d mographique d une population combin e a une expansion spatiale n implique pas toujours la m me signature mol culaire qu une simple croissance d mographique dans une population non subdvis e Les deux signatures sont identiques uniquement si le flu
230. ine l adresse www cmpg unibe ch software splatche Molecular Ecology Notes 2004 4 139 142 PROGRAM NOTE doi 10 1046 1471 8286 2003 00582 x SPLATCHE a program to simulate genetic diversity taking into account environmental heterogeneity M CURRAT FN RAY tt and L EXCOFFIER Computational and Molecular Population Genetics Laboratory Zoological Institute University of Bern Baltzerstrasse 6 3012 Bern Switzerland tGenetics and Biometry Laboratory Anthropology and Ecology Department University of Geneva Rue Gustave Revilliod 12 1227 Carouge Switzerland Abstract We present a program called SPLATCHE SPatiaL And Temporal Coalescences in Heterogene ous Environments to simulate the molecular diversity of samples of genes in an environ mentally heterogeneous world Simulations are performed by first simulating the colonization of the world using environmental information to constrain migrations and local densities These simulated densities and migration rates recorded over time and space are then used to simulate genetic diversity under a coalescent framework The program thus virtually allows the translation of ecological information into molecular diversity a novel approach that can be used to study the effect of climatic change on genetic diversity Keywords coalescent simulation demography heterogeneous environment molecular diversity spatial expansion Received 24 September 2003 revision accepted
231. interbreeding between individuals of the HN and HS populations as well as migration between neighboring demes from the same subdivided population arranged on a 2 dimensional stepping stone We distinguish here migrations events between HN and HS populations from migrations between neighboring HN or HS populations We model the former ones as admixture events whereas the latter ones correspond to true dispersal events The life cycle of a population at a given generation is as follows admixture logistic regulation incorporating competition followed by migration This life cycle thus assumes that migration is at the adult stage In line with previous work the frequency of admixture events is assumed density dependent Within a given deme each of the N individuals from the i th population has a probability A 2N N N N to reproduce succesfully with one of the N members of the j th population and y represents the probability that such a mating results in a fertile offspring Following admixture population densities are then first updated as N N 1 A A N Our model of density regulation incorporating competition is based on the Lotka Volterra interspecific competition 45 46 model which is an extension of the logistic growth model For each population a new density N is calculated from the former density as N N ETC N a N IK where r is the intrinsic growth rate of the i th population K is its carrying
232. ion CC est grande Lorsque y est suffisamment grand gt 0 1 alors les distributions mismatch obtenues lors d une double expansion sont identiques a celles obtenues avec une simple expansion r sultats non montr s Cela implique qu il suffit d une faible 85 incorporation indig ne lors de chaque tape de la progression des techniques agropastorales pour qu aucune trace sp cifique au N olithique ne soit visible dans la diversit intrad me des populations europ ennes Echantillonnage local Echantillonnage p riph rique 0 4 y 0 4 0 3 0 3 a Ai O O D ae 5 0 2 2 r g 7 Ta 5 0 2 3 oo 0 00 3 LL de ae LL 0 1 0 1 0 po a RE eet ee ae 0 SS 0 2 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 c 0 4 D 0 3 0 3 S 8 5 5 5 0 2 nS co 0 2 LE D i 0 05 j 4 5 a D s LL LL s 0 1 0 1 0 0 T T 0 2 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 E 0 4 F 0 3 0 3 ob ob O O 0 2 am oom 3 7 ge Se N 0 20 g gee a 2 LL f LL 0 1 0 1 0 T 0 T T 0 2 4 6 8 10 12 14 16 18 0 2 4 6 8 10 12 14 16 18 Diff rences Diff rences 0 4 G 0 4 H 0 3 0 3 a i 2 2 L 0 2 a 1 00 202 REA 4 O D P s Va P X LL LL s 0 1 0 1 0 T T 0 T T T T T T 4 6 8 10 12 14 1
233. ion S1 qui n existent quasiment pas pour un grand Nacem Figure 4 14A Ces coalescences r centes se traduisent par une classe O importante dans les distributions mismatch Figure 4 14C La plupart des coalescences qui n ont pas lieu pendant la p riode S7 lorsque Nm est important ont lieu pendant la p riode C7 contraction 1 C7 n existe pas lors d une expansion simple et correspond aux coalescences provoqu es par le goulet n olithique Les derni res coalescences se font pendant la p riode C2 contraction 2 qui correspond a la phase de contraction de la vague pal olithique En comparant les distributions mismatch obtenues avec deux expansions et celles obtenues avec une seule expansion en gris dans la Figure 4 14C on peut conclure que lhomozygotie attendue est syst matiquement plus importante dans le premier cas En effet m me avec un grand Nacm 1000 un premier mode est observ lorsque deux expansions se succ dent avec un remplacement complet des CC ce qui n est pas le cas avec une expansion unique Il s agit d une difference importante entre les expansions spatiales et les simples croissances d mographiques Il est en effet impossible de distinguer la signature g n tique obtenue apres deux croissances d mographiques qui se succ dent dans une population non subdivis e de celle obtenue apr s une seule croissance Il est n cessaire que N cm soit plus petit que 2 pour que la trace de l expansion pal olithique
234. ion d mographique s lection juv nile De nouvelles densit s N sont calcul es en fonction des naissances et des d c s l int rieur m me de chacune des deux populations et peuvent s crire comme l a K Neat p GENS e _ _ Eq 4 20 K et N N 44 r K NON ae B t B t B Phase 3 Migrations intrapopulationnelles post selection Les deux populations echangent un certain nombre de migrants avec les cellules voisines appartenant la m me population Les densit s des deux populations sont alors mises jour en fonction de ces migrations intrapopulationnelles Nags Nas MN art la Eq 4 21 et Na N si MN st T let ou le premier terme a droite de l galit repr sente la densit de la population apres r gulation d mographique et les deux derniers termes respectivement le nombre d emigrants et le nombre d immigrants intrapopulationnels 4 3 3 1 Ordre des phases de r gulation et de migration Nous avons d cid de proc der en premier lieu la phase de r gulation d mographique avant la phase de migration intrapopulationnelle Ceci permet de mod liser de la s lection ou mortalit infantile et des migrations adultes Cependant il serait tout aussi coh rent d inverser ces deux phases mais cela n aurait qu un impact n gligeable sur les r sultats non montr s Le seul effet d une telle inversion est de l g rement ralentir l expansion d mographique de la population
235. ion interpopulationnelle est gale la comp tition intrapopulationnelle ou que la comp tition interpopulationnelle est compl te Sl Qag lt 1 cela signifie que la comp tition intrapopulationnelle est plus forte que la comp tition interpopulationnelle et donc qu un individu de la population B a un effet inhibiteur sur un individu de la population A qui est plus faible que celui exerc par un autre individu de la population A 50 Sli Qag gt 1 cela signifie que la competition interpopulationnelle est plus forte que la comp tition intrapopulationnelle et donc qu un individu de la population B a un effet inhibiteur sur un individu de la population A qui est plus fort que celui exerc par un autre individu de la population A Ce cas de figure est assez rare dans la r alit La competition entre deux populations peut tre symetrique mais elle est le plus souvent asym trique les taux de competition dans un sens ou dans l autre tant diff rents aus Ga Quatre cas differents peuvent se presenter selon les valeurs que prennent les variables K4 Kp da et Ag de ce mod le 1 Si K gt K a et Kg lt K a la population B va finalement dispara tre cause de la competition exerc e sur elle par la population A 2 Si K lt K a et Kz gt K a cas inverse au pr c dent la population A va finalement dispara tre a cause de la comp tition exerc e sur elle par la population B 3 Si K lt K a et Kz
236. ion to the present time it is easy to simulate a range expansion with 1 1 0 9 1 1 8 0 Table 3 Different Statistics Summarizing the Pattern of Molecular Diversity After Range Expansion Range Nr Expansion T Yarim 5 Yars 111 PERTE 1 3 2 8 3 0 17 9 23 7 3 4 5 3 8 27 6 401 3 T 6 1 95 36 7 62 9 a 7 0 11 7 41 7 75 1 MAN us 1 1 2 1 1 14 5 13 6 3 3 1 2 9 40 4 37 2 5 5 1 4 8 64 4 48 0 T 7 1 6 8 85 9 73 0 5 8 0 af 96 0 69 2 D P D lt 0 05 Fs PF lt 0 05 1 17 0 31 2 74 0 57 1 28 0 32 3 38 0 45 1 25 0 29 2 21 0 17 1 19 0 26 0 90 0 02 1 20 0 26 0 42 0 01 2 26 0 99 11 50 1 00 2 55 1 00 23 06 1 00 2 58 1 00 24 55 1 00 2 56 1 00 24 06 1 00 2 55 1 00 23 13 1 00 Nove The different times of expansions are T 500 1 500 2 500 3 500 and 4 000 generations ago and the different migration intensities between neighboring demes are Vin 10 and SOW Date of the onset of the range expansion T in units of mutation rate m as T 27 where T is the time of the expansion in number of generations and n 0 001 24 Table 4 Pattern of Molecular Diversity After a Spatial Expansion Ko K Size Exp T Var r S Palen oak 1000 1000 9 6 11 7 90 1 Bree 100 1000 500 7 8 8 1 73 4 Cre aioe 100 1000 100 74 8 8 60 4 DESSIN 100 1000 50 159 9 6 56 0 Eee 100 1000 10 TA 11 4 43 3 FRANS 100 100 7 0 11 7 41 7 Molecular Diversity in Spatially Expanding Populations 83 Var S D P D lt 0 05 F P F
237. ire d appliquer des analyses identiques sur d autres parties du g nome L tude d un seul locus est en effet insuffisante pour tirer des conclusions d finitives pour l ensemble des populations europ ennes Par exemple la lign e masculine pourrait avoir subi une volution diff rente de la lign e f minine La multiplication des analyses sur des locus ind pendants est une condition indispensable l tablissement de conclusions irr futables l aide des donn es g n tiques Il serait dor navant judicieux de mettre l accent sur le typage de marqueurs situ s sur d autres r gions du g nome plut t que de continuer augmenter la base de donn es mitochondriales du continent europ en dont la couverture est d j importante Le g nome mitochondrial est norm ment tudi car son haploidie et sa grande concentration dans les cellules permettent son s quen age de mani re relativement ais e mais l volution extr mement rapide des techniques de laboratoire devrait permettre dans un futur proche de disposer de bases de donn es importantes pour cette partie du g nome Le d veloppement de programmes de simulation permettant la simulation de donn es recombinantes Laval et Excoffier 2004 ouvrent de nouvelles perspectives l tude du g nome nucl aire Nous pensons avoir suffisamment explor l espace des r sultats possibles lors des recherches pr sent es dans ce travail pour bien comprendre les processus en jeu et pour p
238. issant pour cela et pour tout le reste Table des matieres 1 INTRODUCTION GENERALE nina uen nn 1 2 R ALISATION D UN LOGICIEL PERMETTANT DE SIMULER DES DONNEES G N TIQUES EN FONCTION DE PARAM TRES D MOGRAPHIQUES ET ENVIRONNEMENTAUX 5 21 INTRODUCTION irene sects ene ha ees ee eae ne ee ter 5 2 2 LE PROGRAMME SPEATOAIESS SSSR ns lente tee id tee 7 2 2 1 AFICIO aioa e Oe RT oe RRS Cre ES eS es Orne BRE een ERT Py rea ET COT nC et eee ae eee 9 2 9 CONCLUSION Sr Sn rit nd nc de nr co ed 14 3 EXPANSION SPATIALE DANS UN CONTEXTE INOCCUPE cccccsccccsecseseeceseeeesseeseseeeeeeees 15 INTRODUCTION ES de dt NL ea tee eat 15 3 2 DIVERSIT MOL CULAIRE INTRAPOPULATIONNELLE LA SUITE D UNE EXPANSION SPATIALE 16 3 2 1 PA TA CVS PE TT se a a nen wien eo Reet natn 17 3 9 SIGNATURE D UNE EXPANSION SPATIALE DANS LES DONN ES MOL CULAIRES DE TYPE SNP 29 3 3 1 Simulations de s ries de SNPs pour diff rents types d expansion 29 3 3 2 Implications pour les populations europ ennes 34 3 4 DISCUSSIONS An Ne dre to Di sina Den Po tie 36 39 CONCLUSION cnan A a a nc 38 4 EXPANSION SPATIALE DANS UN CONTEXTE OCCUPE cccccccecceeeeeeeeeseeeeeeeeeseneeeees 41 LE INTRODUCTION SR A Mn tune a tes senda sta ace adage Gare node 41 4 2 DIFFERENTS MODELES PUBLIES D EXPANSION DE POPULATIONS HUMAINES DANS UNE AIRE OCC UP EE Baie sana ecran te a al a peu seis esn care ees cue Andee nd ke Pee uu
239. iversit de Berne Berne Kozlowski J Otte M 2000 The formation of the Aurignacian Journal of Anthropological Research 56 513 524 Krings M Stone A Schmitz R W Krainitzki H Stoneking M Paabo S 1997 Neandertal DNA sequences and the origin of modern humans Cell 90 19 30 Krings M Geisert H Schmitz R W Krainitzki H Paabo S 1999 DNA sequence of the mitochondrial hypervariable region II from the neandertal type specimen Proc Natl Acad Sci U S A 96 5581 5 Krings M Capelli C Tschentscher F Geisert H Meyer S von Haeseler A Grossschmidt K Possnert G Paunovic M Paabo S 2000 A view of Neandertal genetic diversity Nat Genet 26 144 6 Laan M Paabo S 1997 Demographic history and linkage disequilibrium in human populations Nat Genet 17 435 8 203 Lahr M M Foley R A 1998 Toward a Theory of Modern Human Origins Geography Demography and Diversity in Recent Human Evolution Yearbook of Physical Anthropology 41 137 176 Landers J 1992 Reconstructing ancient populations In Jones S Martin R Pilbeam D eds The Cambridge Encyclopedia of Human Evolution Cambrige University Press London pp 402 405 Langaney A 1988 Les Hommes pass pr sent conditionnel Armand Colin Paris Langaney A Hubert Van Blyenburgh N Nadot R 1990 L histoire g n tique des mille derniers si cles et ses m canismes une revue Bull et M m de la Soc d Anthrop de Paris 1 43 56 Langaney A Roe
240. kes et al 1997 Arias 1999 Le modele de croissance logistique tient compte de cette objection puisque bien qu a terme les capacit s de soutien des n olithiques soient plus importantes que celles des chasseurs collecteurs il faut plusieurs g n rations pour que la densit effective des agriculteurs atteigne puis d passe celle des chasseurs collecteurs Les estimations des densit s n olithiques se situent g n ralement entre 7 5 fois et 50 fois celle des populations de chasseurs collecteurs Rendine et al 1986 Calafell et Bertranpetit 1993 Barbujani et al 1995 4 5 2 3 Migrations intrapopulationnelles m Ayant d velopp notre propre mod le de migration et ayant montr que c est la combinaison du produit de la densit d une population et du taux de migration Nm qui est importante et non le taux de migration lui m me section 3 2 1 nous avons fait varier ce taux de fa on ce que la palette des Nm simul s soit la plus large possible Un Nm sup rieur 1000 ne changeant plus rien la structure g n tique observ e section 3 2 1 nous n utilisons que des taux de migrations m variant de 0 04 0 2 Cet intervalle permet de faire varier Nm de 2 a 1 000 qui sont des valeurs suffisamment extr mes pour avoir une bonne repr sentativit des r sultats 4 5 2 4 Hybridation interpopulationnelle y Notre mod le d hybridation tant sp cifique a cette tude nous ne pouvons pas comparer directement l
241. km Source UNEP et la population maximum de chasseurs collecteurs dans le monde la fin du pal olithique est estim e entre 5 et 10 millions Lee et DeVore 1968b Hassan 1981 Landers 1992 M me en consid rant que la totalit de la population mondiale 10 millions d individus se trouvait en Europe la fin du pal olithique ce qui est faux on obtient par simple calcul une densit moyenne de 2 36 individus par km Ce chiffre tant largement surestim il nous parait raisonnable de ne pas consid rer de densit s moyennes de chasseurs collecteurs sup rieures a 1 0 individus par km Les estimations faites par Bindford 2001 dans son magistral ouvrage Constructing frames of references et reprises par Ray 2003 font tat de densit s de chasseurs collecteurs allant de 0 005 dans les d serts 0 35 dans les for ts tropicales de montagne Nous cartons volontairement la densit minimum estim e par Binford pour le d sert 0 005 car il s agit d une situation extr me En effet le peuplement du d sert est tr s h t rog ne et constitue un cas particulier qu il est difficile de mod liser La plupart des estimations se situent globalement entre 0 01 et 0 3 individus par km Rendine et al 1986 et Barbujani et al 1995 ont par exemple utilis des valeurs moyennes de 0 04 dans leurs simulations alors que Calafell et Bertranpetit 1993 ont estim une densit de 0 1 individus par km pour les populatio
242. l tat mute du SNP La fr quence de ce SNP dans la population sera donc gale a p n ou n est le nombre total de genes chantillonn s Cette implementation permet l conomie de la simulation de tous les locus monomorphes x n x g nes mut s parmi p n g nes chantillonn s Une mutation tir e al atoirement en fonction de la longueur totale L de l arbre Figure 9 9 Exemple du choix al atoire d un SNP rond noir en fonction de la longueur totale de l arbre de coalescence Les x g nes chantillonn s descendant du lignage sur lequel la mutation est apparue pr sentent l tat mute du SNP Cette impl mentation permet galement de simuler des SNPs sujets a un biais de recrutement ascertainment bias en anglais Ce biais de recrutement signifie que les mutations typ es dans les chantillons ne sont pas repr sentatives de celles de la population puisque les mutations les plus rares dans la population sont sous repr sent es dans les chantillons Rogers et 182 Jorde 1996 Ce biais de recrutement peut tre d trois ph nom nes Tout d abord la probabilit d observer une mutation d pend de sa fr quence dans la population De plus les SNPs dont la repr sentation est inf rieure un certain pourcentage 5 10 sont souvent cart s des analyses car jug s non informatifs Casalotti et al 1999 Underhill et al 2000 Akey et al 2002 Finalement la d tection d un SNP peut tre faite dans une s
243. l R R Jacquez G M 1991 Testing inferences about microevolutionary processes by means of spatial autocorrelation analysis Evolution 45 152 168 Sokal R R Oden N L Wilson C 1991 Genetic evidence for the spread of agriculture in Europe by demic diffusion Nature 351 143 5 Sokal R R Jacquez G M Oden N L DiGiovanni D Falsetti A B McGee E Thomson B A 1993 Genetic relationships of European populations reflect their ethnohistorical affinities Am J Phys Anthropol 91 55 70 Sokal R R Oden N L Walker J Di Giovanni D Thomson B A 1996 Historical population movements in Europe influence genetic relationships in modern samples Hum Biol 68 873 98 Spielmann K A Eder J F 1994 Hunters and Farmers then and now Annu Rev Anthropol 23 303 323 208 Steele J Adams J M Sluckin T 1998 Modeling Paleoindian dispersals World Archeology 30 286 305 Stefan M Stefanescu G Gavrila L Terrenato L Jobling M A Malaspina P Novelletto A 2001 Y chromosome analysis reveals a sharp genetic boundary in the Carpathian region Eur J Hum Genet 9 27 33 Stringer C 1989 The Origin of Early Moden Humans a Comparison of thr European and non European Evidence In Mellars P Stringer C eds The Human Revolution Biological perspectives in the Origins of Modern Humans Princeton University Press Princeton pp 233 244 Stringer C Grun R 1991 Palaeoanthropology Time for the last Neanderthals Nature 351 701 2
244. l Research University of Cambridge Landers J 1992 Reconstructing ancient populations In The Cambridge Encyclopedia of Human Evolution ed S Jones R Martin amp D Pilbeam pp 402 405 London Cambrige University Press Lev Yadun S Gopher A amp Abbo S 2000 Archaeology The cradle of agriculture Science 288 1602 3 Mazuri de Keroualin K 2003 Gen se et diffusion de l agriculture en Europe agriculteurs chasseurs pasteurs Paris Errance Menozzi P Piazza amp Cavalli Sforza L 1978 Synthetic maps of human gene frequencies in Europeans Science 201 786 92 Milinkovitch M C Monteyne D Gibbs J P Fritts T H Tapia W Snell H L Tiedemann R Caccone A amp Powell J R 2004 Genetic analysis of a successful repatriation programme giant Galapagos tortoises Proc R Soc Lond B Biol Sci 271 341 345 Nordborg M 2001 Coalescent Theory In Handbook of Statistical Genetics ed D Balding M Bishop amp C Cannings pp 179 212 New York John Wiley amp Sons Ltd Pennington R 2001 Hunter gatherer demography In Hunter gatherers an interdisciplinary perspective ed C Panter Brick R H Layton amp P Rowley Conwy pp 170 204 Cambridge University Press Pereira L Dupanloup l Rosser Z H Jobling M A amp Barbujani G 2001 Y chromosome mismatch distributions in Europe Mol Biol Evol 18 1259 71 Price T D 2000 Europe s first farmers Cambridge Cambridge University Pre
245. le en effet tres improbable qu un mouvement de population se soit fait depuis le Proche Orient jusque dans les r gions p riph riques de l Europe Pinhasi et al 2000 Zvelebil 2000 La diffusion des techniques agropastorales s est faite par une succession d v nements d acculturation dans certaines r gions et de remplacement de populations dans d autres Mazuri de Keroualin 2001 Gallay 2004 L importance du N olithique sur la structure g n tique europ enne actuelle d pend principalement de son mode de diffusion Th oriquement les donn es g n tiques devraient donc permettre de savoir lequel de ces deux types d v nements acculturation ou remplacement a ete le plus important et d estimer ainsi l influence exacte du N olithique dans le patrimoine g n tique europ en Cependant la contribution g n tique des premiers agriculteurs au patrimoine europ en 119 actuel est tres controvers e et d pend fortement du type de syst me tudi ainsi que du type de m thodologie utilis e Richards et al 1996 Cavalli Sforza et Minch 1997 Richards et al 1998 Sykes 1999 Richards et al 2000 Semino et al 2000a Barbujani et Bertorelle 2001 Torroni et al 2001 Barbujani et Dupanloup 2002 Chikhi et al 2002 Richards 2003 Actuellement les estimations les plus contradictoires font tat soit d une contribution n olithique proche mais sup rieure a 50 Barbujani et Dupanloup 2002 Chikhi 2002 soit d une
246. les environnements favorables la population B son avantage comp titif est complet sur la population A ax 1 tandis que dans ces m mes milieux les individus A n exercent pas d influence sur les individus B dag 0 Cette hypoth se est assez grossi re mais elle para t raisonnable et permet de mod liser de fa on satisfaisante le 51 remplacement d Homo Neandertalensis par les premiers Homo sapiens sapiens puis le remplacement des chasseurs collecteurs pal olithiques par les agriculteurs n olithiques Le mod le taux de competition fixe peut s crire comme Nota Na tar Ka Nas Nos Eq 4 10 K B N5 No ta Net 1 lz 500 400 300 200 100 0 50 100 150 Temps en g n rations 500 400 300 Densit 200 100 Ne 0 T T 0 50 100 150 Temps en g n rations Figure 4 4 Evolution des densit s des populations A trait gris et B trait noir au cours du temps selon le mod le 1 Lotka Volterra avec taux de comp tition fix s comme dg O et aag 1 a Disparition de la population A car Kg gt Ka b Equilibre stable entre les deux populations car Kg lt Ka Dans cette application pr cise les cas g n raux 2 et 3 du mod le de Lotka Volterra voir page 51 sont impossibles car Kg n est jamais n gatif Dans tous les cas la population B qui colonise une cellule s y tablit de fa on durable cas 1 ou 4 La population A di
247. loci to simulate It corresponds to the sequence length for DNA Mutation rate per generation for all loci taken together Specific to DNA Transition bias percentage of substitutions that are transitions ETS Gamma a amount of heterogeneity in mutation rates along the sequence according to either a discrete or continuous gamma distribution Number of categories for DNA mutation variation Specific to Microsatellite 12 Range constraint minimum and maximum size for microsatellite 4 2 3 Genetic data Different types of molecular data could be generated RFLP DNA Microsatellites and Standard each with its own specificities 168 SPLATCHE User Manual RFLP data Only a pure 2 allele model is implemented Several fully linked RFLP loci can be simulated assuming a homogeneous mutational process over all loci A finite sites model is used and mutations can hit the same site several times switching the RFLP site on and off We thus assume that there is the same probability for a site loss or for a site gain Microsatellite data We have implemented a pure stepwise mutation model SMM with or without constraint on the total size of the microsatellite Several fully linked microsatellite loci can be simulated under the same mutation model constraints The output for each loci 1s listed as a number of repeat having started arbitrarily at 10 000 repeats The number of repeats for each gene should thus be centered around
248. lteurs chasseurs pasteurs Errance Paris Mellars P 1998 The fate of the Neanderthals Nature 395 539 40 Mellars P A 1992 Archaeology and the population dispersal hypothesis of modern human origins in Europe Philos Trans R Soc Lond B Biol Sci 337 225 34 Menozzi P Piazza A Cavalli Sforza L 1978 Synthetic maps of human gene frequencies in Europeans Science 201 786 92 Mogentale Profizi N Chollet L Stevanovitch A Dubut V Poggi C Pradie M P Spadoni J L Gilles A Beraud Colomb E 2001 Mitochondrial DNA sequence diversity in two groups of Italian Veneto speakers from Veneto Ann Hum Genet 65 153 66 Morton N E 1977 Isolation by distance in human populations Ann Hum Genet 40 361 5 204 Morton N E 1982 Estimation of demographic parameters from isolation by distance Hum Hered 32 37 41 Mosimann J F Martin P S 1975 Simulating overkill by paleoindians American Scientist 63 304 313 Mountain J L Hebert J M Bhattacharyya S Underhill P A Ottolenghi C Gadgil M Cavalli Sforza L L 1995 Demographic history of India and mtDNA sequence diversity Am J Hum Genet 56 979 92 Mourant A E Kopec A C Domaniewska Sobczak K 1976 The distribution of the human blood groups and others polymorphisms sd edition Oxford University Press London Nasidze Stoneking M 2001 Mitochondrial DNA variation and language replacements in the Caucasus Proc R Soc Lond B Biol Sci 268 1197 206 Neuensch
249. m SIMCOAL Excoffier Novembre and Schneider 2000 allowing it to take into account the dynamic nature of deme densities and migration rates between adjacent demes Starting at the present generation we simulate the genealogy of genes sampled in a deme located for con venience at one of the two previously specified positions in the grid Because we are interested in describing intra deme diversity we stress the fact that samples of genes are always drawn from a single deme At each generation and going backward in time genes can either move to a different deme or coalesce if they are not the single gene lineage in their deme At generation f the probability of emigration of a gene from deme j to deme k is computed according to the information recorded in the database created during the demographic simulation step and is equal to I N After migration the probability of a coalescence event in deme j depends both on the number of genes i present in deme j and on its density at time as i G 1 2N For each generation we first implement a coalescence phase followed by a migration phase As usually assumed in analytical treatments a single coalescent event is allowed per deme per generation In the case where the deme size is not much larger than the number of gene lineages i present in that deme this strategy leads to slightly longer coalescence times up to 7 generations than if several coalescent events were allowed per gener
250. ment moindre que celle de Nagem 0 05 0 04 o 0 03 O Cc D 5 oO O 0 02 LL be 0 01 ss 0 EPR ITT MA 022229 9002299999998 401 411 421 431 441 451 Temps en g n rations Figure 4 16 Distribution des coalescences pendant les g n rations qui pr c dent le goulet n olithique t 400 pour Nccm 10 gris et 100 noirs avec Nacm 1 000 identique dans les deux cas 4 5 3 3 Influence des taux de croissance rag et rcc 0 2 Fr quence 0 2 4 6 8 10 12 14 16 18 20 Temps en g n rations Figure 4 17 Distributions mismatch obtenues avec Nccm 10 et Nacm 1 000 et differents taux de croissances rac 0 1 trait noir et 0 5 trait gris rcc 0 1 cercles pleins et 0 5 cercles vides Lorsque le taux de croissance n olithique rag est grand alors la colonisation du monde se fait plus rapidement Ray 2003 p 190 ce qui implique une r duction de l homozygotie attendue 19 puisque la probabilite de coalescence des lignages est plus faible Cet effet est cependant nettement moindre que celui de Nagm comme le montre la Figure 4 17 Il avait d j t constat qu une r expansion rapide apres un goulet d tranglement diminue l effet de ce dernier puisque les alleles n ont pas le temps de dispara tre par d rive Chakraborty 1975 L effet de rcc est quant lui n gligeable Figure 4 17 4 5 3 4 Influence du goulet d etranglement Nous avons galeme
251. munaut s n olithiques et m solithiques a t la plus longue notamment cause des fortes densit s m solithiques et pourtant la cohabitation n y a jamais exc d 1 000 ans Arias 1999 Par ailleurs P Y Nicod cite des p riodes de 71 quelques si cles au maximum pour avoir un changement total d conomie dans une zone donn e communication personnelle et il para t difficile d admettre une longue persistance des soci t s de chasseurs parall lement au d veloppement des communaut s agricoles Gallay 1994 Figure 4 12 Figure illustrant approximativement les r gions mentionn es dans la Table 4 2 P riode Zone G ographique maximum de ae le num ro correspond la Figure 4 11 cohabitation marerence en ann es 1 Anatolie 2 700 Mazuri de Keroualin 2001 2 Grece 1000 Mazuri de Keroualin 2001 3 Adriatique 1000 Mazuri de Keroualin 2001 4 Balkans 900 Mazuri de Keroualin 2001 5 Nord de la Mer noire 1000 Mazuri de Keroualin 2001 6 Carpates 1100 Mazuri de Keroualin 2001 7 R gion Elbe Vistule 1 000 Mazuri de Keroualin 2001 8 Alpes du Nord et Jura 300 700 Gallay 1994 9 R gion Elbe Rhin 500 Mazuri de Keroualin 2001 10 Sud de la Scandinavie 1000 Arias 1999 11 Mer du nord Pays Bas Allemagne 1000 Arias 1999 12 France Nord Est Benelux Suisse 700 Mazuri de Keroualin 2001 13 France c te atlantique 400 900 Arias 1999 14 Franche Compte 200 Jeunesse 1998 15 M diterran e occidentale 900 Ma
252. n Nem gt N m peut s expliquer soit par une plus grande taille efficace N soit par un taux de migration m sup rieur de la lign e f minine deux possibilit s qui ne sont pas 1 L effectif moyen des chantillons tudi s par Semino et al 2000 est de 40 individus et le nombre moyen de sites polymorphes par chantillon est gal 10 7 2 5 Comme nous simulons une seule population la fois il importe que le nombre de SNPs que nous g n rons corresponde au nombre de locus effectivement polymorphes dans les chantillons et non aux 22 SNPs analys s pour l ensemble des populations 36 exclusives Le premier cas N gt Na est compatible avec une forte polygynie masculine peu d hommes ayant beaucoup d enfants pouvant r sulter d une polygamie non officielle importante pour les males europ ens actuels Le second cas soit un taux de migration des femmes plus grand que celui des hommes m gt mp est une hypoth se qui a d j t propos e pour les populations humaines Poloni et al 1997 Seielstad et al 1998 Oota et al 2002 Ce taux de migration f minin sup rieur celui des hommes peut tre expliqu par la patrilocalit qui a vraisemblablement exist dans les populations europ ennes post n olithiques Bentley ef al 2002 Bentley et al 2003 La transition n olithique aurait donc t le moment partir duquel la d mographie des lign es f minines et masculines se serait diff renci e
253. n Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeological Research University of Cambridge Cambridge pp 119 129 Barbujani G Bertorelle G 2001 Genetics and the population history of Europe Proc Natl Acad Sci USA 98 22 5 Barbujani G Dupanloup 2002 DNA Variation in Europe estimating the demographic impact of Neolithic dispersals In Bellwood P Renfrew C eds Examining the farming language dispersal hypothesis McDonald Institute Monographs Cambrige pp 421 431 Beaumont M Barratt E M Gottelli D Kitchener A C Daniels M J Pritchard J K Bruford M W 2001 Genetic diversity and introgression in the Scottish wildcat Mol Ecol 10 319 36 Beaumont M Rannala B 2004 The Bayesian revolution in genetics Nat Reviews Genet 5 251 261 Beaumont M A Zhang W Balding D J 2002 Approximate Bayesian Computation in Population Genetics Genetics 162 2025 2035 Begon M Harper J L Townsend C R 1996 Ecology Blackwell Science Oxford Belledi M Poloni E S Casalotti R Conterio F Mikerezi l Tagliavini J Excoffier L 2000 Maternal and paternal lineages in Albania and the genetic structure of Indo European populations Eur J Hum Genet 8 480 6 Bellwood P 2001 Early Agriculturalist Population Annu Rev Anthropo 30 181 207 Belovsky G E 1988 An optimal foraging based model of hunter gatherer population dynamics Journal of an
254. n rale dans des cadres temporels et g ographiques variables afin d tudier des processus d mographiques complexes Son int r t r side dans sa capacit traduire des donn es cologiques en donn es g n tiques SPLATCHE est donc un programme puissant qui permet de g n rer de nombreux types de donn es g n tiques en incorporant de multiples param tres d mographiques et environnementaux La r alisation de ce logiciel a t effectu e dans le cadre d un vaste projet de recherche dont les ramifications sont nombreuses Il existe actuellement de nombreuses extensions de SPLATCHE dont la version volutive a gard le nom de FRICTION et leur nombre devrait encore augmenter dans le futur Nous mentionnerons certains des d veloppements en cours lorsque nous parlerons des perspectives de ce travail chapitre 8 L ANNEXE 3 pr sentera une version d riv e de SPLATCHE permettant la simulation de deux populations voluant dans le m me environnement Ce chapitre 2 pr sente sous la forme d un article publi dans Molecular Ecology Notes au d but 2004 section 2 2 les diverses possibilit s offertes par SPLATCHE La m thodologie sous jacente a SPLATCHE ainsi que les donn es techniques sont pr sent es dans l ANNEXE 2 Le manuel d utilisation du logiciel constitue ANNEXE 1 et les possibilit s de repr sentation graphique des genealogies de genes l ANNEXE 4 2 2 Le Programme SPLATCHE Notre article publi dans Mol
255. n a coalescent framework to generate backward in time the genealogy and the diversity of genes sampled at one or several locations see Fig 1 These two phases are enclosed in two separate modules of the program The simulation of the first demographic phase occurs in a two dimensional stepping stone 2DSS Kimura amp Weiss 1964 which is defined as an array of regularly spaced sub populations or demes Each deme can exchange migrants with its four neighbours Information on local environ ments such as vegetation or topographic maps which can be imported from a Geographical Information System cis packagel is translated into two characteristics attached to each deme a carrying capacity K and a friction value F K represents here the maximum number of genes or haploid individuals that can be sustained by local resources and F expresses the relative difficulty in moving through a deme using relative values ranging from 0 lowest friction no barrier to migration to 1 highest friction complete barrier to migration Arbitrary levels of environmental heterogeneity can be considered For instance user defined maps can be completely homogeneous in term of K and F but they can also reflect a more realistic world taking into account particular landscape features such as rivers deserts or mountains These features can then be assigned specific F values to reflect their potential roles as corridors 140 PROGRAM NOTE Demographic
256. n auraient pas t capables de survivre aux variations climatiques extr mement rapides cette p riode Bocquet Appel et Demars 2000b Van Andel 2000 Stringer et Davies 2001 Hublin 2002 Si les changes culturels semblent avoir t relativement restreints entre les deux groupes except dans certaines r gions Klein 2003 la question de possibles changes g n tiques reste encore d actualit Hublin 1988 Duarte et al 1999 Le s quen age de fragments d ADN ancien tir s d os de N andertaliens peut potentiellement apporter un l ment de r ponse ce sujet A ce jour de courtes portions d ADN mitochondrial de 8 individus n andertaliens ont pu tre s quenc es Krings et al 1997 Krings et al 1999 Ovchinnikov et al 2000 Schmitz ef al 2002 Serre et al 2004 Leur comparaison avec les s quences d Hommes modernes actuels plus de 4 000 chantillons Handt et al 1998 a montr une tr s grande diff renciation Krings et al 2000 Scholz et al 2000 de m me que leur comparaison avec des s quences d H s sapiens de type Cro Magnon Caramelli et al 2003 Serre et al 2004 Cette grande diff renciation a t interpr t e comme la marque d une hybridation faible sinon nulle entre les deux populations Richards et al 1996 Sykes 1999 Schillaci et Froehlich 2001 Cette derni re affirmation a cependant t contest e par Wall 2000 et Nordborg 1998 qui ont estim qu il est impossible de tirer u
257. n de l abandon d une aire par des individus engendre en effet une probl matique tres diff rente de celle de la colonisation d une aire vide Il serait galement tr s int ressant de conna tre l influence que pourrait avoir ces ph nom nes de contractions et de r expansion glaciaires sur les r sultats pr sent s dans ce travail 147 8 Conclusion g n rale et perspectives Nous aimerions dans un premier temps souligner les avantages apport s par la m thodologie d velopp e dans cette th se et de mani re plus g n rale dans le cadre du projet Friction Nous avons montr a plusieurs reprises que l approche que nous proposons permet de g n rer une certaine diversit mol culaire selon diff rentes hypoth ses alternatives de peuplements pr historiques Ces signatures sont obtenues lors de situations tr s complexes qui peuvent difficilement tre trait es analytiquement C est le cas par exemple de processus prenant place dans des populations subdivis es ou incorporant des contraintes g ographiques et environnementales Ces signatures g n tiques th oriques peuvent potentiellement orienter les recherches futures en indiquant quels sont les marqueurs ainsi que le nombre requis qui sont les plus aptes pour r pondre une interrogation pr cise Notre m thodologie permet ainsi l laboration de strategies de recherche L approche pr sent e dans ce travail est d autant plus int ressante que la puissance informati
258. n fonction de la taille des d mes que nous utilisons dans notre travail 50 km de c t au lieu de 156 km pour Rendine et al le nombre de migrants interpopulationnels est d environ 150 par deme et par simulation II serait interessant de savoir quels seraient les resultats observes en cas d acculturation plus faible iv La disparition de la population CC est effective si la taille des cellules utilis es est identique celle de Rendine et al 25 000 km En revanche avec des cellules dix fois plus petites comme celles que nous utilisons dans ce travail 2 500 km la population CC ne dispara t pas ce qui ne correspond pas la r alit v Certaines incoh rences existent dans la description du mod le et de certaines valeurs utilis es par rapport aux quations et aux tables pr sent es A titre d exemple nous mentionnerons les equations utilis es par Rendine ef al pour d crire leur mod le CC t 1 CC CC CC AG Noe Nocta Noci loc He FA yN N Eq 4 3 Nic Na Nac Er lieNac 1M K i he qui peuvent tre reformul es comme Ne N a Fre Nic FFE an Vr oN ce Eq 4 4 Ni N Git ca ioi 17 e Wooo 6 Le dernier terme des quations 4 4 correspond la croissance ou la d croissance nette d individus a cause de l acculturation On se rend alors compte que le nombre d individus qui quittent par acculturation la population CC n est jamais le m me que le nombre d individus qui arri
259. narios E and D corresponding to larger carrying capacities of Neanderthals would be compatible with a larger amount of admixture between the two species 0 03 admixture events per deme which is understandable given the longer cohabitation times under these scenarios 21 37 generations than under scenarios A C and F 7 12 generations These estimates can be translated into a maximum number of interbreeding events having occurred over all Europe during the whole replacement process of Neanderthals by modern humans as reported in Table 1 We find that depending on the scenario these maximum estimates range between 34 scenario B and 120 scenario D admixture events over the whole of Europe which are extremely low values given the fact that the two populations coexisted for more than 12 000 years in that region 102 Absence of admixture between modern humans and Neanderthals Discussion Our simulations show that the mitochondrial evidence in favor of no or very little interbreeding between Neanderthals and modern human is much stronger than previously realized as it was thought that the current absence of Neanderthal mtDNA genes may have been compatible with a very important contribution of Neanderthal genes up to 25 in the gene pool of the early Cro Magnon populations However this estimate was based on a very implausible model of evolution assuming no population subdivision constant size and a single and instantaneou
260. nce jouent un r le pr pond rant la fois dans la vitesse d une expansion Nichols et Hewitt 1994 et dans la diffusion des g nomes En effet les lignages transport s par ces migrations vont contribuer plus fortement au patrimoine g n tique final puisque leur arriv e dans des zones vierges va leur permettre une diffusion tr s rapide Hewitt 1996 Ces mouvements longue distance ont certainement t importants chez l Homme Sokal 1991b Langaney et al 1992 La prise en compte de l h t rog n it de la v g tation ainsi que de la topologie du terrain permettrait sans doute de r v ler des routes de migration pr f rentielles et leur influence sur la structure g n tique finale Cependant l utilisation d un environnement h t rog ne par exemple en utilisant des cartes de pal ov g tation Adams et Faure 1997 Ray et Adams 2001 reste d licat car il est n cessaire d attribuer des valeurs de capacit de soutien tous les types de v g tation Ray 2003 pp 77 80 Ray et al 2004 Les fluctuations du climat au cours du temps impliquent des transformations dans les types de v g tation ainsi que des variations du niveau des mers Non seulement ces changements modifient l aire de r partition des esp ces et l accessibilit certaines regions comme par exemple l acc s aux Am riques par le D troit de Bering Fiedel 1992 Crawford 1998 mais elles peuvent galement catalyser l apparition d in
261. nces in the Mediterranean region Hum Biol 71 399 415 Simoni L Calafell F Pettener D Bertranpetit J Barbujani G 2000 Geographic patterns of mtDNA diversity in Europe Am J Hum Genet 66 262 78 Skaletsky H Kuroda Kawaguchi T Minx P J Cordum H S Hillier L Brown L G Repping S et al 2003 The male specific region of the human Y chromosome is a mosaic of discrete sequence classes Nature 423 825 37 Slatkin M 1991 Inbreeding coefficients and coalescence times Genet Res Camb 58 167 175 Slatkin M Hudson R R 1991 Pairwise comparisons of mitochondrial DNA sequences in stable and exponentially growing populations Genetics 129 555 62 Slatkin M 1995 A measure of population subdivision based on microsatellite allele frequencies Genetics 139 457 462 Sokal R R Menozzi P 1982 Spatial Autocorrelations of HLA Frequencies in Europe Support Demic Diffustion of Early Farmers American Naturalist 119 1 17 Sokal R R 1988 Genetic geographic and linguistic distances in Europe Proceedings of the National Academy of Science 85 1722 1726 Sokal R R Oden N L Thomson B A 1988 Genetic changes across language boundaries in Europe American Journal of Physical Anthropology 76 337 61 Sokal R R 1991a Ancient movement patterns determine modern genetic variances in Europe Human Biology 63 589 606 Sokal R R 1991b The Continental Population Structure of Europe Annual Review of Anthropology 20 119 140 Soka
262. nchez Maza A 2001 DNA sequence variability of IGHG3 alleles associated to the main G3m haplotypes in human populations European Journal of Human Genetics 9 765 777 de Knijff P Kayser M Caglia A Corach D Fretwell N Gehrig C Graziosi G et al 1997 Chromosome Y microsatellites population genetic and evolutionary aspects nt J Legal Med 110 134 49 de Menocal P B 2001 Cultural responses to climate change during the late Holocene Science 292 667 73 Delghandi M Utsi E Krauss S 1998 Saami mitochondrial DNA reveals deep maternal lineage clusters Hum Hered 48 108 14 Di Rienzo A Wilson A C 1991 Branching pattern in the evolutionary tree for human mitochondrial DNA Proc Natl Acad Sci U S A 88 1597 1601 Diamond J Bellwood P 2003 Farmers and their languages the first expansions Science 300 597 603 Djindjian F Koslowski J Otte M 1999 Le Paleolithique sup rieur en Europe Armand Colin Paris Donnelly P Tavar S 1995 Coalescents and genealogical structure under neutrality Annu Rev Genet 29 401 421 Duarte C Mauricio J Pettitt P B Souto P Trinkaus E van der Plicht H Zilhao J 1999 The early Upper Paleolithic human skeleton from the Abrigo do Lagar Velho Portugal and modern human emergence in Iberia Proc Natl Acad Sci U S A 96 7604 9 Dugoujon J M Hazout S Loirat F Mourrieras B Crouau Roy B Sanchez Mazas A 2004 GM haplotype diversity of 82 populations over the wo
263. nd Neolithic populations The spatial expansion of modern humans Homo sapiens sapiens in Europe as well as the Neolithic transition were simulated using a modified version of the SPLATCHE program Currat et al 2004 as follows Digital model A digital model of Europe and the Near East has been created by dividing the continental surface in demes arranged on a grid Each deme covers a surface of 50 by 50 km or 2 500 km2 so that the modelled area has slightly more than 7 000 demes Range expansions The colonization of Europe is assumed to have occurred in two phases The first Paleolithic wave is assumed to have started some 1 600 generations ago 40 000 years ago with a generation time of 25 years from the Near East point P on Figure 1 This point has been chosen arbitrarily as the source of modern humans having colonized Europe is not known exactly Djindjian et al 1999 Kozlowski amp Otte 2000 A second colonization wave is assumed to have started from Anatolia point N on Figure 1 Lev Yadun et al 2000 some 400 generations ago corresponding to 10 000 years ago At this time the individuals occupying this deme are assumed to become farmers and are moved in a new layer of 7 000 demes denoted as farmer or F demes and superimposed on the layer of hunter gatherers or HG layer Demographic regulation The demography of more than 14 000 demes representing Europe half in HG and half in F layers is thus simulated during 1 600 generations
264. ndants obtenus par la simulation d une population stationnaire A et par celle d une population ayant pass pat une expansion d mographique importante B Figure modifi e a partir de Harpending et al 1998 181 Annexe 2 2 3 G n ration de SNPs Nous avons modifi la version de SPLATCHE mise la disposition du public et pr sent e dans le chapitre 2 afin de permettre la simulation de donn es de type SNP dont l utilisation est de plus en plus fr quente Afin d conomiser un temps de calcul important l impl mentation permettant la cr ation des SNPs est diff rente de celle qui permet la cr ation des autres types de donn es Annexe 2 2 2 En effet les SNPs se diff rencient des autres donn es par le fait que tous les locus sont polymorphes Afin d viter de simuler un grand nombre de locus et de ne garder que ceux qui sont polymorphes nous avons opt pour une autre strat gie Une fois l arbre de coalescence construit selon la description faite dans l Annexe 2 2 1 la longueur totale L en g n rations des branches qui composent l arbre est compt e Un nombre x situ dans l intervalle 0 L est ensuite tir al atoirement En fonction de x une branche de l arbre est choisie et une mutation y est superpos e Plus une branche est longue et plus la probabilit qu une mutation y apparaisse est grande Les p genes chantillonn s issus de lignages descendant de celui sur lequel se trouve la mutation pr senteront ainsi
265. ne conclusion a propos du taux d hybridation entre les deux esp ces a partir d un seul locus Nordborg 1998 a d ailleurs calcul que m me si les Neandertaliens composaient 25 du patrimoine g n tique des premiers Hommes modernes europ ens il existe 50 de chances pour que ces lignages aient t perdus par d rive g n tique en pres de 40 000 ans voir aussi Hagelberg 2003 et Relethford 2001 R cemment avec un mod le plus r aliste que celui de Nordborg 1998 incluant une croissance d mographique des premiers Hommes modernes Serre et al 2004 ont estim la contribution n andertali ne maximum 25 mais dont la valeur exacte est vraisemblablement faible et d pend des param tres de l expansion Les calculs de Nordborg 1998 et de Serre et al 2004 sont effectu s sur la base d un mod le de populations non subdivis es et statiques d un point de vue spatial Dans l article pr sent dans ce chapitre section 5 2 1 nous avons simul le remplacement des N andertaliens par Homo sapiens sapiens laide de la version modifi e de SPLATCHE et du mod le d mographique pr sent dans le chapitre 4 La diffusion des Hommes modernes est simul e pendant 1 600 g n rations environ 40 000 ans dans une matrice de d mes homog nes repr sentant l Europe a partir d un deme source situ au Proche Orient Une seconde matrice de d mes superpos e la premi re est pr alablement peupl e par des N andertaliens en
266. ne genealogy with mutations this information is obtained from the previous demo graphic simulation round see Fig 1 The population size N of a given deme at time f is used to compute the prob ability of coalescence for every pair of genes found in that deme at time t The number of emigrants forward in time from deme to deme j at time t is used to compute the back ward probability backward in time for a gene in deme j to migrate into deme i SPLATCHE can generate restric tion fragment length polymorphism short tandem repeat microsatellite data DNA sequence data and mere allele frequencies The number and the spatial location of genes that must be simulated are specified in an input file In addition to text output in the ARLEQUIN format Schneider et al 2000 several graphical outputs are also available after a demographic simulation deme size and number of migrants received from neighbouring demes through time times of first colonization Carrying capacities and frictions assigned to each deme can also be visualized as grayscale or colour bitmaps They can alternatively be saved as ascii raster files to be imported into any GIs program An innovative feature of SPLATCHE is the visualization of the spatial components of the coalescence trees which can be translated into three different kinds of bitmaps i the spatial distribution of the density of coalescence events as shown for example in Ray ef al 2003 ii the gene
267. ne pool it could have been lost through genetic drift Recently several attempts were made at circumventing the drift problem by the direct sequencing of modern human fossils contemporary with the last Neanderthals Inferred Cro Magnon sequences were indeed found very similar to those of current Europeans with no trace of Neanderthal influence even though contamination from modern DNA could not be completely excluded Under a simple model of instantaneous mixing of Neanderthals and modern humans a Neanderthal contribution larger than 25 to the modern gene pool could be excluded but smaller and still significant contributions were found possible Therefore the problem of the relationships between Neanderthals and modern humans remains fully open In order to address this issue we have developed a more realistic modeling of the range expansion of modern humans in Europe assumed to be already inhabited by Neanderthals As will be shown below we can explain the replacement of Neanderthals by modern humans by a simple competition model between the two species with a 2 5 4 fold better exploitation of local resources by modern humans as compared to Neanderthals Moreover the simulation framework with parameters calibrated by the known duration of the replacement process about 12 500 years allows us to estimate the maximum number of fertile admixtures events between the two species compatible with the observed absence of
268. novations culturelles ou techniques en cr ant les conditions favorables leur closion Par exemple pendant les p riodes froides le Moyen Orient devient une sorte de cul de sac o les populations humaines et animales du nord de l Afrique et celles de l Europe peuvent se rencontrer Ces conditions climatiques ont peut tre favoris la r union des Pendant les p riodes climatiques froides la limite de la calotte polaire europ enne est tr s basse obligeant les populations se d placer vers le sud Le Sahara tant son extension maximum pendant ces m mes p riodes froides les populations nord africaines vont quant elles se d placer vers le Moyen Orient Sherratt 1997 Lahr et Foley 1998 151 diff rents facteurs conomiques et culturels qui ont permis a plusieurs reprises l mergence de nouvelles technologies dans cette region notamment les premi res composantes du N olithique europ en Sherratt 1997 La simulation de la recombinaison entre locus diploides permettrait d tudier l effet de diff rents v nements d mographiques sur le d s quilibre de liaison Cet aspect offre en effet des perspectives prometteuses Kaessmann 2002 a par exemple montr que les derni res populations de chasseurs collecteurs europ ens Saamis et Evenkis pr sentent un d s quilibre de liaison plus fort que celui des autres populations europ ennes Notre approche peut videmment tre utilis e dans le cad
269. ns m solithiques de la p ninsule ib rique N olithique Kac Les densit s des populations agropastorales actuelles vont de 3 individus par km au Laos ou au Zimbabwe 300 en Nouvelle Guin e Zvelebil 2000 Il s agit nouveau d estimations locales difficilement applicables l ensemble du continent europ en A titre de r f rence au 15 me si cle l Europe tait peupl e en moyenne par 1 70 individus par km Zvelebil 2000 Pour de nombreux auteurs les techniques agricoles ont permis d atteindre des densit s humaines beaucoup plus lev es au N olithique Hassan 1979 1981 Langaney et al 1990 Landers 1992 Langaney et al 1992 Pennington 2001 Cavalli Sforza et Feldman 2003 Gallay 2004 d une part parce qu une plus grande quantit de nourriture a pu tre produite sur une surface quivalente et d autre part parce que le surplus de nourriture a pu tre stock gr ce au mode de vie s dentaire adopt par les populations agropastorales Diamond et Bellwood 2003 Cependant pour d autres auteurs Zvelebil et Zvelebil 1988 Fix 1996 Zvelebil 2000 la diff rence entre les densit s des communaut s pr datrices et productrices n est pas si grande Dans certaines r gions comme la c te atlantique ou la Scandinavie les densit s des populations de la fin du m solithique sont en tout cas aussi http www unep org 70 importantes que celles des premiers agriculteurs de la m me r gion Jac
270. ns voisines emmenant leurs nouvelles technologies avec eux Ils auraient ainsi colonis l Europe enti re par migrations successives de proche en proche Ce mod le peut tre d crit comme une expansion spatiale et d mographique de la population n olithique l chelle continentale avec une contribution minime sinon nulle des populations de chasseurs collecteurs autochtones D un point de vue g n tique ce d placement de population aurait entra n la diffusion des g nes des premiers agriculteurs proche orientaux dans toute l Europe La proportion des g nes proche orientaux diminuerait progressivement en direction du nord ouest de l Europe au fur et mesure de lincorporation de g nes indigenes Dans le cas le plus extr me d un remplacement complet des chasseurs collecteurs leurs g nes auraient t effac s du patrimoine g n tique europ en A l oppos le processus d acculturation n entraine pas de mouvement de g nes mais implique seulement la transmission des connaissances agropastorales de proche en proche Selon ce second mod le la structure g n tique pr n olithique n aurait peu ou pas t influenc e par la diffusion des techniques agropastorales Les recherches arch ologiques ont montr qu aucun de ces deux mod les lui seul ne permet d expliquer la diffusion du N olithique sur l ensemble du continent europ en Zvelebil 1986 Arias 1999 Gronenborg 1999 Mazuri de Keroualin 2001 Il semb
271. nt tudi l effet de la taille du goulet d tranglement bottleneck en anglais sur les g n alogies Les deux aspects du goulet que nous tudions ici sont sa taille soit le nombre d individus qui le constitue ii sa position par rapport au lieu d chantillonnage Dans les simulations qui suivent nous faisons l hypoth se que N cm est grand 1 000 et que Nccm est petit 10 Les autres param tres utilis s sont rcc 0 3 rac 0 5 et m 0 1 Taille du goulet Plus le nombre d individus qui passent par le goulet d tranglement est grand et moins lhomozygotie attendue est importante Figure 4 18 puisque les coalescences de la p riode C7 sont moins nombreuses Cette r duction est tres importante lorsque l chantillonnage est fait l endroit m me du lieu d origine de l expansion n olithique L pour local mais elle est nettement moindre lorsque l chantillonnage est fait en p riph rie de celle ci P En effet lorsque l echantillonnage a lieu en p riph rie de nombreuses coalescences se passent avant d arriver au goulet d tranglement voir ci dessous et la taille de ce dernier a donc une importance moindre Localisation du goulet La localisation d un chantillon par rapport au lieu de l expansion de la population peut avoir une certaine influence sur la signature g n tique En effet des barri res g ographiques telles que des montagnes ou des c tes peuvent avoir un effet sur la dispersion des g ne
272. nt e voir par ex Ammerman et Cavalli Sforza 1984 Renfrew 2000 Barbujani et Bertorelle 2001 Il est d ailleurs impossible d tudier le peuplement du continent europ en sans prendre en consid ration les r gions asiatiques qui le bordent notamment le Proche Orient tellement leurs histoires sont intimement li es C est en effet depuis le sud ouest de l Asie que les principaux flux migratoires humains se sont faits en direction du continent europ en Les innombrables fouilles arch ologiques men es soit en Europe soit au Proche Orient ont permis la reconstitution plus ou moins pr cise de l histoire de l humanit dans ces r gions par ex Renfrew 1989 Mellars 1992 Gallay 1994 Whittle 1996 Djindjian et al 1999 Mazuri de Keroualin 2003 Malgr cette abondance d informations il demeure encore norm ment d inconnues au sujet de l histoire de nos anc tres sur le continent europ en En effet les restes arch ologiques sont peu nombreux pour certaines p riodes ou plus difficiles interpr ter et il existe une grande h t rog n it dans la couverture du continent Hazelwood et Steele 2003 De plus les techniques de datation ne permettent pas toujours des estimations pr cises et l intervalle de confiance autour de ces dates peut tre important Gkiasta et al 2003 Les pal ontologues et les arch ologues tentent n anmoins de reconstituer l histoire de nos anc tres en proposant des hypotheses de peuplement dont
273. nt sur le chromosome Y principalement l aide de s quences d ADN compl tes Le logiciel SPLATCHE permet galement de comparer les signatures g n tiques attendues pour une situation d mographique simul e en fonction de diff rents types de donn es s quence d ADN SNP RFLP microsatellite fr quence all lique Cet aspect peut orienter les recherches futures en d terminant le type de marqueurs et le nombre de locus n cessaires pour r pondre a une question pos e Nous avons ainsi montr que les distributions mismatch tir es de SNPs ne sont pas aussi efficaces que celles tir es de s quences d ADN completes pour d tecter l expansion d mographique pass e d une population Au contraire le biais de recrutement auquel sont sujets les SNPs peut mener des interpr tations erron es des distributions mismatch puisqu il a 38 tendance effacer la signature des expansions pass es II n est donc pas possible de comparer de fa on directe les distributions mismatch de la lign e male europ enne tir es de SNPs dont le biais de recrutement est important de celles de la lign e femelle tir es de s quences d ADN compl tes Par cons quent des s quences d ADN completes pour le chromosome Y sont n cessaires cette comparaison Ceci souligne l importance d avoir des types de donn es g n tiques identiques pour confronter les signatures mol culaires de syst mes diff rents entre populations ou entre sex
274. ntains a first line of legend and a second line defining the population source This second line consists of 5 fields separated by tab or space character 1 Name of the source population 2 Size of the source population in number of effective haploid individuals 3 amp 4 Geographic coordinates of the population source latitude and longitude SPLATCHE will determine itself in which particular deme corresponds the coordinates of the population Coordinates must belong to the geographical surface defined in the header of the environmental files Coordinates do not need to be in a particular units e g decimal degrees but they needs to be in the same units that the coordinates defined in the header of the environmental files 5 Resize parameter it is the size of the population source before the beginning of the expansion This parameter is used only for genetic simulations If this parameter is set to 0 then the size of the population source before the onset of the expansion is regarded as being equal to the initial size parameter 2 Example of initial density file Name Size Lat Long Resize middle 100 nl 13 0 160 SPLATCHE User Manual 3 4 2 Settings file All the parameters can be defined using the graphical interface of SPLATCHE However it is possible to save a group of parameters into a file and thus of being able to recover them thereafter Only the graphical parameters are not contained in the settings
275. number of immigrants received from neighboring demes Parameter calibration The speed of the colonization process of modern humans in Europe depends on the parameters of their interaction with Neanderthals as well as on parameters of migration and logistic growth of the two populations We have thus calibrated the parameters of our simulation model from available paleodemographic information and from the estimated colonization time of Europe by modern humans Estimates of the total number of hunter gatherers living before of which about 1 million individuals were Neolithic times range between 5 and 10 millions probably living in Europe Taking a carrying capacity Kys of 40 females would imply the presence of 220 000 effective mtDNA genes in the 5 500 demes occupied by modern humans in Europe and the Middle East Since this number represent only females the total number of individuals living over has to be at least multiplied by four to include men and juveniles leading to a total density of about 880 000 HS individuals This value of Kps corresponds to a density of 0 064 individuals per square kilometer which is close to the value 0 04 used by some previous simulation of modern 4454 and well within the range obtained from actual hunter gatherer groups 0 01 0 35 or humans that estimated for ancient hunters gatherers 0 015 0 2 The time required for the colonization of Europe by modern humans is the other information that
276. od le d crit dans la section 4 3 L impl mentation d une deuxi me population dans SPLATCHE est inspir e par deux tudes ant rieures qui ont simul les interactions entre chasseurs collecteurs pal olithiques et agriculteurs n olithiques en Europe Rendine et al 1986 Barbujani ef al 1995 m me si notre m thodologie s en diff rencie passablement sur de nombreux points que nous discutons dans la section 4 4 Annexe 4 1 Deux matrices de demes superposees Le principe de base de notre implementation est le suivant a chaque cellule du monde virtuel correspondent deux d mes qui repr sentent chacun une des deux population A ou B Il est donc possible de se repr senter ce monde virtuel par deux matrices de demes superpos es Figure 9 15 La densit des populations a l int rieur des demes peut voluer au cours du temps de m me que les d mes peuvent changer des migrants Les migrations intrapopulationnelles voir section 4 3 2 1 sont celles qui ont lieu l int rieur d une m me population Figure 9 15 par exemple entre deux d mes appartenant a une couche A lt gt A ou B lt B A l oppos les migrations interpopulationnelles qui repr sentent l hybridation entre populations voir section 4 3 2 2 sont celles qui ont lieu entre deux couches A lt B Figure 9 15 wend E E so ceseae been essen sed cceatesueois ages OU Hybridation Couche population B gt Migrations intrapopulationnelles Figure 9 1
277. oducers vs food gatherers Watson et al 1996 Excoffier and Schneider 1999 differences between loci Beaumont 1999 ascertainment bias in the choice of markers Wakeley et al 2001 or a lack of resolution of some markers Pereira et al 2001 However these discrepancies could also result from making inferences based on erroneous models of population history e g if the population is indeed subdivided Marjoram and Donnelly 1994 While extensive studies have focused on the effect of population subdivision on the shape of gene genealogies e g Notohara 1990 Marjoram and Donnelly 1994 Donnelly and Tavar 1995 Nordborg 1997 Wakeley 2001 the effect of range or spatial expansions have thus far been neglected In the case of modern humans estimations of the age of the demographic expansions obtained from mtDNA sequence analyses point to the Pleistocene and so these expansions could indeed represent a global increase in effective population size due to the spread of humans after a bottleneck Although previous work has suggested that observed patterns of molecular diversity may have resulted from a simple demographic increase the possibility also exists that these patterns are a signal of a range expansion after a speciation event Excoffier and Schneider 2000 Although a range expansion certainly leads to an increase in the global effective size of a species it is not known whether it leads to exactly the same molecular signal
278. of emigrants Same as Model 1 but the fractional part of M is not truncated Instead a multinomial distribution is used to split M emigrants to the neighboring demes see Ray 2003a This ensures that there are always M emigrants that are sent The drawback of this technique is that it requires the drawing of random numbers which increases the time required for a simulation Model 3 Stochastic migration model with absolute number of emigrants Same as Model 2 but the number of emigrants M varies stochastically as a Poisson variable centered around Nm 157 SPLATCHE User Manual 3 3 General Settings panel The General Settings panel is the primary panel to set the demographic parameters and to launch a demographic simulation A screenshot of this panel is shown in Figure 3 1 A description of each component of this panel is given in ne ANR sub chapters SPLATCHE E lt lo xi General Settings Demographic outputs Genetic simulations Settings file settings_square txt _B Open Settings Open Settings 2 i Ea Save Settings Simulation duration sec Demograph Initial Density Overtlo Number of Generation Eu 5 Growth rate a rate Allow density overflow 7 Environmen Frictio Dynamis f Vegetation Roughness Both Allow dynamic environments Vizualize 10 tables Frictio Carpin table Output every 50 geneity 13 generate BMP of He ASCII raster of J number of migran
279. of migrants exchanged with neighboring demes 7 leading to similar Nm values at carrying capacity N K Left panels Nm 10 right panels Neat 200 The averaged mismatch distributions corresponding to the three different cases are superimposed on the top panels and are shown separately with their 90 confidence intervals on the three lower panels of the size of hunter gatherer populations resulting from the fragmentation of their habitat leading to contraction of their effective size Excoffier and Schneider 1999 Our present results would however lead to a simpler and very different interpretation of the differences in the shape of mismatch distribution between post Neolithic and hunter gatherer populations By assuming that the present distribution of human populations results from some A Hong Kong ala hy VOD OU 4 8 ee Direi m TU jw Turkana Fr Tnt nets Fo 8 WM EI 17 11 oe Fic 6 Observed mismatch distributions in human populations analyzed for mtDNA hypervariable region 1 HVRI Data drawn from samples referenced in Excoffier and Schneider 1999 A Post Neolithic populations B Present or former hunter gatherer populations spatial range expansion this contrast would simply result from the much larger deme size of Neolithic populations resulting in much larger Nm values than hunter gatherer populations While our simulations have assumed constant deme sizes from the onset of the range expans
280. offier L 2003 Intra deme molecular diversity in spatially expanding populations Molecular Biology and Evolution 20 1 76 86 Schneider S Roessli D amp Excoffier L 2000 Arlequin a software for population genetics data analysis User manual ver 2 000 Geneva Genetics and Biometry Lab Dept of Anthropology University of Geneva 172 ANNEXE 2 Aspects techniques du programme SPLATCHE Cette annexe est consacr e a la description technique du programme SPLATCHE Nous y d crivons dans un premier temps les deux principales parties qui composent SPLATCHE le module d mographique Annexe 2 1 et le module g n tique Annexe 2 2 et dans un second temps la structure du programme lui m me d un point de vue informatique Annexe 2 3 Annexe 2 1 Module demographique Comme nous l avons d j mentionn dans l introduction de ce chapitre l impl mentation de la partie d mographique de SPLATCHE est principalement le fait de Nicolas Ray et a d j largement t d crite dans sa th se Ray 2003 Nous ne reviendrons donc ici que bri vement sur cet aspect de SPLATCHE Automate cellulaire L aire g ographique virtuelle dans laquelle ont lieu les simulations peut tre repr sent e comme une grille r guli re grid compos e de cellules de forme et de taille identiques Cette structure est commun ment appel e automate cellulaire Ray 2003 Chaque cellule repr sente une petite unit de surface et est associ e pl
281. ographique section 3 2 Cette diversit est simul e sous la forme de s quences d ADN semblables celles tudi es pour le g nome mitochondrial chez l Homme La seconde tude est compl mentaire la premi re puisqu elle tudie les effets du m me genre d expansion mais cette fois sur un autre type de marqueur mol culaire les SNPs section 3 3 Les SNPs ont en effet t passablemet typ s sur le pendant masculin du g nome mitochondrial la portion non recombinante du chromosome Y ou MSY Nous discutons ensuite les observations faites l aide des deux types de marqueurs dans le contexte des populations europ ennes 3 4 Avant d aller plus loin il est important de d finir deux termes que nous utiliserons par la suite Dans ce travail le terme population signifie un groupe d individus qui un moment donn dans Le g nome mitochondrial est transmis uniquement pas voie maternelle Il est long d environ 16 kb et contient notamment deux r gions hypervariables HV1 et HV2 localis es dans la r gion non codante D loop qui ont t compl tement s quenc es dans de nombreuses populations humaines depuis 1981 Anderson et al 1981 Sa pr sence en grande quantit dans une cellule 1 000 a 10 000 fois l ADN nucl aire et son haploidie font de l ADN mitochondrial un sujet d tude tr s important puisqu il peut tre sequence directement et qu il volue beaucoup plus rapidement que l ADN nucl aire Le
282. olbeeobeae ee eee echoes seb ences 1 I 1 1 l 1 1 1 1 1 l 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 a a ete a fd paar RSS lina Youre ae ol ie ae oa De aes og al oe Be el eae ea paar 1 I 1 1 1 1 I I 1 I 1 I I 1 1 1 1 1 1 1 I I 1 1 1 1 I en De Re it a Ae ee PT pe ri ae ees LE z o DORS ci Cor ee A Soe a Eae l oy I I 1 I I I 1 I I I I 1 1 I i a a a En de SW ON aaa A a thin a a tn CR RS Each oO 1 I 1 1 I 1 I I 1 I I 1 I I l 1 I 1 1 l I l m 2 ee ened ES E ram S A eee Aelia E I 1 I 1 I 1 I 1 I I I 1 Re 1 I 1 1 I 1 1 I I 1 I l I 1 I 1 1 l 1 1 I I 1 I 1 1 I CE Po i ee a 1 1 1 1 l 1 1 1 1 1 1 1 I 1 1 1 I I I 1 I 1 I I I I I D Z gt AAT aR een ok aaa a als sr A are ool nea TA I 1 I I I I I 1 I 1 1 I I I I 1 1 I I 1 I I 1 1 I a r ram r i 3 ram i ra rrara ran rrer T am mm C Cy Ci DI J Cc Co Cy Cy Co CC Cc Cc LL gt mo Lm Ci m 0 F La Li gt mo m TE T T T Th SIBADIAIPUI po Jagun m Li 60 100 120 140 160 180 200 220 240 260 280 300 320 340 360 360 400 420 440 460 480 500 40 60 2 Generation Save to WMP Selectors allowing to change the row and the column which will select the correct deme and display the history of the number of individuals density a 2 Graph showing the history of the number of individuals density for the selected deme It is possible to zoom in and out in the graph by drawing r
283. on d une expansion dat e de 100 000 ans 10 000 ans ne change rien aux distributions mismatch obtenues non montr puisque les SNPs sont ind pendants du taux de mutation Il nous est donc impossible de dater cette expansion 34 Fr quence 0 6 0 5 Fr quence Diff rences Diff rences italiens m Sardes A Calabrais O Albanais e Andalous A Basques espagnols m Basques fran ais O Catalans 0 6 0 6 5 0 5 0 4 O T O c C D O 5 5 0 3 4 5 oO oO pat LL LL 0 2 0 14 0 Diff rences 6 Fran ais A Hollandais m Allemands O Tch ques et Slovaques 0 6 0 4 0 3 O O O O C C O Q D 024 oO oO LL LL 0 14 0 Diff rences 6 Croates m M ac doniens O Polonais A Grecs Diff rences O Udmurt 6 Hongrois A Ukrainiens Saami N Mari Diff rences Georgiens Libanais A Turques O Syriens Figure 3 4 Distributions mismatch observ es dans 25 populations europ ennes et moyen orientales typ es pour 22 SNPs d apres les donn es de Semino et al 2000a 35 Fr quence Fr quence Sans biais de recrutement Biais de recrutement 2 10 0 8 0 8 a a
284. on est un mot clef qui sp cifie au compilateur quelles sont les parties du code utiliser 196 10 Bibliographie Les references de cette bibliographie se rapportent uniquement aux citations dans le texte Les r f rences d j cit es dans les publications ou manuscrits comprises dans ce travail 2 2 1 3 2 1 5 2 1 et 6 2 1 et ANNEXE 1 n y figurent pas Aborgast R M Magny M P trequin P 1996 Climat cultures c r ali res et densit de population au n olithique Le cas des lacs du jura fran ais de3500 2500 av J C Arch ologisches Korrespondenzblatt 26 121 143 Adams J Faure H 1997 Review and atlas of palaeovegetation preliminary land ecosystem maps of the world since Last Glacial Maximum Oak Bridge National Laboratory Akey J M Zhang G Zhang K Jin L Shriver M D 2002 Interrogating a high density SNP map for signatures of natural selection Genome Res 12 1805 14 Allen J R M Brandt U Brauer A Hubberten H W Huntley B Keller J Kraml M Mackensen A Mingram J Negendank J F W Nowaczyk N R Oberhansli H Watts W A Wulf S Zolitschka B 1999 Rapid environmental changes in southern Europe during the last glacial period Nature 400 740 743 Allison A C 1954 Protection afforded by sickle cell trait against subtertian malareal infection Br Med J 4857 290 4 Alroy J 2001 A multispecies overkill simulation of the end Pleistocene megafaunal mass extinction Science 292 1893 1896
285. on finale Michel Blum a pris le relai de Nicolas dans le train puisque nous avons effectu de nombreux Gen ve Fribourg ensemble Je le remercie particuli rement de m avoir permis de partager son spacieux appartement fribourgeois pendant quelques mois Rosemarie et Max Matzinger m ont chaleureusement accueilli chez eux Marly pendant les derniers mois de la r daction de ma th se Ils m ont ainsi pargn de longues heures de voyage suppl mentaires et permis de me concentrer pleinement sur mon travail Je tiens galement remercier Chantal et Richard Pasquier ainsi que Juliette et Laurent Excoffier qui m ont h berg l occasion de mes nombreux s jours bernois J aimerais aussi remercier Fran oise et Jean Paul Giroud pour le vif int r t qu ils ont port mon travail et pour m avoir permis d en r aliser une partie sous le soleil de Sardaigne Le soutien constant de l ensemble de ma famille et plus particuli rement celui de Christiane Ren Deborah Alexandre Sandrine Z Didier Maria Irma Gilbert et Lucienne a t indispensable l aboutissement de cette these Mes derniers remerciements vont bien videmment Sandrine qui a t le compl ment n cessaire l ach vement de ce travail Elle a toujours r ussi me motiver pendant les p riodes de doute Son il avis la fois interne au domaine scientifique et externe la biologie a t d un apport inestimable Je lui suis infiniment reconna
286. onal and Molecular Population Genetics Lab Zoological Institute University of Bern Bern Switzerland We report here a simulation study examining the effect of a recent spatial expansion on the pattern of molecular diversity within a deme We first simulate a range expansion in a virtual world consisting in a two dimensional array of demes exchanging a given proportion of migrants m with their neighbors The recorded demographic and migration histories are then used under a coalescent approach to generate the genetic diversity in a sample of genes We find that the shape of the gene genealogies and the overall pattern of diversity within demes depend not only on the age of the expansion but also on the level of gene flow between neighboring demes as measured by the product Nm where N is the size of a deme For small Nm values lt approximately 20 migrants sent outwards per generation a substantial proportion of coalescent events occur early in the genealogy whereas with larger levels of gene flow most coalescent events occur around the time of the onset of the spatial expansion Gene genealogies are star shaped and mismatch distributions are unimodal after a range expansion for large Nm values In contrast gene genealogies present a mixture of both very short and very long branch lengths and mismatch distributions are multimodal for small Nm values It follows that statistics used in tests of selective neutrality like Tajima s D statistic or Fu
287. onding approximately to the present border between Saudi Arabia and Jordan This source for the spatial and demographic expansion of modern humans into Europe has been choosen arbitrarily as its exact origin is still debated Since we model the evolution of mtDNA we only simulate the spread of females but we implicitly assume that there are the same number of males and females in each deme The source deme for HS is assumed to be at its carrying capacity Kps of 40 females corresponding to a density of about 0 06 0 1 individuals per km including males and juveniles in broad agreement with density estimates for Pleistocene hunter gatherers HS individuals can then migrate freely to each of the four neighboring HS demes at rate m 4 When a HS individual enters an empty deme it results in a colonization event which initiates a local logistic growth process with intrinsec rate of growth rps per generation and with limiting carrying capacity Kps Interactions between the HS and the HN demes of the same cell are described below in more detail and its combination with migrations between HS demes results in a wave of advance progressing from the Near East towards Europe and North Africa The simulation of such a colonization process has been previously described in absence of competition in a homogeneous square world Demographic model We describe here a demographic model of interaction between populations incorporating competition and
288. onization of unfamiliar landscapes The archaeology of adaptation Routledge London pp 104 168 Fix A G 1996 Gene frequency clines in Europe demic diffusion or natural selection J Roy anthrop Inst 2 625 643 Fix A G 1997 Gene frequency clines produced by kin structured founder effects Hum Biol 69 663 73 Flores J C 1998 A mathematical model for Neanderthal extinction J theor Biol 191 295 298 Forster P Rohl A Lunnemann P Brinkmann C Zerjal T Tyler Smith C Brinkmann B 2000 A short tandem repeat based phylogeny for the human Y chromosome Am J Hum Genet 67 182 96 Forster P Cali F Rohl A Metspalu E D Anna R Mirisola M De Leo G Flugy A Salerno A Ayala G Kouvatsi A Villems R Romano V 2002 Continental and subcontinental distributions of mtDNA control region types Int J Legal Med 116 99 108 Francalacci P Bertranpetit J Calafell F Underhill P A 1996 Sequence diversity of the control region of mitochondrial DNA in Tuscany and its implications for the peopling of Europe Am J Phys Anthropol 100 443 60 Fu Y X 1997 Statistical tests of neutrality of mutations against population growth hitchhiking and backgroud selection Genetics 147 915 925 Gallay A 1994 A propos de travaux r cents sur la N olithisation de l Europe de l ouest L Anthropologie 98 576 588 Gallay A 2004 A propos du livre de Karoline Mazuri de Keroualin Gen se et diffusion de l agriculture en Europe
289. onsid rablement le temps de calcul ainsi que l espace m moire n cessaires la cr ation de donn es g n tiques car elle vite de simuler la diversit g n tique de toute la population L conomie ainsi faite permet de multiplier le nombre de simulations pour chaque sc nario d mographique et de tenir compte de la variablilit al atoire du processus g n tique Il existe plusieurs formats de sortie pour les donn es g n tiques Premi rement un format lisible par le logiciel ARLEQUIN Schneider et al 2000 qui permet d analyser ces donn es Deuxi mement SPLATCHE permet la visualisation de certaines composantes spatiales de la structure g n tique notamment la distribution g ographique des v nements de coalescence et des MRCA voir ANNEXE 3 Tous les d tails concernant l utilisation du programme SPLATCHE ainsi que le type d information g n r e sont pr sent s dans la section 2 2 1 et plus particuli rement dans ANNEXE 1 Les utilisations potentielles de SPLATCHE sont nombreuses Il est d abord possible de l utiliser pour tudier l influence d un v nement d mographique expansion contraction migration goulet d tranglement etc sur la diversit mol culaire voir sections 3 2 et 3 3 Il est galement possible d utiliser SPLATCHE afin de comparer la structure g n tique obtenue selon plusieurs hypoth ses de peuplement aux donn es r elles et ainsi de d terminer quelle est l hypoth se la plus probable
290. opulations with arbitrary demography Journal of Heredity 91 506 510 Hanski I Ovaskainen O 2003 Metapopulation theory for frag mented landscapes Theoretical Population Biology 64 119 127 142 PROGRAM NOTE Hewitt GM 2000 The genetic legacy of the Quaternary ice ages Nature 405 907 913 Kimura M Weiss WH 1964 The stepping stone model of genetic structure and the decrease of genetic correlation with distance Genetics 49 561 576 Ray N 2003 Mod lisation de la d mographie des populations humaines pr historiques l aide de donn es environnementales et g n tiques PhD Thesis University of Geneva Switzerland Ray N Currat M Excoffier L 2003 Intra deme molecular diver sity in spatially expanding populations Molecular Biology and Evolution 20 76 86 13 Schneider S Roessli D Excoffier L 2000 ARLEQUIN a software for population genetics data analysis User manual Genetics and Biometry Laboratory Department of Anthropology University of Geneva Geneva Taberlet P Fumagalli L Wust Saucy AG Cosson JF 1998 Comparative phylogeography and postglacial colonization routes in Europe Molecular Ecology 7 453 464 Wakeley J Aliacar N 2001 Gene genealogies in a metapopu lation Genetics 159 893 905 Walther GR Post E Convey P et al 2002 Ecological responses to recent climate change Nature 416 389 395 2004 Blackwell Publishing Ltd Molecular Ecology Notes 4 139 142 2 3 Conclusion
291. or 250 has virtually no effect on the expected proportion of Neanderthal genes in current Europeans for different interbreeding rates Figure S4 Another argument against a major influence of the Neolithic expansion has been already inferred from mtDNA European populations present a signal of Paleolithic demographic expansion which could be dated to about 40 KY ago The fact that this signal does not date to the Neolithic implies that most of the mtDNA lineages of current Europeans result from a Paleolithic range expansion It is therefore highly likely that the main cause of the current absence of Neanderthal genes in our mtDNA gene pool is their rarity or even absence among the Cro Magnon population and not the later replacement of this population by Neolithic farmers an hypothesis that seems more and more supported by genetic and paleontological data Even though our model of interaction and competition between Neanderthals and modern humans may still be overly simple compared to reality it captures two important historical aspects that were neglected in previous studies The first one is the documented progressive spread of modern humans in Europe see Figure 1 and the second is the local and progressive demographic growth of Paleolithic populations with density dependent interactions with Neanderthals With these additional sources of realism our results very strongly supports the view that there was no or only occasional admixture betw
292. ortant que ceux qui compos s de s quences Ce biais 150 implique que les mutations r centes sont sous repr sent es parmi les sites tudi s r v lant une image diff rente des donn es Par cons quent la comparaison des syst mes li s au sexe peut donner lieu a des interpr tations erron es si ce facteur n est pas pris en compte Ce biais de recrutement explique galement pourquoi des gradients de fr quences all liques sont observes beaucoup moins souvent avec le g nome mitochondrial qu avec d autres sytemes Nous avons en effet montr que l observation d un gradient a la suite d une vague de migration est tributaire de l ge de la mutation tudi e la presence de gradients tant d autant plus lev e que le biais de recrutement en faveur des alleles frequents est fort chapitre 6 Comme nous l avons d j mentionn ce travail constitue une premi re tape dans une approche plus globale visant fournir un cadre th orique l interpr tation de donn es r elles Il en merge donc de nombreuses perspectives Nous ne reviendrons pas sur celles d gag es par nos tudes sur le peuplement de l Europe puisque nous les avons d j d crites dans le chapitre pr c dent chapitre 7 En revanche il serait extr mement int ressant d tudier l influence que pourraient avoir de nouveaux param tres sur la signature g n tique des populations humaines ou d autres organismes terrestres Les migrations longue dista
293. ossibles est donc gale a 2N N N N P AB Chaque individu A a une probabilit P AB d effectuer un mariage mixte en admettant qu il ne fait pas de distinction entre cong n res et individus de l autre population Il est cependant fort probable qu un individu A choisira favorablement un individu de la m me population par rapport un individu B Pour refl ter ce choix pr f rentiel nous introduisons une variable y qui repr sente la probabilit d un mariage mixte en cas de rencontre y peut galement tre d crite comme la probabilit d hybridation entre les deux populations Si y vaut 1 cela signifie que les mariages ont lieu ind pendamment des populations auxquelles appartiennent les conjoints En revanche si y vaut 0 cela veut dire que les membres de chaque population ne se marieront qu entre eux Le nombre Syzg de migrations interpopulationnelles de A vers B pendant une g n ration est fonction de y mais galement de la probabilit d effectuer un mariage avec un individu de l autre population Nous utiliserons dor navant le terme hybridation a la place de migration interpopulationnelle Le nombre absolu Sag d v nements d hybridation par g n ration peut donc s crire comme 2N N yN 4 8 Eq 4 18 TAN Np Sap Ce mod le d hybridation est tres proche de celui utilis par Barbujani et al 1995 ces m mes auteurs mentionnant que les r sultats obtenus avec leur mod le sont eux
294. ous population particuli re et celui ci peut tre monomorphe dans une autre sous population Par exemple un polymorphisme d tect dans les populations europ ennes ne sera peut tre pas variable dans les populations africaines Il apporterait donc une information biais e s il tait utilis pour tudier la variabilit des populations africaines La version modifi e de SPLATCHE permet de choisir un fr quence minimale Pmin d un SNP dans l ensemble des chantillons ou dans au moins un chantillon De cette mani re les SNPs sont tir s al atoirement mais seuls ceux dont p gt Pmin sont gard s Le biais de recrutement peut modifier de fa on importante l interpr tation des donn es voir sections 3 3 et 6 2 1 Il est donc n cessaire de le simuler afin de conna tre son influence sur la signature g n tique laiss e par des v nements d mographiques Annexe 2 3 Impl mentation Nous ne rentrerons pas ici dans les d tails de l impl mentation du programme SPLATCHE mais nous d crirons simplement les points principaux de sa structure Le programme SPLATCHE a ete d velopp en C qui est un langage orient objet Par cons quent le code est constitu de diff rentes classes qui permettent la cr ation d objets lors d une simulation Annexe 2 3 1 Principales classes World La classe World est la base d une simulation puisqu elle repr sente le monde virtuel lui m me C est l int rieur de World que se tr
295. ouvent toutes les caract ristiques de cette aire virtuelle la taille des cellules ainsi que leur nombre la liste des capacit s de soutien K et des coefficients de friction F en fonction des types d environnement World dispose d une matrice de pointeur vers les cellules qui constituent le monde virtuel Worldmatrix ainsi qu un pointeur vers la base de donn es d mographique S DB Cell La classe Cell repr sente une cellule appartenant au monde virtuel Elle poss de donc tous les attributs physiques d une aire g ographique donn e telles que ses coordonn es latitude et longitude son type de v g tation ainsi que le fait qu elle soit c ti re ou travers e par une rivi re De plus Cell poss de un membre State qui contient l tat courant de la cellule pendant le i P min est gal la fr quence de l all le mineur le moins fr quent des deux tats du SNP dans la population 183 d roulement de la simulation d mographique La classe State contient la densit courante de la cellule ainsi que les variables K et F qui peuvent varier au cours du temps si le dynamisme environnemental est utilis En plus de ses coordonn es g ographiques Cell est d fini par un index num rique Cellindex qui permet d y acc der de fa on plus rapide notamment partir du module g n tique C est galement la classe Cell qui contient l impl mentation des mod les d mographiques et les diff rentes variables qui y
296. pe In Renfrew C Boyle K eds Archaeogenetics DNA and the population prehistory of Europe Vol 1 McDonald Institute for Archaeological Research University of Cambridge Cambridge pp 45 56 Poloni E S 1991 Le peuplement de la Chine hypoth ses linguistiques arch ologiques et g n tiques Dipl me de Biologie Universit de Gen ve Geneve Poloni E S Excoffier L Mountain J L Langaney A Cavalli Sforza L L 1995 Nuclear DNA polymorphism in a Mandenka population from Senegal comparison with eight other human populations Ann Hum Genet 59 43 61 Poloni E S Semino O Passarino G Santachiara Benerecetti A S Dupanloup I Langaney A Excoffier L 1997 Human genetic affinities for Y chromosome P49a f Taql haplotypes show strong correspondence with linguistics Am J Hum Genet 61 1015 35 205 Poloni E S 1999 Polymorphisme de l ADN et histoire du peuplement humain apport de l tude des marqueurs RFLP These Universite de Geneve Geneve Pritchard J K Seielstad M T Perez Lezaun A Feldman M W 1999 Population growth of human Y chromosomes a study of Y chromosome microsatellites Mo Biol Evol 16 1791 8 Pult I Sajantila A Simanainen J Georgiev O Schaffner W Paabo S 1994 Mitochondrial DNA sequences from Switzerland reveal striking homogeneity of European populations Biol Chem Hoppe Seyler 375 837 40 Quintana Murci L Semino O Minch E Passarimo G Brega A Santachiara Benerecetti A S 1999
297. plexes offre donc une alternative prometteuse leur compr hension lorsque leur r solution analytique est impossible Elle permet par exemple de simuler les mouvements des individus constituant une population dans une aire virtuelle en fonction de contraintes impos es par le mod le test Ces contraintes peuvent tre des barri res g ographiques comme des montagnes ou des mers qui emp chent la libre dispersion des individus Ces derniers portent des g nes eux aussi virtuels dont la constitution et la distribution sont compar es aux donn es r elles la fin d une simulation La vraisemblance des donn es obtenues sous diff rentes hypoth ses simul es peut ainsi tre valu e L augmentation r cente des capacit s informatiques ouvre des perspectives immenses dans le domaine des simulations puisqu il est maintenant possible de prendre en compte la complexit des processus d mographiques et g n tiques dans un laps de temps raisonnable C est dans cette optique qu a pris naissance le projet Friction dirig par le Pr Laurent Excoffier dont le but tait la reconstruction de l histoire des populations humaines au moyen de donn es environnementales et g n tiques Notre these a t effectu e dans le cadre de ce projet Ce type d approche ayant encore t tr s peu explor auparavant la collecte d informations et la r alisation d un tr s grand nombre d outils ont t n cessaires Outre la compilation de donn
298. pour ces ressources qu il s agisse de nourriture d espace d habitat ou 48 autres se met donc en place au cours du temps Cette comp tition peut s exercer entre individus de la m me population competition intrapopulationnelle ou entre individus de populations diff rentes qui occupent la m me zone competition interpopulationnelle Sous l effet de la comp tition les taux de natalit et de mortalit varient au cours du temps au fur et a mesure des variations de densit 4 3 1 1 Comp tition intrapopulationnelle Le mod le de croissance exponentielle quation 4 7 ne tient pas compte de la r duction du taux de croissance d la comp tition intrasp cifique pour les ressources environnementales Verhulst en 1838 a introduit l quation de croissance logistique d fini par N N F 4 a Eq 4 8 o K la capacit de soutien repr sente le nombre maximum d individus qui peuvent vivre l quilibre dans une aire donn e Begon et al 1996 p 247 1000 900 800 700 600 500 400 300 200 100 0 I I I I I 0 20 40 60 80 100 Temps en g n rations Densit em individus Figure 4 3 Exemple d une croissance logistique avec K 1 000 et r 0 2 Cette quation est une extension du mod le de croissance exponentielle mais elle tient compte du niveau de saturation caract ristique de l environnement K Begon et al 1996 p 224 Aux densit s inf rieures K le
299. pour l amiti qu il ma t moign e pendant ces ann es de fructueuse collaboration Andr Langaney m a offert l opportunit de poursuivre mon apprentissage dans son laboratoire l issue de mon dipl me et a ainsi rendu possible la r alisation de cette these Son ouverture d esprit et ses conseils inspir s m ont t pr cieux pour franchir les diff rentes tapes qui ont constitu cette th se et son regard critique m a rendu attentif aux d rives du monde scientifique Je le remercie galement pour la grande libert et la confiance qu il m a accord es dans la r alisation de mon travail Alicia Sanchez Mazas m a fait b n ficier de ses nombreuses connaissances dans diff rents domaines notamment ceux des polymorphismes humains de la pr histoire et de la linguistique Elle m a en particulier fait prendre concience de l importance de la vulgarisation et de la diffusion au grand public des r sultats de la recherche scientifique Je la remercie galement des nombreux conseils prodigu s pendant mon apprentissage ainsi que d avoir accept de faire partie de mon jury de th se Loun s Chikhi a aimablement accept d tre membre de mon jury de th se J esp re que l avenir nous donnera l opportunit d une collaboration commune Nicolas Ray a r alis son doctorat de fa on parall le au mien et notre collaboration a t quasiment quotidienne pendant pr s de quatre ans Nous avons partag non seulement de nombreux trajets en
300. pulation Genetics Lab Zoological Institute University of Bern Baltzerstrasse 6 3012 Bern Switzerland Laboratoire de G n tique et Biom trie D partement d Anthropologie et Ecologie Universit de Geneve CP 511 1211 Geneve 24 Switzerland Abstract Modern humans Homo sapiens sapiens displaced Neanderthals in Europe and western Asia between 45 000 and 30 000 BP Although no Neanderthal lineage is found to date among more than 4 000 mitochondrial DNA sequences in Europe interbreeding has never been completely excluded By simulating a range expansion of modern human in Europe from the Near East we show that the absence of Neanderthal genes in modern Europeans is compatible with at most 120 admixture events between the two subspecies during 12 15 000 years of coexistence This very low number strongly suggests that the two populations were indeed not interfertile Introduction The Neanderthals Homo sapiens neanderthalensis constitute a group of hominids whose particular morphology developed in Europe during the last 350 000 years under the effect of selection and genetic drift reaching its final form approximately 130 000 years ago This sub group of hominids referred to as HN hereafter populated Europe and western Asia until the arrival of the first modern humans Homo sapiens sapiens referred to HS in the following approximately 45 000 ago This arrival apparently drove the Neanderthals to extinction in less th
301. pulations humaines est celui de Rendine et al 1986 En effet m me si la m thodologie pr sent e dans cette publication souffre de certaines lacunes voir section 4 2 elle a indubitablement inspir les publications ult rieures notamment celle de Barbujani et al 1995 qui d crit les simulations les plus r alistes effectu es ce jour Notre approche s inspire de ces mod les ainsi que d autres Aoki 1996 Aoki ef al 1996 mais nous avons cependant d velopp notre propre m thodologie pour plusieurs raisons 1 Nous voulions avoir un contr le complet sur le mod le utilis et bien en cerner tous les aspects ce qui nest pas toujours possible partir de la simple description faite dans les publications Il existe en effet de nombreuses incoherences dans les mod les pr sent s notamment dans celui de Rendine et al 1986 qui sert de r f rence aux autres publications voir section 4 2 2 La signification du param tre y qui repr sente le taux d acculturation dans les mod les ant rieurs au n tre n est pas toujours tr s claire et ne nous satisfaisait pas pleinement Nous avons 63 donc red fini y d une mani re qui permette de l utiliser de fa on plus g n rale Selon notre mod le y est le param tre qui permet de r guler les changes g n tiques entre populations 3 Notre mod le permet une plus grande variabilit du nombre d hybridations entre la population et la population B lors de chaque g n
302. que la variance des distributions mismatch diminue avec l incorporation de chasseurs collecteurs dans la population n olithique Il n est cependant pas possible d estimer avec pr cision la contribution des chasseurs collecteurs au patrimoine g n tique europ en l aide des distributions mismatch tir es du g nome mitochondrial des populations actuelles Il est en effet tres difficile de comparer quantitativement des distributions mismatch d autant plus que leur variance est grande et qu elles ne sont tir es que d un seul locus 91 0 4 04 0 3 4 0 3 DO aD O O Cc Cc a 0 2 L 02 oO oO D O LL LL 0 1 0 1 0 0 Diff rences Diff rences e Anglais A Danois e Allemands du nord A laliens du nord m Fran ais o Finnois m Russes o Estoniens 0 4 04 Fr quence oO oO N w l Fr quence Oo Diff rences Diff rences e Sardes A Espagnols 6 Albanais A Bulgares 8 Basques oO Portuguais a Autrichiens o Hongrois Figure 4 26 Exemples de distributions mismatch observ es dans certaines populations europ ennes n 100 Anglais Piercy et al 1993 33 Danois 106 Allemands du nord Richards et al 1996 50 Fran ais Rousselet et Mangin 1998 50 Finnois 28 Estoniens Sajantila et al 1995 68 Italiens du nord Mogentale Profizi et al 2001 103 Russes Orekhov et al 1999 69 Sa
303. que ne cesse de cro tre et que les limites la complexit des processus simul s sont sans cesse repouss es De plus cette puissance permet galement de tenir compte de la stochasticit des processus d mographiques et g n tiques en multipliant les simulations La m thodologie d velopp e dans ce travail a donc port ses fruits en apportant un cadre th orique l interpr tation de la structure g n tique humaine en fonction de diff rentes hypoth ses de peuplement La pertinence des mod les utilis s dans les simulations est certainement le point le plus d licat de notre approche Ils doivent en effet tre suffisamment r alistes pour prendre en compte les principaux l ments d crivant les situations d sir es mais tout de m me assez simples pour que les processus en jeu puissent tre compris Par d finition un mod le ne sera jamais conforme la r alit puisqu il ne sera jamais possible de simuler exactement l histoire des populations humaines ou d autres organismes telle qu elle s est d roul e En revanche si des hypoth ses suffisamment diff renci es sont propos es et qu il est possible de les mod liser de fa on raisonnable alors leurs signatures g n tiques respectives sont potentiellement identifiables au moyen de simulations Nous avons notamment montr que les mod les de diffusion d mique ou de diffusion culturelle du N olithique peuvent tre diff renci s gr ce leurs diversit s mol culaire
304. r Laboratoire de G n tique et Biom trie D partement d Anthropologie et Ecologie Universit de Gen ve CP 511 1211 Gen ve 24 Switzerland Computational and Molecular Population Genetics Lab Zoological Institute University of Bern Baltzerstrasse 6 3012 Bern Switzerland Abstract We performed extensive and realistic simulations of the colonization process of Europe by Neolithic farmers as well as their potential admixture and competition with local Paleolithic hunter gatherers We find that minute amounts of gene flow between Paleolithic and Neolithic populations should lead to a massive Paleolithic contribution to the current gene pool of Europeans This large Paleolithic contribution is not expected under the demic diffusion model which postulates that agriculture diffused over Europe by a massive migration of individuals from the Near East However genetic evidence in favor of this model mainly consisted in the observation of allele frequency clines over Europe which are shown here to be equally likely under a pure demic diffusion or a pure acculturation model The examination of the consequence of range expansions on SNP diversity reveals that an ascertainment bias consisting in selecting SNPs with high frequencies will promote the observation of genetic clines which are not expected for random SNPs and will lead to multimodal mismatch distributions We conclude that the different patterns of molecular diversity observ
305. r senter des conclusions robustes Evidemment ces derni res d pendent fortement des hypoth ses sous jacentes au mod le notamment la comp tition entre les populations et la diff rence de capacit de 145 soutien entre elles Dans l tat actuel des connaissances il nest pas possible d exclure de telles hypotheses et le mod le que nous proposons est donc plausible pour expliquer a la fois la disparition des N andertaliens et celle des chasseurs collecteurs europ ens Ce mod le offre d ailleurs un surplus de r alisme par rapport des tudes publi es pr alablement sur le sujet qui ne consid raient ni la subdivision des populations ni leur dynamisme spatial voir p ex Nordborg 1998 Les recherches futures permettront peut tre d affiner ou de r futer ce mod le qui peut para tre relativement irr aliste sous certains aspects notamment en ce qui concerne l homog n it des processus et des facteurs environnementaux Nous proposons donc une base de travail sur laquelle d velopper des travaux futurs qui pourront incorporer un surplus de r alisme Il est cependant n cessaire qu une augmentation de la complexit du mod le s accompagne d une bonne connaissance des param tres ajout s afin d viter une croissance de l incertitude autour des r sultats et de permettre une bonne compr hension des processus en jeu Il sera galement possible d int grer les modules de simulations dans des proc dures d estimation
306. r of individuals that have arrived from deme j to deme i at this generation For each gene belonging to the deme i the probability of migration from deme j is equal to m N where mj is the number of immigrants from deme j to deme i during the demographic phase All the deme sizes and the numbers of immigrant between demes are taken from the database generated during the demographic simulation 2 Generation of the genetic diversity The second phase of a genetic simulation consists in generating the genetic diversity of the samples This operation is done in adding mutations independently on all branches of the 166 SPLATCHE User Manual genealogy assuming a uniform and constant Poisson process At the end of this process all the sampled genes have a specific genetic identity The genetic process 1s entirely stochastic so many genetic simulations have to be performed for each demographic simulation in order to obtain meaningful statistics We recommend at least 1 000 simulations per demographic scenario The coalescent backward approach does not generate the history of the whole population but only that of sampled genes and their ancestors Thus this approach is much less demanding in terms of memory and computing time That allows the simulation of complex demographic scenarios within a very broad geographical and temporal framework 4 2 Settings panel Various parameters must be defined before launching a genetic simulation The num
307. r simultan ment dans le monde virtuel Toutes les modifications ont t faites dans ce sens Par exemple chaque cellule correspond un vecteur de demes la position du deme dans le vecteur tant gale au num ro de la population matrice a laquelle il appartient Il est donc ais d augmenter la taille du vecteur afin de permettre la simulation d un plus grand nombre de populations La simulation de n populations avec n 2 3 l aide de la version modifi e de SPLATCHE n cessite cependant des modifications suppl mentaires Cela r clamerait en effet l impl mentation de la lecture des param tres qui caract risent les populations additionnelles notamment K et F Il faudrait surtout d velopper un mod le d mographique qui r gisse les interactions entre les n populations puisque seuls des mod les incorporant une chapitre 2 ou deux section 4 3 populations ont t d velopp s dans le cadre du projet Friction 195 Il est cependant clair que les mod les de competition envisag s dans la section 4 3 peuvent tre facilement etendus a un nombre arbitraire de populations De nombreuses autres modifications ont d tre apport es a SPLATCHE regroup es sous une variable de compilation _MULTIDEME_ afin de permettre l volution simultan e de deux populations diff rentes Nous ne les d crirons cependant pas ici puisque elles ne pr sentent aucun int r t particulier pour le lecteur Une variable de compilati
308. rates of gene flow between HG and F A without ascertainment bias B with ascertainment bias equal to 5 and B 10 Only one population is simulated 138 SNP diversity in Europe after a range expansion 1 E Expected TA O DD without bias E CD without bias 0 8 BG DD with bias 10 7 0 7 E CD with bias 10 006 O 0 5 5 04 v LL 0 3 0 2 0 1 I IR ll L L L Hb bh bh 0 05 0 15 0 25 03 0 35 04 045 085 Frequency of minor allele Figure S8 Allele frequency spectrum Harpending et al 1998 under DD y 0 0 and CD y 1 0 with or without ascertainment bias Black bands are the expected values under neutrality and constant population size Tajima 1989a 139 SNP diversity in Europe after a range expansion References Adams J amp Faure H 1997 Review and atlas of palaeovegetation preliminary land ecosystem maps of the world since Last Glacial Maximum Oak Bridge National Laboratory Alroy J 2001 A multispecies overkill simulation of the end Pleistocene megafaunal mass extinction Science 292 1893 1896 Ammerman A amp Cavalli Sforza L L 1984 The Neolithic transition and the genetics of populations in Europe Princeton New Jersey Princeton University Press Arias P 1999 The origins of the Neolithic along the Atlantic coast of continental Europe Journal of World Prehistory 13 403 464 Austerlitz F Mariette S Machon N Gouyon P H amp Godelle B 2000 Effe
309. rdes Di Rienzo et Wilson 1991 41 Espagnols 54 Portuguais Corte Real et al 1996 45 Basques Bertranpetit et al 1995 42 Albanais Belledi ef al 2000 30 Bulgares Calafell et al 1996 101 Autrichiens Parson et al 1998 35 Hongrois Kalmar et al 2003 4 6 Conclusion Dans ce chapitre nous avons pr sent le d veloppement d une m thodologie qui permet de simuler les interactions entre deux populations voluant dans une aire g ographique donn e Deux types d interactions sont possibles entre ces populations des changes g n tiques et de la comp tition Si des mod les d mographiques avaient d j t d velopp s pour simuler un flux g n tique entre deux populations Rendine ef al 1986 Barbujani et al 1995 Aoki 1996 Aoki et al 1996 ou de la comp tition entre elles Flores 1998 notre approche est la premi re qui prenne en compte les deux types d interactions simultan ment L impl mentation de notre mod le dans une version modifi e du logiciel SPLATCHE voir ANNEXE 4 offre de nombreux avantages parmi lesquels la possibilit de tester de fa on intensive les param tres du mod le de visualiser les composantes d mographiques et g n tiques et surtout d utiliser ce mod le dans une infinit de cadres temporels et g ographiques diff rents 92 Nous avons d velopp cette m thodologie dans le but de simuler l expansion d une population dans une aire pr alablement peupl e et plus particuli r
310. re la phase de production de nourriture Ce changement a galement profond ment affect la culture mat rielle des populations mais nous ne tenons compte ici que de l aspect conomique du N olithique europ en Il est maintenant acquis que le N olithique n est pas end mique au continent europ en mais qu il a t import depuis le Proche Orient via l Anatolie La mise en place des techniques 118 agropastorales au Proche Orient et en Anatolie na pas t une transition rapide puisqu elle a dure pres de 4 000 ans 11 000 6 800 BC Mazuri de Keroualin 2001 voir aussi Appenzeller et al 1998 La diffusion de ces techniques jusqu aux marges ouest et nord de l Europe s est faite en moins de 4 000 ans 6 800 3 000 BC Mazuri de Keroualin 2001 Il faudra cependant pres d un mill naire suppl mentaire pour que les r gions p riph riques notamment la Scandinavie et l est de l Europe adoptent compl tement l conomie agropastorale Zvelebil et Zvelebil 1988 Arias 1999 Deux mod les extr mes ont t utilis s pour d crire la diffusion du N olithique en Europe i Le mod le de diffusion d mique DDM Clark 1965 Ammerman et Cavalli Sforza 1971 ii Le mod le de diffusion culturelle ou acculturation CDM Zvelebil et Zvelebil 1988 Le mod le de diffusion d mique implique que les premiers agriculteurs ont connu une forte croissance d mographique et qu ils ont ainsi t forc s de migrer dans les r gio
311. re d une large vari t de questions touchant soit les populations humaines soit d autres organismes Elle pourrait par exemple apporter des l ments nouveaux la compr hension du peuplement de la Polyn sie en permettant la simulation des diff rentes hypoth ses propos es p ex Oppenheimer et Richards 2001 Par ailleurs une version de SPLATCHE permettant de mod liser le d placement d organismes dans des cours d eau est galement en cours de d veloppement dans le cadre de la th se de Samuel Neuenschwander in prep l Universit de Berne Cette version modifi e de SPLATCHE permettra notamment d aborder les questions relatives la recolonisation des plans d eaux apr s les phases de glaciation Comme nous l avons d j soulign plusieurs reprises la m thodologie pr sent e dans ce travail pourrait certainement tirer d normes b n fices de sa combinaison avec des m thodes d estimations bayesiennes qui donnerait une valutation plus pr cise des sc narios simul s et une estimation des param tres d mographiques des populations r elles Ce type de m thodologie requiert cependant des capacit s informatiques tr s importantes puisqu elle n cessite des millions de simulations Beaumont et Rannala 2004 Hamilton et al 2004 1 Le d s quilibre de liaison d signe l association non al atoire d alleles pris des locus s par s dans une population Lewontin et Kojima 1960 Ce ph nom ne peut t
312. re d mographique commune Les populations europ ennes sont g n tiquement tr s homog nes particuli rement en ce qui concerne le g nome mitochondrial Horai et Hayasaka 1990 Jorde et al 1995 Comas et al 1997 mais galement pour le chromosome Y puisque l Europe est le continent dont le Fsr est le plus faible Roewer et al 2000 Hammer et al 2001 Kayser et al 2001 Cette homog n it importante a d j t observ e l aide des marqueurs classiques Cavalli Sforza et Piazza 1993 Dugoujon et al 2004 et a t interpr t e comme tant le r sultat d une origine commune r cente des populations europ ennes Pult et al 1994 L hypoth se d une origine commune r cente a t renforc e par l observation de la trace d une expansion d mographique pal olithique dans le g nome des populations europ ennes Bertranpetit et al 1995 Calafell et al 1996 Comas et al 1996 Francalacci et al 1996 Comas et al 1997 Excoffier et Schneider 1999 Pritchard et al 1999 Shen et al 2000 Des gradients de fr quences all liques entre le Proche Orient et le nord ouest de l Europe que nous appelerons SE NO pour Sud Est Nord Ouest ont t r guli rement observ s l aide de diff rents syst mes g n tiques Environ 1 3 des marqueurs classiques montrent de tels gradients Menozzi et al 1978 Sokal et Menozzi 1982 Sokal et al 1991 Barbujani et Pilastro 1993 Cavalli Sforza et al 1994 Pia
313. re la cons quence de la s lection de la d rive g n tique de la parent entre individus ou du flux g n tique entre populations Lewontin 1988 152 9 Annexes ANNEXE 1 MANUEL D UTILISATION DE SPLATCHE ANNEXE 2 ASPECTS TECHNIQUES DU PROGRAMME SPLATCHE ANNEXE 2 1 MODULE DEMOGRAPHIQUE ANNEXE 2 2 MODULE GENETIQUE ANNEXE 2 3 IMPLEMENTATION ANNEXE 3 VISUALISATION DE LA COALESCENCE ANNEXE 3 1 ARBRE DE COALESCENCE ANNEXE 3 2 DISTRIBUTION DES EVENEMENTS DE COALESCENCE ANNEXE 3 3 DISTRIBUTION DES MRCA ANNEXE 4 MODIFICATIONS DU PROGRAMME SPLATCHE AFIN DE SIMULER LES INTERACTIONS ENTRE DEUX POPULATIONS DIFFERENTES ANNEXE 4 1 DEUX MATRICES DE DEMES SUPERPOSEES ANNEXE 4 2 RELATIONS ANCESTRALES ENTRE POPULATIONS DIFFERENTES ANNEXE 4 3 ECHANTILLONNAGE SIMULTANE DANS CHACUNE DES POPULATIONS ANNEXE 4 4 POSSIBILITE D EXTENSION A N POPULATIONS 153 155 173 173 176 183 187 187 191 193 193 194 195 195 ANNEXE 1 Manuel d utilisation de SPLATCHE Cette annexe est une reproduction du manuel d utilisateur qui accompagne la version publique du logiciel SPLATCHE disponible l adresse www cmpg unibe ch software SPLATCHE Page suivante 155 SPLATCHE User Manual SPLATCHE USER MANUAL 1 Introduction The goal of this user manual 1s to describe the technical aspects of the software SPLATCHE version 1 0 This manual complements the article from Currat Ray and Excoffier published in Molecular Ecology
314. remi re phase de dispersion dans la population AG les lignages sont ramen s vers la source de l expansion n olithique Ils passent ensuite par un goulet d tranglement avant de subir une seconde phase de dispersion dans la population CC Finalement les derniers lignages sont ramen s vers le lieu d origine de l expansion pal olithique ou se font les derni res coalescences 1 Comportement l g rement diff rent des d mes qui se trouvent dans les bords de l aire simul e par rapport ceux qui se trouvent au centre d aux possibilit s de migration restreintes moins de d mes voisins Ce ph nom nes a t d crit en d tails par Ray 2003 p 149 Selon le mod le des sites infinis 8 z 2tu ou zest le nombre attendu de diff rences par paire t est le nombre de g n rations jusqu l anc tre commun le plus r cent MRCA et z le taux de mutation par g n ration et pour l ensemble des locus tudi s 74 G n ration O G n ration 100 G n ration 200 G n ration 250 G n ration 300 G n ration 350 G n ration 400 G n ration 500 G n ration 2 000 G n ration 3 800 G n ration 3 950 G n ration 4 000 Figure 4 13 Occupation du monde gris clair occupation par CC gris fonc occupation par AG noir occupation par CC et AG Rose d me de la population AG dans lequel se trouve au moins un g ne Rouge d me de la population CC dans lequel se trouve au moins un g ne
315. res ont drastiquement baiss en Europe et la calotte glaciaire scandinave est descendue tres au sud couvrant une partie des iles britanniques et tout le nord de l Europe Les grandes cha nes montagneuses taient alors recouvertes d paisses couches de glace tandis que les plaines du nord de l Europe taient constitu es de toundra et de steppes froides Ces conditions glaciaires ont repouss une grande partie de la faune et de la flore plus au sud ou l est dans des zones climatiques cl mentes p ninsule ib rique ltalie Balkans Gr ce Turquie Caucase et mer Caspienne Huntley 1988 Hewitt 1996 Taberlet et al 1998 Hewitt 2000 Willis et Whittaker 2000 Hewitt 2001 Depuis le dernier maximum glaciaire le climat i Last Glacial Maximum 146 s est r chauff progressivement bien que de fa on irr guli re impliquant une r expansion rapide des esp ces v g tales et animales vers le nord Hewitt 1996 ainsi qu une augmentation d mographique importante des populations humaines en Europe Bocquet Appel et Demars 2000a La contraction de l aire de r partition des esp ces v g tales et surtout animales dans le sud et l est de l Europe pendant le LGM ainsi que leur expansion post glaciaire ont vraisemblablement t accompagn es par des modifications de l aire de r partition des Hommes modernes qui d pendaient fortement de ces ressources Housley et al 1997 Il a donc t propos qu un d placement des chass
316. rld suggests a centrifugal model of human migrations Am J Phys Anthropol 123 Dunn F L 1968 Epidemiological Factors Health and Disease in Hunther Gatherer In Lee RB DeVore eds Man the hunter Aldine Publishing Company Chicago pp 221 227 Dupanloup de Ceuninck I 1999 Evaluation et synthese des contributions de la linguistique et de la g n tique l tude de la diff renciation des populations humaines pendant la pr histoire r cente Th se Universit de Gen ve Gen ve Dupanloup l Pereira L Bertorelle G Calafell F Prata M J Amorim A Barbujani G 2003 A recent shift from polygyny to monogamy in humans is suggested by the analysis of worldwide Y chromosome diversity J Mol Evol 57 85 97 Edmonds C A Lillie A S Cavalli Sforza L L 2004 Mutations arising in the wave front of an expanding population Proc Natl Acad Sci U S A 101 975 9 ESRI 1998 ARCVIEW 3 1 Environmental Systems Research Institute Eswaran V 2002 A diffusion wave out of Africa the mechanism of the modern human revolution in prep 1 53 Ewens W J 1990 Population Genetics Theory The Past and the Future In Lessar S ed Mathematical and Statistical developments of Evolutionary Theory Kluwer Academic Publishers Dordrecht pp 177 227 200 Excoffier L Pellegrini B Sanchez Mazas A Simon C Langaney A 1987 Genetics and history of Sub Saharan Africa Yearbook of Physical Anthropology 30 151 194 Excoffier L 1988 Pol
317. rsque le taux d hybridation y varie En traitille l intervalle 90 Ncem 10 Nagm 17000 rcc 0 3 rac 0 5 et m 0 1 87 4 5 3 6 Cadre temporel et taux de mutation Jusqu ici nous avons simul une premiere expansion correspondant a la diffusion initiale d Homo sapiens sapiens dat e d environ 100 000 ans 4 000 g n rations notamment pour des raisons de clart de l expos Le peuplement du continent europ en est plus r cent et date d environ 40 000 ans peut tre depuis le Proche orient Stringer 1989 ou depuis une autre source en Asie de l ouest ou en Asie centrale Djindjian et al 1999 Kozlowski et Otte 2000 On peut donc l gitimement se poser la question de l influence que pourrait avoir sur les donn es mol culaires une expansion spatiale pal olithique plus r cente que celle que nous avons simul e jusqu ici Nous avons donc proc d a une nouvelle s rie de simulations identique la pr c dente mais en datant la premi re expansion de 1 600 g n rations a la place de 4 000 tout en gardant l expansion n olithique a 400 g n rations Nous avons galement modifi l g rement le taux de mutation u 0 00125 la place de 0 001 afin que le mode attendu des distributions soit gal 4 nombre qui correspond l ordre de grandeur de la majorit des distributions mismatch obtenues pour les populations europ ennes Di Rienzo et Wilson 1991 Bertranpetit et al 1995 Sajantila et al 1995 Cala
318. rticular deme 163 SPLATCHE User Manual Number of generations for the current display Zoom for the current display Radio button to choose from displaying the density the number of emigrants or the occupation black if occupied Button allowing to save the current display as a bitmap Cursor allowing to change the current generation and the display at the chosen generation Buttons allowing to display the initial at generation 0 carrying capacity map the initial friction map and the proportional arrival time in each deme ERRICIOIEIC 164 SPLATCHE User Manual 3 6 Demographic outputs window This window allows to explore the demographic database that has been generated through a simulation oo m en 2 ri m ur ht m a LL m mil D L Co oo LL On i T i 3 5 zi an L Eur Selected deme Selected column 8 Selected row 22 i a J I I I I a a E E a E E E aS Lau e Lee se E l l 1 1 1 1 I 1 l 1 1 1 1 I I 1 I I 1 I 1 1 I I CCC i a a a S a 1 1 I I 1 l 1 I T 1 1 I eean 1 f 1 f I I Seay 1 2 Sten a ala Pee eee tata nie ae TPE en pie a aire LORIE I f 1 I I I 1 I I 1 I I I 1 1 i I I I 1 I 1 I I Le cotecdeoctecd asc ete es ais E SSE SE e E e NEE I I 1 I L I I 1 1 I I 1 1 I 1 1 I I I 1 I I I 1 I I I er ae den oe EN PE EN PE en RS Et EU Sr EE te 1 I 1 1 I
319. s lt 0 05 95 6 2 20 1 00 13 9 1 00 81 2 2 19 1 00 14 2 1 00 85 0 1 91 0 95 Sgi 0 85 84 8 1 75 0 84 53 0 54 74 1 1 26 0 29 0 8 0 01 75 7 1 20 0 26 0 4 0 01 Note The expansion started 4 000 generations ago and was followed by a more recent global demographic expansion at different times in the past T 10 50 100 and 500 generations ago A fraction m 0 10 of migrants are constantly exchanged between neighboring demes Ky Carrying capacity of the demes before the demographic expansion K Carrying capacity of the demes after the demographic expansion Size Exp is the time in generations before present at which the demographic expansion occurs small deme size and a recent increase in deme size resulting in higher levels of gene flow with surrounding demes The results of such simulations are shown in table 4 for the pattern of molecular diversity and in figure 7 for the mismatch distributions We find that demographic expansions having oc curred more than 100 generations ago and resulting in a 10 fold increase in Nm values from Nm 10 to Nm 100 would lead to unimodal distributions fig 7B and C as if their size had always been 10 fold higher fig 7A In contrast more recent demographic expansions would lead to a greater number of recent coalescent events and multimodal distributions fig 7D and F as if deme size had always been low fig 7F Patterns of molecular 025 02
320. s admixture event between Neanderthals and modern humans When a progressive range expansion of modern humans into Europe is modeled the maximum initial input of Neanderthal genes into the Paleolithic European population can thus be estimated to lie between only 0 02 scenario B and 0 09 scenario D Table 2 It should be noted that the different scenarios in this study lead to very similar results concerning the expected proportion of Neanderthal genes in our gene pool Table 1 and the maximum amount of admixture events between Neanderthals and modern humans Table 1 suggesting that our results are robust to the inherent inaccuracy in the choice of demographic parameters While we cannot pretend that our model of interaction between Neanderthals and modern humans in Europe accounts for all details of the process it is considerably more realistic than previous approaches and it has the advantage of modeling and explaining the observed extinction of Neanderthals in Europe over a period of 12 15 000 years The large growth rates used in the simulations compensate for the fact that long range dispersal is not considered in the model as i increase the speed of the migration wave These migrations influence the molecular composition of genes in dispersion but they also increase cohabitation times between HS and HS and consequently their probability of admixture The simulation of long range dispersal would thus probably decrease the low admixtur
321. s chapitre 6 De m me les structures g n tiques attendues sous les hypotheses d une origine unique ou multiple de l Homme moderne peuvent galement tre distingu es Ray et al 2004 Dans les deux cas il s agit cependant d hypotheses extr mes et oppos es et il est beaucoup plus difficile d valuer la pertinence des situations interm diaires a l aide de notre m thodologie Il s agit d ailleurs de la principale faiblesse de notre approche en l tat Elle est en effet extr mement utile pour diff rencier qualitativement les donn es mol culaires en fonction des differents sc narios et ainsi comprendre l effet des processus en jeu En revanche elle manque de puissance pour permettre la comparaison quantitative des sc narios en fonction des donn es mol culaires r elles except dans certains cas comme dans la recherche pr sent e dans le chapitre 5 Gageons que l utilisation d une m thode bayesienne d estimation de param tres voir p ex Beaumont et al 2002 combin e notre 149 approche devrait permettre dans le futur une valuation plus pr cise des sc narios m me s il existera toujours une limite dans la reconstitution des donn es r elles Les diff rentes recherches pr sent es dans ce travail ont n anmoins permis de tirer plusieurs conclusions au sujet des populations humaines Nous ne reviendrons que bri vement sur ces diff rents points puisqu ils ont d j t largement abord s dans
322. s correspond au fait que ce lignage a t apport dans par un immigrant venu de j mj est calcul e pour tous les voisins d un deme de un quatre Le nombre d immigrants l provenant de chacun des d mes voisins est tir de la base de donn es g n r e pendant la phase d mographique somme des migrants venant des 4 points cardinaux voir page 175 Annexe 2 2 2 G n ration de la diversit g n tique La seconde phase d une simulation g n tique consiste en la g n ration de la variabilit des chantillons En effet pendant la premiere phase tous les g nes chantillonn s sont consid r s comme identiques d un point de vue g n tique Seul un identificateur num rique permet de les reconna tre les uns des autres et ainsi de reconstruire leurs liens g n alogiques Dans la seconde phase un haplotype est d fini al atoirement constitu d un type de donn es g n tiques choisi par l utilisateur s quence d ADN RFLP ou microsatellite Cet haplotype est introduit la racine de l arbre de coalescence Puis des mutations sont simul es le long des branches de l arbre en fonction d une distribution de Poisson centr e sur ut ou u est le taux de mutation et t la longueur 1 Un haplotype est une combinaison unique d un marqueur g n tique pr sent sur un chromosome Hartl et Clark 1997 p 57 179 d une branche en g n rations Figure 9 6 Plus une branche est longue et plus elle aura de chance de port
323. s SNPs Single Nucleotide Polymorphism aussi appeles UEPs pour Unique Event Polymorphism s sont des locus polymorphes pour lesquel on conna t deux tats pr sent ou absent Ils sont souvent utilis s pour tudier de larges portions du g nome Voir par exemple Vignal et al 2002 et Shastry 2002 pour plus de details Le chromosome Y est transmis uniquement de p re en fils et est le plus petit chromosome du g nome humain Il est n anmoins environ 4 000 fois plus grand que le genome mitochondrial puisqu il est constitu de pr s de 60 millions de paires de bases Sa majeure partie 95 ne recombine pas et est appel e MSY anciennement NRY voir Skaletsky ef al 2003 Cette portion du chromosome est sp cifique aux m les chez les mammif res et permet la d termination g n tique du sexe Elle est entour e de deux r gions recombinantes appel es r gions pseudo autosomales le temps partagent au moins une caract ristique d finie par le chercheur Forster et al 2002 Cette caract ristique peut tre biologique g ographique ou culturelle Dans ce travail une population peut notamment tre synonyme de communaut par exemple dans le cas de la simulation des interactions entre chasseurs collecteurs et agriculteurs Dans ce manuscrit le terme d me Gilmour et Gregor 1939 fait r f rence un groupe d individus appartenant la m me population par exemple la m me communaut selon la d finition ci dessus et l
324. s et ainsi modifier leurs migrations Il nous a donc paru important de voir dans un premier temps si les effets de bord induits par le lieu d chantillonnage peuvent jouer un r le dans la signature g n tique d une double expansion Nous avons donc d plac l expansion n olithique en p riph rie du monde virtuel dans le deme lt 5 5 gt afin d avoir un lieu d chantillonnage deme lt 25 25 gt qui ne soit pas localis au m me endroit Comme le montre la Figure 4 19 la dynamique spatiale des g nes est passablement affect e lorsque le lieu d chantillonnage est diff rent du lieu d origine de l expansion n olithique en comparaison d un chantillonnage local Figure 4 13 En effet les g nes qui sont ramen s vers le goulet sont rassembl s dans des d mes communs au front de la vague de migration et par cons quent le nombre de coalescences augmente avant d arriver au goulet L homozygotie attendue d une population est donc plus importante en p riph rie qu l endroit m me du goulet Figure 4 18 Cette diff rence sugg re qu il doit tre possible de localiser la position d une expansion en analysant s par ment la diversit intrapopulationnelle d chantillons ind pendants et localis s a des endroits diff rents Il faudrait n anmoins des distributions mismatch obtenues a partir de nombreux locus ind pendants pour pouvoir en tirer quelques informations la comparaison 80 de deux distributions mismatch obtenues
325. s large or could reach low frequencies but be geographically restricted when migration is lower Therefore randomly chosen SNPs will generally not show clinal patterns since they will be spread over a small region With ascertainment bias the fraction of SNPs showing AFCs increases dramatically and can even be observed in about 50 of the loci Table 1 Interestingly the AFCs occur at about the same frequency independently of the amount of incorporation of Paleolithic lineages into the F layer Table 1 and thus at similar frequencies under a pure DD or a pure acculturation model It implies that AFCs cannot be considered as indicative of a range expansion of Neolithic farmers since they could have been created equally well during the first expansion of modern humans into Europe The Neolithisation front is also important because it is the region where HG and F demes coexist and consequently where genetic exchanges occur between the two layers Therefore the probability for a lineage to be of HG ancestry increases with the time spent within the Neolithization front during the contraction periods C7 or C2 The proportion of lineages whose ancestors trace back to the F layer diminishes rapidly with increasing distance from the Neolithic source Figure 3 Obviously when y increases the total proportion of Neolithic lineages decreases and these lineages 127 SNP diversity in Europe after a range expansion are restricted to the area of the or
326. s le deme A ainsi que dans le deme B de la cellule centrale G n ration O G n ration 250 G n ration 450 G n ration 500 G n ration 550 G n ration 600 G n ration 700 G n ration 850 G n ration 1000 FUN Figure 4 8 Simulation pendant 1000 g n rations de l expansion de la population A au temps 0 puis de celle de B au temps 500 depuis le m me endroit L aire virtuelle est constitu e de 50x50 demes avec m 0 2 Blanc cellule inoccup e Gris clair cellule occup e uniquement par A Gris fonc cellule occup e uniquement par B Noir cellule occup e par les deux populations 62 Density per generation ee RE ee ee Eee ie a Population A 100 200 300 400 500 600 700 800 900 Generations Number of people per cell Density per generation Number of people per cell Generations Figure 4 9 Evolution des densit s des populations A et B dans le deme situ au centre d une aire carr e constitu e de 50x50 cellules ainsi que dans un deme situ en p riph rie Ces densit s ont t stock es en m moire virtuelle pendant 1000 g n rations apres l expansion de la population A au temps 0 depuis la cellule centrale et celle de B au temps 500 depuis le m me endroit Avec Ka 100 Ks 500 ra 0 1 et rg 0 1 Aucun change g n tique n a lieu dans ce cas 4 4 Avantages de l approche propos e L article le plus novateur concernant la mod lisation des interactions entre deux po
327. s of the spatial distribution of coalescent events are generated for every simulations with the NumCoal bmp termination The times for each coalescent event and each simulation are listed on a file with coal extension Those times are given on generation units with the bigger number corresponding to the end time of the simulation 4 4 4 Coalescent trees files In settings the checkbox coalescent trees 16 on Figure 4 1 it is possible to generate for each simulation a bitmap representing the genealogical links between each node of the coalescence tree laid out spatially SPLATCHE is the first program which allows an the spatial representation of the coalescent trees Those files are terminated with CoalTree_ bmp 170 SPLATCHE User Manual 4 4 5 MRCA files SPLATCHE gives information on the localization and timing of the Most Recent Common Ancestor MRCA of the totality of genes sampled thus on those of the various samples A file with the termination MRCADensity bmp is automatically generated and is a bitmap of the spatial distribution of MRCA for all the simulations joined These maps can also be visualized by means of the button Draw MRCA 15 on Figure 4 1 on the interface Similar bitmaps with the MRCAPopDensity bmp termination are generated for each sample The Time for the Most Recent Common Ancestor TMRCA for the whole tree and for each sample are also listed in a file with t
328. s were performed using the software ARLEQUIN Schneider Roessli and Excoffier 2000 Unless specified otherwise summary statistics and mis match distributions were obtained from the simulation of samples of 30 DNA sequences Results Spatial and Temporal Distribution of Coalescent Events In figure 1 we show various aspects of the dynamics of the spatial expansion process for two different numbers of migrants Nm exchanged between neighboring demes The first obvious result fig 1A and 1B is that for low Nm values Nm 10 the speed of the colonization wave is slower 600 generations to colonize the 2 500 demes than with high Nm values Nm 500 400 generations to colonize the 2 500 demes Note that this effect is not due to a difference in the proportion of migrants since in both cases m was set to 0 1 This is rather due to the fact that for low Nm values the deme takes longer to fill than for higher Nm values and therefore migration commences later The migration pattern also influences the timing and the location of coalescent events A majority of coalescent events are recent having occurred during the scattering phase sensu Wakeley 1999 and been geographically located close to the sampling location for Nm 10 fig 1C and while for Nm 500 they are mainly older and located close to the origin of the expansion fig 1D and F Note that the ultimate coalescent event is older than 4 000 generations in 96 1 of the c
329. se and corresponds to a subdivided population of 25 demes surrounding the source deme defined in scenario A Scenario D is identical to A but rys is here equal to 0 8 which is the maximum growth rate estimated for Paleolithic human population Scenario E is identical to A except that ms is here much higher and equal to 0 5 implying that 50 of the women are recruited in adjacent demes The carrying capacity of Neanderthals Ky had to be readjusted for scenarios D and E which may appear as extreme in order to maintain a colonization time of about 500 generations It was indeed set to 25 giving a total density of HN of 350 000 individuals over Europe Scenario F is identical to A but admixture can occur between HN males and HS females as well such that Vus un 7 Vun us Finally scenario G uses the same parameters as A but a different demographic model When a cell is colonized by HS it is directly filled at Kps with an initial proportion y of Neanderthals Admixture thus occurs when demographic equilibrium is already reached and not during the demographic growth as in the other models While the y values are the true parameters of our model they may not be very telling per se and we have therefore chosen to quantify levels of interbreeding between populations using another parameterization which corresponds to the average number of admixture events per deme between modern humans and Neanderthals By performing a large series of s
330. se par Dupanloup et al 2003 En effet une expansion d mographique et spatiale ancienne 4 000 g n rations permet d observer des distributions mismatch multimodales du type de celles observ es pour le chromosome Y en Europe soit lorsque le Nm de la population est r duit Figure 3 5a b soit lorsqu il existe un biais de recrutement dans les donn es Figure 3 5b d Une expansion d mographique dans une population de grand Nm sans aucun biais de recrutement peut au contraire tre compl tement exclue la vue des distributions mismatch produites Figure 3 5C Un second argument en faveur d une expansion d mographique commune la lign e femelle et la lign e male europ enne est l existence d une certaine constance dans la forme des distributions mismatch observ es qui montrent pour la plupart deux ou trois modes principaux localis s vers 0 4 et 8 differences Figure 3 4 En effet dans une population stationnaire on s attend observer une variance beaucoup plus grande M me si nos arguments ne se fondent que sur une observation visuelle il ne nous parait pas possible d exclure l hypoth se que la lign e m le europ enne soit pass e par une expansion d mographique au Pal olithique comme cela a t propos par Pereira et al 2001 et Dupanloup et al 2003 la lueur des distributions mismatch simul es ici et de leur comparaison avec les distributions mismatch r elles noter que la simulati
331. section 3 2 succede une seconde expansion qui correspond a la transition N olithique il y a environ 10 000 ans qui s est d roul e de fa on relativement contemporaine dans differentes regions du monde voir par exemple Ammerman et Cavalli Sforza 1984 pp 13 16 Bellwood 2001 Jobling et al 2004 et les references qui y sont mentionn es Evidemment les dates simul es sont approximatives mais elles permettent de tester notre mod le dans un cadre r aliste Nous reviendrons plus loin page 88 sur l influence du cadre temporel sur les donn es g n tiques simul es Nous avons donc proc d une s rie de simulations dans un monde simple homog ne pour K et F friction repr sent par une matrice carr e de 2 500 d mes L expansion pal olithique de la population CC pour chasseurs collecteurs prend sa source dans le deme central lt 25 25 gt Apres 3 600 g n rations une seconde expansion n olithique se d roule dans la matrice AG pour agriculteurs soit depuis la m me cellule centrale lt 25 25 gt soit depuis une cellule p riph rique lt 5 5 gt La population initiale est compos e de Ncc individus qui apparaissent in situ alors que dans le cas de la seconde expansion Nac individus sont tir s d un unique deme de la population CC pour creer la nouvelle population AG strat gie 1 Figure 9 16 dans l ANNEXE 4 Dans toutes les simulations la capacit de soutien de la population n olithique est sup rieure c
332. ses Lundstrom et al 1992 Aris Brosou et Excoffier 1996 Sanchez Mazas 2001b Reich et al 2002 Il faut donc tre capable de reconna tre les effets de l volution du g nome puis de les s parer de ceux provoqu s par l histoire d mographique d une population L influence des facteurs volutifs est encore bien souvent mal connue et il est difficile de s en affranchir Deuxi mement l histoire d mographique des populations est rarement simple le pass des populations humaines est constitu d une succession de processus complexes migrations contraction expansion etc qui se chevauchent souvent et dont l importance est variable Sokal 1991a Lahr et Foley 1998 Roebroeks 2003 Les interactions entre populations affinit culturelle comp tition assimilation sont galement d terminantes dans la mise en place de leur structure g n tique Sokal et al 1993 Cappello et al 1996 Sokal et al 1996 Larruga et al 2001 L influence de l environnement est Tout au long de ce travail nous utiliserons le terme signature pour d finir une structure g n tique particuli re qui r sulte d un sc nario d mographique donn Il faut pr ciser que l observation d une telle structure dans les populations r elles peut tre un indice en faveur de ce sc nario mais ne constitute pas une preuve pour autant puisque des structures g n tiques similaires peuvent tre g n r es par des processus diff rents d mographiq
333. si que de la constante y appel e taux d acculturation y correspond a la probabilit qu un contact entre un chasseur collecteur et un agriculteur r sulte en l adoption des techniques La vague d avanc e d mique du N olithique europ en est d finie comme une vague de migration des premiers agriculteurs depuis le Proche Orient une vitesse constante gale 1 Km par ann e Ammerman et Cavalli Sforza 1984 Selon cette th orie la contribution des chasseurs collecteurs indig nes est soit nulle soit tres faible Cette vague d avance e ne correspond pas a une migration dirig e d un lieu vers un autre mais un front de colonisation global cr sous l effet de nombreuses migrations a courte distance chaque tape la population d agriculteurs passe par une croissance d mographique Cette th orie a t passablement contest e Zvelebil 1986 Zvelebil et Zvelebil 1988 Zvelebil 1989 Harpending 2001 Mazuri de Keroualin 2001 Fiedel et Anthony 2003 43 n olithiques par le chasseur collecteur acculturation La valeur de cette constante a t fix e a 0 00024 sans que ne soit jamais mentionn e la source de cette valeur Selon Cavalli Sforza lui m me cette valeur provient d un congr s a Hawaii dans les ann es 70 communication personnelle Rendine et al ont appliqu leur mod le dans un milieu homog ne o les valeurs de Kec et de Kac sont constantes Figure 4 1 Aire virtuelle compos e de
334. simulation Database of migration rates and O Samples Origin deme sizes Carrying Friction capacity map 1 map NI or barriers to migration Different K values can also be assigned to reveal spatial differences in resource alloca tion Different maps of K and F can be used at different times to simulate environmental changes The maps to use and the time at which these changes occur are simply listed in input files The format for the input maps is ascii raster which can be generated by most cis packages A typical demographic simulation starts at one arbitrarily chosen deme whose size and geographical location can be defined by the user in an input file In each occupied deme a growth phase is followed by a migration phase The assumed growth model within deme is a standard logistic growth characterized by a user defined intrinsic rate of growth per generation r assumed constant over deme and over time and a carrying capacity K depending on the environment During the migration phase the number of emigrants for every deme is computed as N m where N is the local deme size at time t and m is the migration rate The number of emigrants can be allowed to vary stochas tically as a Poisson variable with mean Nr The number of emigrants sent to each neighbouring deme is chosen from a multinomial distribution with directional probabilities inversely proportional to the relative frictions of the neig
335. sont li es Ve gt pointe vers cell Worldmatrix repr sent par Simulation Stockage 4 cell Worldmatrix matrice de pointeurs StateDB S_DB vecteur de StatesOfCell LE IJI y StatesOfCell historique de N et des migrations Etat courant Index unique Celllndex Variables statiques TimeSto stockage des valeurs temporelles pour n g n rations Variables et m thodes d mographiques t t2 ts tn Figure 9 10 Sch ma des objets principaux et de leurs relations pour le module d mographique de SPLATCHE Les noms des classes des objets sont en italiques Voir le texte pour les explications StateDB StateDB est la classe qui contient la base de donn es d mographiques Elle poss de notamment un vecteur de pointeurs de dimension n o n est egal au nombre de Cell simulees Ces pointeurs sont dirig s vers des objets SfatesOfCell dont chacun contient l historique d une cellule donn e La position d un StatesOfCell dans le vecteur est gale l index num rique Celllndex de l objet Cell correspondant Chaque StatesOfCell contient 5 objets TimeSto qui sont des vecteurs de dimension t o t est gal au nombre de g n rations simul es Quatre TimeSto stockent les 184 immigrants provenant de chacune des cellules voisines alors que le 5 stocke la densit N de la cellule TDemeCollection La classe DemeCollection est l quivalent de la classe World pour
336. spara t seulement si Kg gt K4 cas 1 Figure 4 4a Dans le cas contraire un quilibre stable entre les deux populations s tablit Figure 52 4 4b Dans tous les cas la capacit de soutien K de la cellule est gale a la capacit de soutien la plus lev e des deux populations K max Ka KB Ce mod le utilisant des taux de comp tition fix s a priori n est pas applicable de fa on g n rale dans un environnement h t rog ne Par exemple dans certains milieux sp cifiques la population A peut tre favoris e alors que dans d autres milieux c est la population B qui est favoris e Dans un environnement h t rog ne les relations de competition sont diff rentes d un milieu l autre et ne peuvent donc pas tre fix es une fois pour toutes Mod le M2 Taux de competition d pendant de la densit Afin d viter le choix a priori des taux de comp tition entre populations nous avons d velopp un autre mod le plus g n ral pour lequel qas et ag ne sont pas fix s au d part mais varient au cours du temps en fonction des densit s de population Ceci refl te le fait que la population dont la densit est la plus forte dans une cellule au moment t est celle qui exerce le plus de comp tition sur l autre population Ainsi nous avons consid r que Ant Nes Eq 4 11 Ng Nat N A t C mh Nae Nae AVEC Cat Apart 1 Dans ce mod le l tat final du syst me d pend
337. ss Ray N Currat M amp Excoffier L 2003 Intra deme molecular diversity in spatially expanding populations Mol Biol Evol 20 76 86 Rendine S Piazza A amp Cavalli Sforza L 1986 Simulation and separation by principal components of multiple demic expansions in Europe Am Nat 128 681 706 Richards M 2003 The Neolithic invasion of Europe Annu Rev Anthropol 32 135 162 Richards M Corte Real H Forster P Macaulay V Wilkinson Herbots H Demaine A Papiha S Hedges R Bandelt H J amp Sykes B 1996 Paleolithic and neolithic lineages in the European mitochondrial gene pool Am J Hum Genet 59 185 203 Richards M Macaulay V Hickey E Vega E Sykes B Guida V Rengo C Sellitto D Cruciani F Kivisild T Villems R Thomas M Rychkov S Rychkov O Rychkov Y Golge M Dimitrov D Hill E Bradley D Romano V Cali F Vona G Demaine A Papiha S Triantaphyllidis C amp Stefanescu G 2000 Tracing European founder lineages in the Near Eastern mtDNA pool Am J Hum Genet 67 1251 76 Richards M Macaulay V Torroni A amp Bandelt H J 2002 In search of geographical patterns in European mitochondrial DNA Am J Hum Genet 71 1168 74 Richards M B Macaulay V A Bandelt H J amp Sykes B C 1998 Phylogeography of mitochondrial DNA in western Europe Ann Hum Genet 62 Pt 3 241 60 Rosser Z H Zerjal T Hurles M E Adojaan M Alavantic
338. ssli D Hubert Van Blyenburgh N Dard P 1992 Do most human populations descend from phylogenetic trees Human Evolution 2 47 61 Larruga J M Diez F Pinto F M Flores C Gonzalez A M 2001 Mitochondrial DNA characterisation of European isolates the Maragatos from Spain Eur J Hum Genet 9 708 16 Laval G Excoffier L 2004 SIMCOAL 2 0 a program to simulate genomic diversity over large recombining regions in a subdivided population with a complex history Bioinformatics Lee R B DeVore 1968a Problems in the study of hunters and gatherers In Lee RB DeVore eds Man the hunter Aldine Publishing Company Chicago pp 4 12 Lee R B DeVore 1968b Man the hunter Aldine Publishing Company Chicago Lev Yadun S Gopher A Abbo S 2000 Archaeology The cradle of agriculture Science 288 1602 3 Lewontin R C Kojima K 1960 The evolutionary dynamics of complex polymorphisms Evolution 14 450 472 Lewontin R C 1988 On measures of gametic disequilibrium Genetics 120 849 52 Livingstone F B 1989 Simulation of the diffusion of the B globin variants in the old world Human Biology 61 3 297 309 Lordkipanidze D 1999 The settlements of mountainous regions a view from the Caucasus Anthropologie 37 71 78 Lotka A J 1932 The growth of mixed populations two species competing for a common food supply Journal of the Washington academy of Sciences 22 461 469 Lubbock J 1865 Prehistoric times as illustrat
339. struction of the genealogy is independent of the mutational process Basically a number n of genes is chosen These genes are only identified by their number and they have no genetic variability during this first phase All the n genes are associated with a geographic position in the virtual world where the demography is simulated These genes could belong to different demes in the world Then going backward in time the genealogy of these genes is reconstructed until their most recent common ancestor MRCA in the following way Going backward in time at each generation two events can occur Coalescent event if at least two genes are on the same deme they have a probability to have a common ancestor at the preceding generation a coalescent event This probability depends on the population size of the deme where the genes are located Each pair of genes has a probability 1 N of coalescence if N 1s the number of haploid individual in the deme 7 If there are n genes on the deme then the probability of one coalescent event becomes n ni 1 2N Only one coalescent event is allowed per deme and per generation see Ray ef al 2003a for a discussion about this assumption Migration Each gene could have arrived with an immigrant from a different deme When going back in time it means that the gene could leave the current deme with the immigrant So the probability of migration from a deme i to a deme j for a gene depends on the numbe
340. t Comme un deme avec N individus diploides contient 2N copies d un g ne donn la probabilit d avoir un anc tre commun la g n ration pr c dente est gale 1 2N pour chaque paire de genes pr sents dans ce deme Si la population est haploide cette probabilit est gale 1 N La probabilit de coalescence P est donc inversement proportionnelle a la taille N de la population et d pend uniquement de cette derni re Dans SPLATCHE la densit N est tir e de la base de donn es virtuelle g n r e pendant la phase d mographique Si n lignages se trouvent dans un deme alors il existe n n 1 2 paires de lignages possibles La probabilit d avoir un v nement de coalescence pendant cette g n ration devient n n 1 4N lorsque la population est diplo de et n n 1 2N lorsqu elle est haplo de Une seule coalescence par d me et par g n ration est possible dans SPLATCHE Lorsqu une coalescence se produit alors le nombre total de lignages pr sents dans le monde virtuel est decremente d une unite 2 Migration Chaque lignage appartenant au deme a une probabilit m de migrer vers le deme voisin j au temps f Cette probabilit se calcule comme m Eq 9 1 o l est le nombre d immigrants qui sont arriv s dans le deme depuis le deme j pendant la phase d mographique et N est la densit de population du d me la g n ration t La migration d un lignage de vers j en remontant dans le temp
341. t gene lineages are less free to diffuse to different demes in the scattering phase when they are close to the border of the expansion range They would thus spend more time within the same deme and have therefore more time to coalesce The spatial diffusion constraints during the scattering phase would lead to an excess of recent coalescent events as compared with genes sampled in more central demes This suggest that the pattern of molecular diversity within samples should be affected by the presence of geographical barriers preventing a free diffusion of genes to neighboring demes for species having low dispersal abilities Note that this effect would be quite different from the reduced diversity expected in marginal populations and resulting from a demic diffusion process from a given source Rendine Piazza and Cavalli Sforza 26 1986 Sokal Oden and Wilson 1991 Barbujani Sokal and Oden 1995 where one would expect a loss of genetic diversity due to a succession of small founder effects However a clearer distinction between demographic and spatial expansions should emerge from the study of sam ples of genes taken from different demes which should be the object of a different study Recent Range Expansions as a Way to Examine Patterns of Dispersal from Single Samples Recent range expansions and speciations are thought to have been quite common in the Quaternary following or due to ice ages respectively for a review see e g
342. t faite de mani re parall le sur plusieurs continents Il est cependant tres difficile d interpr ter la structure g n tique des populations actuelles en termes d v nements historiques ou pr historiques et ces interpr tations ne peuvent se faire qu en troite liaison avec les connaissances tir es d autres sources comme l arch ologie ou la pal oanthropologie En effet si la variation des densit s et des migrations influence fortement la structure g n tique des populations ce ne sont de loin pas les seuls facteurs impliqu s D une part le genome a son propre mode d volution qui n est encore que partiellement compris et qui peut tre tr s variable en fonction des r gions chromosomiques D autre part des parties du g nome peuvent tre positivement ou n gativement s lectionn es au cours du temps cette s lection pouvant prendre des formes tr s variables et agir a des niveaux differents Finalement l environnement joue un r le pr pond rant dans la mise en 1 Voir par exemple Langaney 1988 pour une introduction sur de la diversit g n tique des populations humaines et de leur tude Voir Sanchez Mazas 2001a en frangais ou Excoffier 2002 en anglais pour une discussion a propos des diff rentes theories de l origine de l homme place de la structure g n tique des populations puisqu il agit non seulement sur la s lection qui s exerce sur leur genome mais galement tr s largement sur leur d mographie e
343. t leur r partition L influence du milieu est d autant plus importante que ses caract ristiques fluctuent en fonction des variations du climat Ces derni res ont t extr mement importantes pendant le dernier cycle glaciaire 120 000 derni res ann es qui a vu l apparition puis la diffusion d Homo sapiens sapiens Il est donc difficile d extraire la signature d v nements d mographiques pass s de la structure g n tique des populations De nombreuses recherches s y consacrent pourtant en inf rant des hypoth ses sur la d mographie des populations partir de donn es mol culaires p ex Mountain et al 1995 Pritchard et al 1999 Zhivotovsky et al 2003 Il est cependant n cessaire d avoir des mod les th oriques auxquels les donn es r elles peuvent tre confront es afin de retenir les hypoth ses les plus plausibles De nombreux mod les analytiques ont donc t d velopp s pour pr dire les signatures g n tiques attendues la suite d v nements d mographiques donn s comme une croissance ou une contraction d mographique ou comme le m tissage de populations ou leur s paration Ces mod les analytiques sont cependant limit s la fois par la complexit des processus d mographiques et par celle des donn es utilis es En effet si les g notypes comportent potentiellement plus d informations que les phenotypes leur complexit rend leur utilisation beaucoup plus difficile La simulation de processus com
344. t sampling effort and drift over the last 30 000 years Likelihood estimation was performed under a coalescent simulation framework For each scenario we estimated the likelihood of different admixture rates from 10 000 coalescent simulations as reported in Figure 3 Maximum likelihood estimates are obviously obtained for a total absence of interbreeding between HS and HN but here the interest lies in the upper limit of a 95 confidence interval still compatible with an absence of Neanderthal lineages in the European modern gene pool for the different scenarios We see that the scenarios A to F can be divided into three groups Scenarios A C and F lead to very similar upper bounds for the estimation of the maximum admixture rate 0 015 admixture events per deme see Table 5 Similarity of results obtained for scenarios A and C show that the fact that the origin of the spread of modern humans was diffused over a large area or concentrated at a single point does not substantially influence our results Also the implementation of fully symmetric interbreeding between HN and HS scenario F leads to results very similar to those obtained when we only allow breeding between HN females and HS males scenario A The place of origin for modern humans seems more important as a putative origin in Iran scenario B leads to even lower interbreeding rates 0 01 admixture events per deme than if the source is located closer to Europe as in scenario A Finally sce
345. t sur le chemin qui les m ne la source de l expansion pour que le MRCAX ait lieu avant d arriver sur ce lieu d origine Par cons quent plus un chantillonnage est effectu loin de la source d une expansion et plus la probabilit que le MRCA de cet chantillon se trouve le long de l axe entre le lieu d chantillonnage et cette source est grande En revanche il est extr mement rare que l anc tre commun tous les chantillons MRCA se trouve sur cet axe puisque les 1 000 MRCA simul s pour l ensemble des 5 chantillons Figure 9 14F se trouvent dans le d me source de la population 191 A Irlande B Angleterre C Allemagne D Roumanie E Turquie F Total MRCA Figure 9 14 A D Distribution spatiale de 1 000 MRCAx voir texte simul s pour chacun des 5 chantillons de 40 g nes croix noires apr s la dispersion d une population depuis le Proche Orient fl che noire F distribution des 17000 MRCAr pour la totalit des 5 chantillons Les pixels noirs repr sentent les d mes dans lesquels ont eu lieu au moins un MRCA alors que les pixels de terre gris repr sentent les d mes dans lesquels la densit de MRCA est la plus lev e 192 ANNEXE 4 Modifications du programme SPLATCHE afin de simuler les interactions entre deux populations diff rentes Cette annexe pr sente des modifications apport es au programme SPLATCHE afin de permettre la simulation de deux populations en interaction selon le m
346. tation des distributions mismatch des populations humaines doit tre faite avec une grande prudence puisque d une part la variance de ces distributions peut tre grande particuli rement dans les populations de faible densit et d autre part diff rents sc narios d mographiques peuvent donner des distributions mismatch ainsi que des statistiques intrad mes tr s semblables Malgr cela nous avons montr dans ce chapitre que les distributions mismatch unimodales observ es dans la majorite des populations post n olithiques europ ennes Figure 4 26 ne peuvent pas r sulter d un remplacement complet des chasseurs collecteurs la p riode n olithique Nos simulations ont en effet montr que lors d un remplacement complet des chasseurs collecteurs un premier mode centr sur la classe O est toujours observ dans les populations p riph riques a la zone d origine du N olithique Cette observation est ind pendante de la taille initiale de la population n olithique Figure 4 18 De plus la r gularit avec laquelle ces distributions en cloche sont observ es dans les populations europ ennes Di Rienzo et Wilson 1991 Bertranpetit et al 1995 Sajantila et al 1995 Calafell et al 1996 Comas et al 1996 Corte Real et al 1996 Francalacci et al 1996 Comas et al 2000 Malyarchuk et Derenko 2001 Nasidze et Stoneking 2001 suggere m me une contribution g n tique indig ne importante lors du N olithique puis
347. te appartenant au genre Homo p ex Schwartz et Tattersall 1996 Tattersall et Schwartz 1999 mais certains auteurs comme Wolpoff 1996 les consid rent comme une variante de notre propre esp ce Homo sapiens neandertalensis Nous utiliserons la premiere nomenclature dans ce travail 41 Hublin 2002 tout comme les agriculteurs avec les chasseurs collecteurs Hyden 1990 Spielmann et Eder 1994 p 317 Van Andel 2000 Bien que des simulations du remplacement des chasseurs collecteurs europ ens par les agriculteurs n olithiques aient d j t effectu es voir section 4 2 les programmes utilis s n ont jamais t mis la disposition du public Nous avons donc d d velopper notre propre outil de simulation pour tudier cette p riode de transition ainsi que celle de l arriv e des premiers hommes modernes en Europe Nous avons d cid d adapter le logiciel SPLATCHE afin que deux populations diff rentes puissent voluer simultan ment dans une aire g ographique virtuelle La version de base de SPLATCHE pr sent e dans le chapitre 2 ne permet en effet que de simuler la diffusion d une population unique dans un monde pr alablement vide Parall lement la modification de SPLATCHE il a t galement n cessaire de d velopper notre propre mod le d mographique afin de simuler de mani re r aliste les interactions entre deux populations voluant dans la m me aire g ographique En effet aucun des mod les r per
348. tegory numbers must correspond to the numbers found in the input vegetation dataset see previous chapter Example of veg2K txt file Tropical_rainforest Monsoon_or_dry_forest Tropical_woodland Tropical serub Tropical_semi_desert Tropical_grassland Tropical_extreme_desert 50 Savanna Broadleaved_temperate_evergreen_forest Montane_tropical_forest Open_boreal_woodlands Semi_arid_temperate_woodland 162 SPLATCHE User Manual By having several corresponding tables for the carrying capacity and or the friction values it is then possible to simulate a change in the environment through time 3 5 Graphical outputs window Graphical Outputs Display Windows DRAM Diepla Density C Migratio ME active cells 2500 Density OOM 0 Mb roms 5 How neratiornz 204 6 f 5 7 NE columns 5 Cal 3 Le Save ta a Carr Cap C Occupation Arrival time Figure 3 2 Graphical Outputs panel The numbers correspond to a description in the text a 2 fd 2 Legend for the current display Buttons allowing to save the legend as a bitmap Radio button for the choice of color or shades of gray display Information on the number of active cells cells having information for the vegetation the number of rows and the number of columns Information on the density the number of rows and the number of columns when the mouse cursor 1s over a pa
349. thal lineages in the current gene pool of modern humans over all the simulated demes was obtained from 10 000 simulations Standard deviations are shown in italic Demographic scenarios A The basic scenario with realistic parameters B identical to A with an origin in Iran at the extreme East of the simulated area C identical to A but with a diffused source area consisting in 25 demes at Kys 40 instead of only one deme D identical to A with rs 0 8 and Kman adjusted to 25 in order to obtain realistic colonization times E identical to A with a migration rate of mys increased to 0 5 and Kyy adjusted to 25 as in D F identical to A with interbreeding resulting in symmetrical transfer of genes between modern humans and Neanderthals G identical to A but with a modified demographic model with carrying capacity Kps being reached instantaneously and with a local recruitment of yKys Neanderthal lineages In this scenario there is thus a single event of admixture at demographic equilibrium and no logistic growth Kun carrying capacity of Neanderthal demes Kps carrying capacity of modern human demes rus intrinsic rate of growth of modern human per generation mys migration rate between adjacent modern human demes P In generation The different rates of admixture are given in number of admixture events per deme For instance a value of 1 10 implies an average of one admixture event for 10 demes for the whole period of cohabitation between N
350. that value DNA sequence data We have implemented here several simple finite sites mutational models The user can specify the percentage of substitutions that are transitions the transition bias the amount of heterogeneity in mutation rates along a DNA sequence according to either a discrete or continuous Gamma distribution We can therefore simulate DNA sequences under a Jukes and Cantor model Jukes et Cantor 1969 or under a Kimura 2 parameter model Kimura 1980 with or without Gamma correction for heterogeneity of mutation rates Jin et Nei 1990 Other mutation models that depend on the nucleotide composition of the sequence were not considered here because of their complexity and because they require specifying many additional parameters like the mutation transition matrix and the equilibrium nucleotide composition Standard data Following the definition given in Arlequin User Manual Schneider et al 2000a this type defines data for which the molecular basis is not particularly defined such as mere allele frequences The comparison between alleles is done at each locus For each locus the alleles could be either similar or different 4 3 Input files 4 3 1 Genetic samples A file with the extansion sam allows to specify the localization of the population sampled as well as the number of genes sampled in each population On the first line of this file the user can specify the number integer of population sampled
351. thin the Neolithization front depends on y the amount of gene flow between the two layers so that smaller y values translate into larger numbers of coalescent events The number of migrants exchanged between demes from the HG layer Nem does not affect the genetic pattern results not shown and low Nygm values only slightly increase the number of coalescent events that occurs within the HG population The influence of r4 on the coalescent tree is negligible Importance of the migration front Our simulations underline the role of the range expansion processes for generating AFCs The colonization process corresponds to a succession of founder effects occurring at the wave front Austerlitz et al 2000 In a coalescent perspective the lineages that are spread over a wide area are gathered and concentrated by the contracting wave front and have thus an increased probability to coalesce during the contraction of the occupied territory Our simulations reveal that AFCs are extremely rare for randomly chosen SNPs but that they become very frequent in case of an ascertainment bias consisting in selecting SNPs with minor allele frequencies larger than 5 Table 1 Since gene genealogies resulting from a range expansion have usually long terminal branches Excoffier 2004 Ray et al 2003 SNP mutations will most of the time occur on these terminal branches and will consist in singletons when the number of migrants exchanged between neighboring demes i
352. thique chapitre 6 Le g nome mitochondrial europ en est compatible avec une forte contribution des chasseurs collecteurs pal olithiques dans le patrimoine g n tique f minin lors de la transition n olithique section 4 5 4 et chapitre 6 Cette observation va l encontre de certaines estimations faites pour le chromosome Y qui semble avoir t affect de fa on plus importante par les agriculteurs proche orientaux Si cette hypoth se venait tre confirm e par l tude d autres locus elle pourrait tre expliqu e par une transmission des techniques agropastorales davantage par voie masculine que par voie f minine Le choix des types de polymorphismes tudi s s quence SNP RFLP STR allozyme est d une tres grande importance lors de la comparaison entre diff rents syst mes g n tiques Par exemple la difference dans les distributions mismatch observ es en Europe pour les hommes et les femmes peut tre due au type de donn es tudi es et non une difference d mographique entre les deux lign es En effet le syst me g n tique sp cifique a la lign e male la partie non recombinante du chromosome Y MSY a t type principalement avec des SNPs et des STRs alors que celui sp cifique la lign e f minine le g nome mitochondrial est principalement tudi par des s quences d ADN Or les chantillons compos s de SNPs et de STRs sont sujets a un biais de recrutement beaucoup plus imp
353. thropological archaeology 7 329 372 Bentley R A Price T D L ning J Gronenborn D Wahl J Fullagar P D 2002 Prehistoric migration in Europe Strontium Isotope Analysis of Early Neolithic Skeletons Current Anthropology 43 799 804 Bentley R A Chikhi L Price T D 2003 The Neolithic transition in Europe comparing broad scale genetic and local scale isotopic evidence Antiquity 77 63 65 Bernatchez L Glemet H Wilson C C Danzmann R G 1995 Introgression and fixation of Arctic char Salvelinus alpinus mitochondrial genome in an allopatric population of brook trout Salvelinus fontinalis Canadian Journal of Fisheries and Aquatic Science 52 179 185 Bertranpetit J Sala J Calafell F Underhill P A Moral P Comas D 1995 Human mitochondrial DNA variation and the origin of Basques Ann Hum Genet 59 Pt 1 63 81 Binford L R 2001 Constructing frames of reference An analytical method for archaeological theory building using hunter gatherer and environmental data sets University of California Press Berkeley Biraben J N 1979 Essay on the evolution of numbers of mankind Population 34 13 25 Biraben J N 2003 L volution du nombre des hommes Population et Soci t s 394 1 4 Birdsell J B 1957 Some population problems involving Pleistocene man Cold Spring Harbor Symposium on Quantitative Biology 22 47 69 Birdsell J B 1968 Some predictions for the Pleistocene based on equilibrium systems among recent h
354. tion n est pas prise en compte ou lorsque l on se trouve dans un milieu homog ne alors D est gal a 0 25 dans toutes les directions Le nombre d emigrants dans chacune des quatre directions devient alors 58 MN Ei 7 Eq 4 17 4 3 2 2 Migrations interpopulationnelles ou hybridation Le flux g nique entre les deux populations A et B peut tre mod lis par des migrations d une population vers l autre Ces migrations interpopulationnelles correspondent aux effets des mariages mixtes entre individus appartenant chacune des deux populations Il faut noter que dans le cas de la simulation du N olithique europ en les migrations interpopulationnelles repr sentent galement l adoption de l agriculture par les chasseurs collecteurs un ph nom ne aussi appel acculturation Ammerman et Cavalli Sforza 1984 Les cons quences g n tiques d un v nement d acculturation sont identiques a celles d un mariage mixte Dans les deux cas un individu appartenant une des populations va avoir au moins un anc tre dans l autre population la g n ration pr c dente La probabilit d un mariage mixte d pend troitement des densit s respectives des deux populations dans une cellule Le nombre total de mariages possibles dans une cellule est gal N N N N 4 Le nombre de mariages mixtes possibles dans la m me cellule est gal a 9 4 La 4 probabilit d un mariage mixte parmi tous les mariages p
355. tion pr c dente 4 2 mais offre de nombreux avantages que nous mentionnerons dans la section 4 4 Il permet de simuler non seulement la diffusion de deux populations dans l espace mais galement des changes g n tiques et de la comp tition entre elles La dynamique des deux populations que nous nommerons A et B peut tre d compos e en deux parties r gulation d mographique intra deme et ii migrations d individus entre d mes voisins de la m me population ou entre populations diff rentes 4 3 1 R gulation d mographique intra d me Sans tenir compte d ventuelles migrations et sous l hypoth se de conditions environnementales stables les variations de la densit d une population au cours du temps d pendent de la difference entre le taux de natalit et le taux de mortalit Cette difference peut tre r sum e par r le taux intrins que de croissance Begon et al 1996 p 165 En th orie une population qui vit dans un milieu sans aucune contrainte suivrait un accroissement d mographique exponentiel infini du type Nisa M rN Eq 4 7 ou N est gal la densit au temps t Begon et al 1996 p 246 Lorsque r gt 1 la population est en croissance et lorsque r lt 1 elle d cro t Or ce mod le ne correspond pas aux populations r elles puisque la croissance d mographique de celles ci est limitee par la quantite de ressources disponibles qui ne sont evidemment pas infinies Une comp tition
356. tionnelles m ss 71 4 5 2 4 Hybridation interpopulationnelle y sise 71 452 5 Temps de Comabitation e at tect ential dec NN ARS CR Se nn nr 71 AD 2 6 Param tres UtliSES tes pcre a na a AN ne tae 73 4 5 3 Influence des param tres Sur la diversit mol culaire 74 49531 Miye de Niels miel eue eine need 78 ASA IWMNUENGS dE NGC En Cr nt te Meet Re NA nn ner ee Atlas 78 4 5 3 3 Influence des taux de croissance AG et cc iii 79 4 5 3 4 Influence du goulet d tranglement teenet 80 4 5 3 5 Influence du taux d hybridation 7 85 4 5 3 6 Cadre temporel et taux de mutation iii 88 ADO FOME du Mondes een Re Ps Ut ieee 89 4 5 4 DISCUSSION to NN sre dent AN a e 90 46 CONCLUSION PR RO EE PE UE 92 5 EXPANSION DES HOMMES MODERNES EN EUROPE cccceccceeeeeceeeeeeeeseeeeeeeeeeeeeens 95 SL ON TRODUCHONE Sa D a R 95 5 2 CONTRIBUTION DES NEANDERTALIENS AU PATRIMOINE G N TIQUE DES HOMMES MODERNES 95 Jal ANCO a a a ead eee eat eet naa el eae 98 6 EXPANSION DES POPULATIONS NEOLITHIQUES EN EUROPE 117 6 1 INTRODUCTION SR Rd E AE its ces N e dia Ces ea oi tn 117 6 2 DIVERSITE GENETIQUE EN EUROPE APRES LE NEOLITHIQUE ccccccececececececececececececacavaeers 118 6 2 1 ICE nd PS A et at me 121 7 DISCUSSION GENERALE Q ui ccccccssssseeccccccceccccecssssccccccccccceccccesseccccccec
357. tir sur un nombre restreint de locus Il faut noter qu un gradient SE NO pourrait galement tre expliqu par la diff rence entre deux anciennes populations situ es chacune de ses extr mit s La signature g n tique commune toutes les populations europ ennes pourrait donc tre le r sultat d une expansion d mographique r cente lt 100 000 ans a partir de l est du continent vraisemblablement du Proche Orient Deux v nements d mographiques principaux peuvent potentiellement avoir g n r cette signature II s agit premi rement de l arriv e des premiers Homo Sapiens sapiens en Europe il y a environ 45 000 ans Otte 2000 et deuxiemement de la transition N olithique qui a d but au Proche Orient il y a plus de 10 000 ans Harris 1996 Whittle 1996 Thorpe 1999 Mazuri de Keroualin 2003 Ce sont donc ces deux v nements que nous nous int ressons dans ce chapitre l aide de l approche par simulation pr sent e dans le chapitre 4 Nous voulons savoir quels sc narios d mographiques simul s lors de ces phases de peuplement peuvent tre associ s avec la Structure g n tique des populations actuelles Nous pr sentons ci dessous un article soumis publication section 6 2 1 6 2 Diversit g n tique en Europe apr s le N olithique Le N olithique correspond une p riode de transition extr mement importante dans la pr histoire humaine le passage de la phase de collecte de nourritu
358. tori s dans la litt rature Rendine et al 1986 Barbujani et al 1995 Aoki 1996 Aoki et al 1996 Flores 1998 ne permet de simuler de mani re ad quate la fois des changes g n tiques et de la comp tition entre populations Dans ce chapitre nous d crivons donc un mod le d mographique qui impl ment dans SPLATCHE permet de simuler les interactions entre deux populations en comp tition sections 4 3 et ANNEXE 3 La description est faite de mani re tr s g n rale afin que ce mod le tel quel ou l g rement modifi puisse tre ult rieurement utilis dans d autres contextes Seuls les cas particuliers du mod le utilis s dans les applications pr sent es dans les chapitres 5 et 6 sont test s ici de fa on intensive Le comportement de notre mod le en fonction de ses diff rents param tres est tudi dans un cadre identique celui utilis dans le chapitre 3 Cela nous permet de comparer la variabilit g n tique obtenue apr s une expansion d mographique et spatiale soit dans une aire pr alablement vide section 3 2 soit dans une aire d j peupl e section 4 5 Nous discuterons les diff rences observ es dans les g n alogies et sur les distributions mismatch dans les deux situations 4 5 4 4 2 Differents modeles d expansion de populations humaines dans une aire occupee Dans cette section nous faisons une revue critique de certains mod les d expansion de populations humaines dans une aire
359. tory in a natural model system Genetics 151 797 801 Harpending H C M A Batzer M Gurven L B Jorde A R Rogers and S T Sherry 1998 Genetic traces of ancient demography Proc Natl Acad Sci USA 95 1961 1967 Hewitt G 2000 The genetic legacy of the Quaternary ice ages Nature 405 907 13 Hey J 1991 A multi dimensional coalescent process applied to multi allelic selection models and migration models Theor Popul Biol 39 30 48 Hudson R R 1990 Gene genealogies and the coalescent process Pp 1 44 in D J Futuyma and J D Antonovics eds Oxford surveys in evolutionary biology Oxford University Press New York Kingman J F C 1982a The coalescent Stoch Proc Appl 13 235 248 1982b On the genealogy of large populations J Appl Proba 19A 27 43 Lewin R 1988 New views emerge on hunters and gatherers Science 240 1146 1148 Lundstrom R S Tavar and R H Ward 1992 Modeling the evolution of the human mitochondrial genome Math Biosci 112 319 335 Marjoram P and P Donnelly 1994 Pairwise comparisons of mitochondrial DNA sequences in subdivided populations and 27 Molecular Diversity in Spatially Expanding Populations 85 implications for early human evolution Genetics 136 673 683 Maruyama T 1971 Analysis of population structure II Two dimensional stepping stone models of finite lengths and other geographically structured populations Ann Hum Genet
360. train et un repas m di val m morable mais aussi les joies et les doutes quant au d roulement de nos travaux respectifs Je tiens le remercier pour sa gentillesse et son amiti Mes officemate successifs m ont donn la possibilit par leur enthousiasme et leur patience de travailler dans un environnement agr able motivant et dynamique Je remercie particuli rement Sim Poloni pour sa gentillesse et sa disponibilit je n avais en effet pas puis mon stock de questions pendant mon dipl me ainsi que Johan Renquin pour nos nombreuses discussions scientifiques et footballistiques Je tiens remercier galement Lucia Simoni Yann Beyer et Lele Reckeweg David Roessli a fait preuve d une tr s grande disponibilit pour m aider r soudre les nombreux probl mes informatiques que j ai rencontr s durant mon travail Ses conseils avis s dans de nombreux autres domaines ont galement t extr mement b n fiques la finalisation de cette th se Pierre Berthier n a pas m nag ses efforts pour mettre sur pied et entretenir de fa on exemplaire le cluster informatique du CMPG Sans son travail les tudes pr sent es dans ce manuscrit n auraient tout simplement pas pu voir le jour avant 2010 au moins Ma reconnaissance va galement aux membres du LGB que j ai eu la chance de c toyer St phane Buhler Stefan Schneider Isabelle Dupanloup Ninian Hubert Van Blyenburgh Patricia Dard J r me Goudet Alexandra Mossi
361. tribution globale 90 soit tres importante Par cons quent pour que la signature g n tique de l expansion n olithique soit d celable dans la population actuelle il faut obligatoirement que le remplacement de la population indig ne ait t tr s fort A l inverse la signature g n tique de l expansion pal olithique dans la population actuelle ne dispara t jamais quelle que soit l importance du goulet n olithique et de la contribution indig ne Lorsque plusieurs croissances d mographiques simples se succ dent dans une population non subdivis e il est impossible de diff rencier leur signature g n tique respective A l inverse nous avons montr l aide de nos simulations que deux expansions d mographiques et spatiales qui se succ dent peuvent tre distingu es dans la structure g n tique des populations Cependant plus ces expansions spatiales sont proches temporellement et plus il est difficile de diff rencier leurs signatures g n tiques puisque le r sultat des coalescences qui ont lieu aux diff rentes p riodes S1 C7 ou C2 se confondent Les modes g n r s dans la distribution mismatch par chacune des deux expansions fusionnnent Figure 4 23 Plus deux expansions sont proches temporellement et plus il est n cessaire d utiliser des locus ayant un fort taux de mutation pour pouvoir distinguer leur trace dans les donn es mol culaires intrapopulationnelles Ces r sultats sugg rent que l interpr
362. tructure g n tique observ e pour soutenir une hypoth se de peuplement si l on ne conna t pas la signature th orique attendue Actuellement des structures g n tiques attendues pour des mod les simples sont connues comme la signature laiss e par une croissance d mographique instantan e dans une population non subdivis e Tajima 1989b Slatkin et Hudson 1991 Rogers et Harpending 1992 King et al 2000 la r duction de sa densit Excoffier et Schneider 1999 Wahl ef al 2002 ou le m tissage de plusieurs populations Chikhi et al 2001 Ce chapitre est donc consacr au d veloppement d un outil informatique permettant d tudier les cons quences d un v nement d mographique sur la constitution g n tique d une ou de plusieurs populations Cette approche vise a donner un cadre th orique l interpr tation de donn es g n tiques r elles en permettant la comparaison avec la structure g n tique obtenue selon une hypoth se de peuplement donn e Ce cadre n est pas aussi pr cis que celui offert par des mod les analytiques mais il a l avantage de permettre la simulation de processus plus complexes insolubles analytiquement L augmentation r cente des capacit s informatiques permet galement de pousser beaucoup plus loin la complexit des mod les simul s et de traiter une quantit d informations plus importante Cela permet galement de tenir compte de la variabilit stochastique des processus g n tiques au niveau
363. ts W population density rere eae 17 19 occupation occupation Build orld Bee Show results Figure 3 1 General Setting panel The numbers correspond to a description in the text 3 3 1 General 1 Settings file name location of the settings file txt See chapter 3 4 2 for the full description of a settings file 2 Buttons allowing to open a settings file or to save a settings file Progress bar showing the remaining computation time of a current simulation The duration of a simulation in seconds is also given at the end of the computation 158 SPLATCHE User Manual 3 3 2 Demography related parameters Drop down menu allowing to choose among the three available demographic models generation It can be set in order to get the real time while browsing the results in the Graphical outputs window g Number of simulated generations The generation time is the number of time units par 6 Growth rate used in the demographic models This is the net growth rate used in the logistic growth phase Migration rate used in the demographic models The migration rate m is the fraction of the deme population that will migrate out at each generation For a deme population of size N the number of emigrants is then equal to N m at each generation Checkbox to allow the initial density overflow If this checkbox is switched on and the size of the initial population exceeds the carrying capacity of the deme the initial
364. ts puisque la phase de coalescence se d roule en remontant le temps Il est donc n cessaire de conna tre le nombre de genes tant arriv s dans un deme ainsi que leur deme d origine voir aussi l Annexe 2 1 Dynamique environnementale La version publique de SPLATCHE permet uniquement la simulation d un monde statique pour lequel les variables environnementales ne fluctuent pas au cours du temps En revanche la version en d veloppement du logiciel FRICTION permet de modifier ces variables toutes les n g n rations Figure 9 1 Cette implementation permet de mod liser la dynamique de l environnement sous l effet des variations du climat Les changements du niveau des mers ainsi que les changements de v g tation lors des p riodes de r chauffement ou de refroidissement peuvent ainsi tre pris en compte Nous n aborderons pas de fa on plus approfondie cet aspect de 175 FRICTION ici puisque nous ne Iutilisons pas directement dans ce travail et qu il a t d crit de fa on d taill e dans Ray 2003 Annexe 2 2 Module genetique Le module g n tique ne peut pas tre utilis ind pendamment du module d mographique puisqu il utilise la base de donn es g n r e par ce dernier comme param tre d entr e Le module g n tique est d riv du logiciel SIMCOAL Excoffier et al 2000 dont les matrices de densit et de migration ont t remplac es par la base de donn es g n r e par le module d mographique de
365. ts g n tiques Nous avons galement montr dans cette tude que les distributions mismatch unimodales montrees par la presque totalit des populations europ ennes Di Rienzo et Wilson 1991 Bertranpetit et al 1995 Calafell et al 1996 Comas et al 1996 Corte Real et al 1996 Francalacci et al 1996 Malyarchuk et Derenko 2001 Nasidze et Stoneking 2001 except les Saamis Sajantila et al 1995 sont compatibles avec une forte contribution pal olithique dans le patrimoine mitochondrial Notre m thode ne permet cependant pas d estimer pr cis ment cette contribution En revanche il nest pas possible de tirer une quelconque conclusion sur la contribution des chasseurs collecteurs dans la lign e masculine sur la base des distributions mismatch calcul es l aide de SNPs localis s sur le chromosome Y En effet nos simulations montrent que les distributions mismatch tir es de donn es pour lesquelles il existe un biais de recrutement sont majoritairement multimodales quel que soit le sc nario d mographique simul Le biais de recrutement a donc tendance effacer la signature des v nements d mographiques dans les distributions mismatch 6 2 1 Article Page suivante 121 SNP diversity in Europe after a range expansion The effect of the Neolithic expansion on European molecular diversity Running title SNP diversity in Europe after a range expansion tt Mathias Currat and Laurent Excoffie
366. tually exchange migrants and that one is able to define the geographical limit of the deme The validity of these two assumptions is generally quite difficult to assess and would not be required from the analysis of single samples We are therefore confident that the analysis of patterns of molecular diversity from single deme samples would allow one to get important insights on the life history of the numerous populations having gone through recent range expansions Acknowledgments Thanks to Pierre Berthier and Stefan Schneider for their computing and programming assistance We are grateful to Grant Hamilton for his careful reading of the manuscript and to Montgomery Slatkin and Henry Harpending for their comments on an earlier version of the manuscript We are also indebted to John Wakeley for his many suggestions helping to improve various aspects of the manuscript This work was supported by a Swiss NSF grant No 31 054059 98 to L E Literature Cited Aris Brosou S and L Excoffier 1996 The impact of population expansion and mutation rate heterogeneity on DNA sequence polymorphism Mol Biol Evol 13 494 504 Barbujani G R R Sokal and N L Oden 1995 Indo European origins a computer simulation test of five hypotheses Am J Physical Anthropol 96 109 132 Beaumont M A 1999 Detecting population expansion and decline using microsatellites Genetics 153 2013 2029 Beerli P and J Felsenstein 1999 Maximum l
367. types d environnements sont pris en compte Plaine Montagne et Mer Ce concept est n anmoins tres int ressant puisqu un individu aura plus ou moins de chances de migrer dans un d me voisin en fonction du type d environnement de celui ci Les inconv nients du mod le de Barbujani ef al 1995 sont les suivants i La population CC ne dispara t jamais puisqu en 440 g n rations simul es l amplitude de S n est pas suffisante pour mener CC une extinction Or la disparition des chasseurs collecteurs en Europe est un fait av r ii La valeur de la probabilit d acculturation y est reprise de l article de Rendine et al 1986 et est gard e constante pour toutes les simulations sa valeur est gale 0 00024 Le monde tant homog ne Kcc vaut 114 et Kac vaut 7560 S est toujours inf rieur 0 1 Le taux d acculturation est donc tr s faible le maximum tant d un migrant toutes les 10 g n rations Comme la population CC ne dispara t jamais cette faible probabilit d acculturation permet tout de m me d observer au maximum une quarantaine de migrations par d me pendant la totalit des 440 g n rations simul es Selon Barbujani le nombre de migrants par acculturation devrait plut t approcher 1 individu par g n ration la lumi re des donn es r centes communication personnelle 46 iii Le probleme de la signification exacte de y et de sa valeur subsiste De m me que l impossibilit de faire vari
368. u g nome est sans doute encore plus importante lorsqu aucune extinction n a lieu puisque la possibilit d changes g n tiques est alors accrue Cette constatation permet d expliquer des observations d envahissement g n tique faites pour diff rents organismes comme les truites Bernatchez ef al 1995 ou les criquets Shaw 2002 Elle permet galement d expliquer pourquoi les invasions r centes des peuplades qui ont impose leur langage aux autochtones n ont quasiment pas d effet sur le patrimoine mitochondrial comme c est le cas en Hongrie Semino et al 2000b dans le Caucase et en Turquie Calafell et al 1996 Lorsque une population est subdivis e il faut qu elle soit quasiment enti rement remplac e par une autre pour que toute trace de son patrimoine g n tique disparaisse M me un grand nombre de g n rations est insuffisant pour faire dispara tre compl tement les lignages de la population envahie par d rive g n tique 144 Nos simulations sugg rent d une part que les N andertaliens n ont quasiment pas contribu a notre patrimoine g n tique et qu ils peuvent donc tre consid r s comme faisant partie d une branche volutive teinte apparentee mais distincte de celle de notre esp ce D autre part il est tr s vraisemblable que le patrimoine g n tique des chasseurs collecteurs qui peuplaient le continent europ en pendant le Pal olithique et le M solithique ait subsist dans une proportion importante
369. ubdivided Slatkin and Hudson 1991 Rogers and Harpending 1992 Rogers 1995 Weiss Henking and von Haeseler 1997 Excoffier and Schneider 1999 with some exceptions e g Molecular Diversity in Spatially Expanding Populations 81 Nm 10 qu Tee T T T T T OMG M6 M TA 164918520 CERN Pa E O Br TO A2 TA Ge 1er 220 ho ER ER RS DE EE T 0 2 4 6 8 10 12 14 16 18 20 Nm 500 0 2 4 6 8 10 12 14 16 18 20 o 2 4 8 8 10 12 14 16 18 20 0 as ot EE I A 0 2 4 6 8 10 12 14 16 18 20 0 0 2 4 6 8 WO A2 4e 161 18 20 Fic 4 Mismatch distributions obtained for single realizations of the coalescent after a spatial expansion for demes exchanging either a low Nm 10 or a large Nm 500 numbers of genes each generation with neighboring demes Marjoram and Donnelly 1994 Under this paradigm unimodal mismatch distributions have been interpreted as being due to past demographic expansions Slatkin and Hudson 1991 Rogers and Harpending 1992 However although it is true that most human populations show approximately unimodal mismatch distributions compati ble with Pleistocene population expansions fig 6A almost all present or recent hunter gatherer groups show very ragged distributions and in particular a high pro portion of pairs of sequences that are similar thus showing no differences fig 6B This contrast has been interpreted as the conseq
370. uence of a recent post Neolithic contraction Table 2 Influence of the Sampling Location and the Expansion Origin on Patterns of Molecular Diversity Expansion Sampling Origin Location Nm T Var n S Var S D P D lt 0 05 Fs P Fs lt 0 05 Periphery Periphery 10 6 6 11 8 34 7 60 5 0 86 0 08 0 04 0 00 Periphery Center 10 6 9 11 0 40 3 Tet 1 16 0 22 0 52 0 01 Center Periphery 10 6 6 11 8 34 3 54 6 0 82 0 07 0 09 0 01 Center Center 10 7 0 11 7 41 7 75 7 S20 0 26 0 42 0 01 Periphery Periphery 500 8 0 7 4 94 4 65 0 S25 1 00 22 89 1 00 Periphery Center 500 8 0 7 4 95 7 65 9 D 1 00 2321 1 00 Center Periphery 500 7 9 a3 93 2 77 6 2 93 1 00 23 10 1 00 Center Center 500 8 0 JE 96 0 69 2 2 35 1 00 23 13 1 00 NoTE Center refers to the central deme in our simulated array of 50 X 50 demes It is thus located at position lt 25 25 gt periphery of the simulated array at position lt 5 5 gt The remaining headers are identical to those described in table 1 23 Periphery refers to a deme located in the 82 Ray et al Nm 10 w 1 __ K 100 ys maa E 12 H G3 K 500 ae m 0 02 2 W 16 E e K 1 000 m 0 01 K 10 000 m 0 05 G24 hh af Le ee oe ae G 4 86 8B WH 14 16 185 i WW Ww 1 ZX Fic 5 Mismatch distributions obtained for three different combinations of carrying capacities A and proportion
371. ues ou non voir texte galement pr pond rante puisque celui ci joue un r le non seulement sur les migrations Brion et al 2003 et les densit s Aborgast et al 1996 Housley et al 1997 de Menocal 2001 mais peut aussi agir comme facteur s lectif sur une partie du genome Haldane 1949 Allison 1954 Sanchez Mazas 2001b Currat et al 2002 De plus les caract ristiques environnementales voluent au cours du temps sous l effet de la variation du climat Adams et Faure 1997 Lahr et Foley 1998 Allen et al 1999 Tous ces facteurs doivent donc tre pris en compte lors de l utilisation de donn es g n tiques pour retracer l histoire d une esp ce Malgr la complexit des processus volutifs et d mographiques il est cependant possible d effectuer des inf rences sur l histoire des populations partir de donn es g n tiques En effet des v nements d mographiques majeurs peuvent avoir laiss des traces Menozzi et al 1978 Sokal 1991b observables avec un chantillonnage ad quat Sokal et Jacquez 1991 Ces traces peuvent d ailleurs tre tr s diff rentes en fonction du type de donn es g n tiques analys es Kittles et al 1999 Pour inf rer un v nement d mographique par lequel est pass e une population partir de donn es g n tiques il faut conna tre la signature g n tique attendue apr s cet v nement en dehors de toute influence perturbatrice Il est en effet difficile d utiliser une s
372. um Genet 67 1287 95 Casalotti R Simoni L Belledi M G B 1999 Y chromosome polymorphisms and the origins of the European gene pool Proc R Soc Lond B Biol Sci 266 1959 1965 Cavalli Sforza L 1996 The spread of agriculture and nomadic pastoralism Insights from genetics linguistics and archealogy In Harris DR ed The Origins and Spread of Agriculture and Pastoralism in Eurasia UCL Press London pp 51 70 Cavalli Sforza L L Hewlett B 1982 Exploration and mating range in African Pygmies Ann Hum Genet 46 257 70 Cavalli Sforza L L King M C 1986 Detecting linkage for genetically heterogeneous diseases and detecting heterogeneity with linkage data Am J Hum Genet 38 599 616 Cavalli Sforza L L Piazza A 1993 Human genomic diversity in Europe a summary of recent research and prospects for the future Eur J Hum Genet 1 3 18 Cavalli Sforza L L Menozzi P Piazza A 1994 The History and Geography of Human Genes In Princeton University Press Princeton New Jersey pp 145 154 Cavalli Sforza L L Minch E 1997 Paleolithic and Neolithic lineages in the European mitochondrial gene pool Am J Hum Genet 61 247 54 Cavalli Sforza L L Feldman M W 2003 The application of molecular genetic approaches to the study of human evolution Nat Genet 33 Suppl 266 75 Chakraborty R 1975 Estimation of race admixture A new method American Journal of Physical Anthropology 42 507 511 Chikhi L Destro Bisol G Bertorelle G
373. un taux d emigration m constant Ce taux d migration est ind pendant de la taille de la population concern e Le nombre effectif E d migrants dans un d me au temps t peut s crire Eit MNit Eq 4 13 ou N est la densit dans la cellule au temps t Lorsque la population est l quilibre le nombre total d emigrants E vers les 4 cellules voisines est alors gal Kim Il s agit du param tre Nim dont les effets sur les genealogies de genes a t abondamment d crit dans le chapitre 3 Les migrants sont ensuite r partis dans les cellules voisines en fonction de leur friction La friction d une cellule est un indice repr sentant la difficult pour un individu de se mouvoir l int rieur de celle ci Chaque cellule poss de son propre coefficient de friction F calcul sur la base de donn es environnementales Ray 2003 chapitre 3 Une probabilit directionnelle D de migration vers chacune des quatre cellules est ensuite calcul e en fonction de leurs frictions relatives comme 1 F D Eq 4 14 j 4 AE j 1 o F est la friction de la cellule voisine j Ainsi plus la friction relative d une cellule est lev e et moins il sera probable qu un migrant y p n tre D tant une probabilit relative il est vident que 4 gt D1 Eq 4 15 j 1 Le nombre d migrants dans chacune des quatre directions peut donc s crire comme E mN D Eq 4 16 Lorsque la fric
374. une structure g n tique observ e notamment dans la population humaine un ou des v nement s d mographique s pass s p ex Menozzi et al 1978 Sokal et Menozzi 1982 Piazza et al 1995 Richards et al 1996 Sajantila et al 1996 Semino et al 1996 Hammer et al 1998 Torroni et al 1998 Sykes 1999 Hill et al 2000a Hammer et al 2001 Helgason et al 2001 Hurles et al 2002 Capelli et al 2003 Hurles et al 2003 Quintana Murci et al 2003 Richards et al 2003 En effet la variation des densit s des populations et les migrations influencent fortement la structure g n tique des populations Langaney et al 1990 Barbujani et al 1994 Lahr et Foley 1998 Stefan et al 2001 Roebroeks 2003 En th orie il est donc possible d utiliser cette structure comme indice soutenant ou infirmant des hypotheses de peuplement propos es notamment par des disciplines comme l arch ologie ou la pal oanthropologie Malheureusement l interpr tation de donn es g n tiques pour inf rer des informations d mographiques est complexe puisque de nombreux facteurs perturbateurs entrent en jeu voir p ex Langaney et al 1992 Premi rement des facteurs volutifs intrins ques au g nome comme la s lection naturelle et les effets de l h t rog n it des taux de mutation et de recombinaison obscurcissent ou effacent la signature g n tique laiss e par les v nements d mographiques pas
375. uniquement des valeurs de K et Kg Etudions les diff rents cas possibles lors de l arriv e d individus de la population B dans une cellule d j peupl e par la population A 1 K lt Keg Il s agit du cas g n ral n 2 du mod le de Lotka Volterra page n 51 Il en r sulte un envahissement de B et une extinction de A Figure 4 5a 2 K Kg Il s agit du cas g n ral n 4 du mod le de Lotka Volterra Il en r sulte un quilibre stable A et B cohabitent ind finiment Figure 4 5b 3 K1 gt Kg Il s agit du cas inverse au premier Kg gt Ka soit le cas g n ral n 1 du mod le de Lotka Volterra Il en resulte que B ne parvient pas a envahir et disparait rapidement Le cas g n ral n 3 du mod le de Lotka Volterra n est jamais possible puisque Q 4g Agar 1 la competition interpopulationnelle est donc toujours plus faible que la comp tition intrapopulationnelle Si l tat final du syst me ne d pend que de K4 et Kg en revanche la vitesse laquelle il se met en place d pend la fois des taux de croissance r4 et re ainsi que des densit s initiales des deux populations Nao et Ngo Soit les densit s au moment ou les premiers individus de la seconde population B arrivent dans la cellule 53 Densit 0 50 100 150 Temps en g n rations 100 80 70 60 90 Densit 40 30 20 10 NB D eee 0 50 100 150 Temps en g n rations Figur
376. uniquement les sites polymorphes d une s quence lorsqu aucun choix de SNPs n est fait Les distributions mismatch poss dent alors les m mes caract ristiques que lorsque des s quences enti res sont utilis es bimodale accompagn e d une grande variance lorsque Nm est petit Figure 3 1 a c et e ii unimodale accompagn e d une faible variance lorsque Nm est grand Figure 3 2 a c et e La grande diff rence entre les distributions mismatch tir es des s quences compl tes et celles obtenues sur la base de SNPs est que ces derni res ne livrent aucune indication quant la date de l expansion puisque les SNPs sont ind pendants du taux de mutation En effet plus le nombre de SNPs utilis s est important et plus le mode principal de la distribution mismatch est important Nous d finissons le mode principal de la distribution mismatch comme celui qui est g n r par les coalescences qui ont lieu au moment de l origine de l expansion a l int rieur ou autour du deme ancestral phase de contraction Par opposition le premier mode est g n r par les coalescences r centes qui ont lieu dans le deme d chantillonnage Ce premier mode se traduit par une classe O importante et correspond a l homozygotie attendue de la population La valeur du mode principal des distributions mismatch tir es de SNPs est beaucoup plus lev e lorsque Nm est petit Figure 3 1 que lorsqu il est grand Figure 3 2 Cette diff renc
377. unter gatherers In Lee RB DeVore eds Man the hunter Aldine Publishing Company Chicago pp 229 240 Blurton Jones N G Hawkes K O Connell J F 2002 Antiquity of postreproductive life are there modern impacts on hunther gatherer postreproductive life soans American Journal of Human Biology 14 184 205 Bocquet Appel J P Demars P Y 2000a Population Kinetics in the Upper Palaeolithic in western Europe Journal of Archaeological Science 27 551 570 Bocquet Appel J P Demars P Y 2000b Neanderthal contraction and modern human colonization of Europe Antiquity 74 544 552 Bosch E Calafell F Santos F R Perez Lezaun A Comas D Benchemsi N Tyler Smith C Bertranpetit J 1999 Variation in short tandem repeats is deeply structured by genetic background on the human Y chromosome Am J Hum Genet 65 1623 38 Bosch E Calafell F Comas D Oefner P J Underhill P A Bertranpetit J 2001 High resolution analysis of human Y chromosome variation shows a sharp discontinuity and limited gene flow between northwestern Africa and the Iberian Peninsula Am J Hum Genet 68 1019 29 Brion M Salas A Gonzalez Neira A Lareu M V Carracedo A 2003 Insights into Iberian population origins through the construction of highly informative Y chromosome haplotypes using biallelic markers STRs and the MSY1 minisatellite Am J Phys Anthropol 122 147 61 198 Buhler S Sanchez Mazas A Zanone R Djavad N Tiercy J M 2002 PCR S
378. urce disappears and the proportion of unimodal mismatch distributions quickly increases 50 with y 0 05 and 90 with y 0 15 and is close to 95 when y gt 0 5 Figure4c d This increase in the number of unimodal mismatch is faster for populations which are furthest away from the Neolithic source since it is also those integrating the most Paleolithic genes The mismatch distributions simulated for 22 SNPs when y 0 are often bimodal whereas they are almost always unimodal when y 1 Figure 5a b As soon as ascertainment bias is introduced the realized mismatch distributions become multimodal under all simulated scenarios Figure 5c d even though the average distributions are relatively flat Discussion Simulating a realistic Neolithic range expansion The degree of realism of our simulations of the colonization of Europe by Homo sapiens sapiens followed by a second Neolithic range expansion is difficult to judge as the true history of the European population has certainly been even more complex Mazuri de Keroualin 2003 However these simulations are more realistic than those done previously Barbujani et al 1995 Rendine et al 1986 and fit the known duration of the Neolithic transition process as well as the duration of the Mesolithic period in several places Since simulated cohabitation times between HG and F demes vary between 5 6 and 7 7 generation 150 to 200 years Table 1 they are thus close to documented cases wher
379. urs collecteurs indigenes ont eux m mes adopt l agriculture et ont ainsi particip la croissance d mographique Harris 1996 Whittle 1996 Thorpe 1999 Mazuri de Keroualin 2003 Dans les deux cas mentionn s ci dessus les donn es g n tiques actuelles devraient permettre d obtenir des indications quant la contribution respective des diff rentes populations au patrimoine g n tique europ en actuel Ce sont les questions auxquelles nous nous sommes interess dans ce travail chapitres 5 et 6 au moyen de l approche par simulation pr sent e dans le chapitre 2 Les deux transitions peuvent ainsi tre mod lis es par l expansion spatiale et d mographique d une population B prenant sa source dans le sud ouest de l Asie dans une aire d j peupl e par une autre population A Cette mod lisation doit permettre des changes g n tiques ainsi que de la comp tition entre les deux populations En effet lors de leur diffusion en Europe aussi bien les premiers Homo sapiens sapiens que les agriculteurs ont totalement remplac les populations qui peuplaient pr alablement l Europe respectivement les N andertaliens et les chasseurs collecteurs Ces observations laissent raisonnablement penser que les Hommes modernes ont t en comp tition avec les N andertaliens Bocquet Appel et Demars 2000b Stringer et Davies 2001 1 Il est de plus en plus largement accept que les Neandertals font partie d une esp ce distinc
380. usieurs caract ristiques environnementales notamment sa position g ographique latitude et longitude Nous differencierons le terme cellule qui contient les caract ristiques physiques d une aire donn e du terme d me qui contient les caract ristiques de la population qui peuple la cellule Cette nomenclature se retrouve dans l impl mentation du programme Annexe 2 3 Incorporation des donn es environnementales L utilisation de donn es environnementales se fait par le biais de cartes num riques de format ASCII raster Ces cartes peuvent tre g n r es a l aide de la plupart des logiciels GIS Trois types d informations environnementales peuvent tre utilis es dans SPLATCHE la v g tation lhypsom trie relief et l hydrographie fleuves mers et oc ans Ces trois types d information sont connus pour chacune des cellules et peuvent tre diff rents selon les cellules monde h t rog ne chaque deme sont associ es deux variables K et F qui r sument l effet des caract ristiques environnementales sur la population La capacit de soutien K repr sente le nombre maximum d individus qui peuvent coexister dans un d me en fonction des ressources de ce dernier La friction F repr sente la difficult de mouvement l int rieur d une cellule D amples explications sur Un d me est une sous population homog ne l int rieure de laquelle le choix des partenaires se fait de mani re al atoire Gilmour et Gre
381. utions mismatch Il faut pr ciser que l tude de SNP dont la fr quence minimum dans la population est de 5 donne des r sultats tres semblables ceux obtenus avec une fr quence minimum de 10 non montr Nous avons galement montr que les SNPs ne permettent pas d estimer l ge de l expansion d mographique puisqu ils sont ind pendants du taux de mutation 33 3 3 2 Implications pour les populations europ ennes Pereira et al 2001 se sont appuy s sur des distributions mismatch tir es de SNPs situ s sur le chromosome Y pour mettre l hypoth se que la lign e masculine europ enne ne porte pas la trace d une expansion d mographique Cette hypoth se a t ensuite tendue au niveau mondial dans un second article mais sous une forme nuanc e puisque Dupanloup et al 2003 supposent qu une expansion r cente s est produite sans laisser de traces dans les distributions mismatch Ces deux tudes se basent sur les donn es provenant de 25 populations typ es pour 22 SNPs par Semino et al 2000a Il s agit de donn es qui sont sujettes a un biais de recrutement dont l importance est inconnue Une inspection visuelle des distributions mismatch observ es dans les populations europ ennes et moyen orientales r v le que la majorite d entre elles poss dent une homozygotie importante et qu elles sont toutes multimodales Figure 3 4 Les simulations que nous avons effectu es nous permettent de r valuer l hypoth se mi
382. vantage principal apport par l impl mentation de l approche par coalescence par rapport une approche forward Livingstone 1989 Kaplan et al 1991 Currat et al 2002 Edmonds ef al 2004 puisqu elle ne rend pas n cessaire la simulation de la totalit des g nes d une population mais seulement de ceux qui sont chantillonn s ainsi que de leurs anc tres Le gain en temps de calcul et en espace m moire est donc tr s important g ne G n rations coalescence migration D dans le pass sduus 1 1 1 2 1 3 1 4 Cellules Espace 2D Figure 9 5 Sch matisation du processus de coalescence aboutissant un arbre de coalescence des g nes chantillonn s tel qu il est impl ment dans SPLATCHE Dans cette figure 2 g nes sont par exemple chantillonn s dans le d me 1 1 mais leur coalescence a pourtant lieu dans un d me diff rent 1 2 la g n ration 3 Ceci souligne la diffusion spatiale des lignages au cours du temps L impl mentation du processus de coalescence dans SPLATCHE se d roule de la fa on suivante lors de chaque g n ration chacun des lignages simul s peut subir deux types d v nements 1 une coalescence ou 2 une migration Figure 9 5 Un g ne neutre est consid r comme n tant pas sujet la s lection 178 1 Ev nement de coalescence Pour qu une coalescence soit possible il faut qu au moins deux lignages se trouvent dans le m me deme au m me momen
383. vembre J amp Schneider S 2000 SIMCOAL A general coalescent program for the simulation of molecular data in interconnected populations with arbitrary demography J Heredity 91 506 510 Hudson R 1990 Gene genealogies and the coalescent process 7 Oxford University Pressoxford Jin L amp Nei M 1990 Limitations of the evolutionary parsimony method of phylogenetic analysis Mol Biol Evol 7 82 102 171 SPLATCHE User Manual Jukes T amp Cantor C 1969 Evolution of protein molecules In Academic press Mamalian Protein Metabolism 21 132 H N Munro New York Kimura M 1980 A simple method for estimating evolutionary rate of base substitution through comparative studies of nucleotide sequences J Mol Evol 16 111 120 Kimura M amp Weiss W H 1964 The stepping stone model of genetic structure and the decrease of genetic correlation with distance Genetics 49 561 576 Kingman J F C 1982 The coalescent Stoch Proc Appl 13 235 248 Kingman J F C 1982 On the genealogy of large populations J Appl Proba 19A 27 43 Page R D M 1996 TREEVIEW An application to display phylogenetic trees on personal computers Comput Appl Biosci 12 357 358 Ray N 2003 Mod lisation de la d mographie des populations humaines pr historiques l aide de donn es environnementales et g n tiques Th se D partment d Anthropologie Universit de Gen ve Ray N Currat M amp Exc
384. vent dans la population AG except dans le cas particulier o recNcc racNac Cette incoh rence dans la description de cette quation a sans doute chapp la vigilance des auteurs il s agit uniquement d une parenth se mal plac e mais elle est loin d tre isol e Par exemple les chiffres mentionn s dans le texte et ceux pr sent s dans les tables sont souvent diff rents Toutes ces impr cisions nuisent passablement la compr hension du mod le De plus ce dernier est difficilement applicable dans un cadre g n ral comme nous l avons soulign plus haut Malgr ses points faibles la m thodologie propos e par Rendine et al 1986 a t tr s novatrice sous de nombreux aspects et a eu normement d influence sur tous les mod les d interactions entre chasseurs collecteurs et agriculteurs qui ont t d velopp s par la suite Calafell Bertranpetit Current Anthropology 1993 La m thodologie de Rendine et al 1986 a t r utilis e par Calafell et Bertranpetit 1993 pour simuler la transition n olithique dans la p ninsule ib rique Cette simulation est cependant plus d taill e notamment par l incorporation de plusieurs phases de migrations successives et par 45 l utilisation d une meilleure r solution r duction de la taille des demes Il est interessant de noter que le taux d acculturation est gal a 0 0002 et qu il a t choisi de fa on totalement arbitraire ce qui souligne un
385. ver the 3 500 demes in Europe where Neanderthals and modern human have co existed Maximum percentage of Neanderthal input into the initial Paleolithic population This figure is computed from the previous column by assuming that there were a total of 140 000 reproducing females in the total modern human population in Europe 110 Demographic TES 1 Expected proportion of HN lineages in modern parameters Due eae pool for different rates of admixture Kun Kus lus Mps 1 500 1 100 1 50 1 25 1 10 1 5 1 2 1 2 5 0 00 0 05 0 09 0 15 0 38 0 62 0 91 0 99 1 00 1 00 10 40 04 0 25 7 5 11 0 400 500 0 00 0 10 0 15 0 13 0 23 0 21 0 10 0 02 0 00 0 00 0 00 0 04 0 10 0 16 0 50 0 64 0 92 0 99 1 00 1 00 10 40 04 0 25 7 5 11 0 380 550 0 01 0 08 0 15 0 17 0 24 0 18 0 08 0 02 0 00 0 00 0 00 0 01 0 05 0 18 0 38 0 57 0 92 0 98 1 00 1 00 10 40 04 0 25 7 5 11 0 350 500 0 02 0 02 0 13 0 17 0 22 0 21 0 08 0 03 0 01 0 00 0 00 0 01 0 05 0 05 0 20 0 31 0 68 0 85 0 98 1 00 25 40 0 8 0 25 21 5 24 5 430 500 0 02 0 02 0 13 0 09 0 21 0 18 0 20 0 13 0 03 0 00 0 00 0 01 0 03 0 05 0 15 0 34 0 62 0 86 0 95 1 00 25 40 0 4 0 5 31 0 36 5 890 470 0 01 0 03 0 05 0 09 0 14 0 21 0 17 0 11 0 05 0 01 0 00 0 06 0 05 0 25 0 51 0 62 0 91 0 98 1 00 1 00 10 40 0 4 0 25 11 0 12 0 450 510 0 01 0 13 0 08 0 25 0 27 0 20 0 10 0 03 0 00 0 01 0 00 0 00 0 00 0 00 0 00 0 01 0 01 0 03 0 05 0 14 10 40 0 25 1 0 140 170 0 00 0 00 0 00 0 00 0 00 0 02 0 01 0 04 0 04 0 06 The expected contribution of Neander
386. versity in European populations has been shown to be compatible with an old Paleolithic spatial expansion Excoffier 2004 Ray et al 2003 while evidence is contradictory for Y chromosome data On one hand clines of allele frequencies have been observed for several Y chromosome SNPs Rosser et al 2000 and a gradient of decreasing Neolithic contribution to the current gene pool has been inferred from the Near East to the West by the analysis of 22 Y chromosome SNPs Chikhi et al 2002 Semino et al 2000 in keeping with the hypothesis of a movement of Neolithic populations from the Near East and a progressive dilution of their gene poll by the incorporation of some Paleolithic lineages On the other hand the mismatch distributions of European populations inferred from the analysis of 22 Y chromosome SNPs do not show the typical signature of a demographic or spatial expansion Pereira et al 2001 which could be due to a small effective population size of males compared to females potentially due to polygyny Dupanloup et al 2003 or to reduced male migration rates In order to assess the pattern of SNP diversity expected after the Neolithic expansion for various degrees of interactions with Paleolithic populations we have carried out simulations of a range expansion in a spatially explicit model of Europe and the Near East These simulations were used to investigate three particular aspects of SNP diversity that have produced contradictory results
387. w scenario H This last scenario is similar to A except that the carrying capacity of the modern humans is increased by a factor 250 at the time of the Neolithic transition 320 generations BP The influence of this demographic increase on the simulated HN proportion is very weak as shown on this figure 2 40 HN HS z S 30 _o admixture event D O c 20 _ 1 X A G 10 o Z Q 0 0 0 0 0 0 0 0 0 0 0 0 0 0 _0 0 0 0 0 0 0 0 0 0 0 0 1530 1525 1520 1515 1510 1505 1500 Time in generation Figure S5 Evolution of the densities of demes HN in black and HS in gray within a cell simulated under demographic scenario A for y 0 4 The cell is colonized by HS at time 1520 0 present The thin black line with white circles represents the distribution of admixture events 114 Absence of admixture between modern humans and Neanderthals References 1 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Klein R G Paleoanthropology Whither the Neanderthals Science 299 1525 7 2003 Mellars P A Archaeology and the population dispersal hypothesis of modern human origins in Europe Philos Trans R Soc Lond B Biol Sci 337 225 34 1992 Stringer C amp Davies W Archaeology Those elusive Neanderthals Nature 413 791 2 2001 Excoffier L Human demographic history refining the recent African origin
388. wander S in prep The simulation of the colonization history of European bullhead Cottus gobio L across the Rhine Rh ne watershed in Switzerland Th se de doctorat Universite de Berne Berne Nichols R 2001 Gene trees and species trees are not the same Trends Ecol Evol 16 358 364 Nichols R A Hewitt G M 1994 The genetic consequences of long distance dispersal during colonization Heredity 72 312 317 Nordborg M 1998 On the probability of Neanderthal ancestry Am J Hum Genet 63 1237 40 Nordborg M 2001 Coalescent theory In Balding D Bishop C Cannings C eds Handbook of Statistical Genetics John Wiley amp Sons Ltd New York pp 179 212 Notohara M 1990 The coalescent and the genealogical process in geographically structured population J Math Biol 29 59 75 Oota H Settheetham Ishida W Tiwawech D Ishida T Stoneking M 2001 Human mtDNA and Y chromosome variation is correlated with matrilocal versus patrilocal residence Nat Genet 29 20 1 Oota H Kitano T Jin F Yuasa l Wang L Ueda S Saitou N Stoneking M 2002 Extreme mtDNA homogeneity in continental Asian populations Am J Phys Anthropol 118 146 53 Oppenheimer S Richards M 2001 Fast trains slow boats and the ancestry of the Polynesian islanders Sci Prog 84 157 81 Orekhov V Poltoraus A Zhivotovsky L A Spitsyn V lvanov P Yankovsky N 1999 Mitochondrial DNA sequence diversity in Russians FEBS Lett 445 197 201 Otte M 20
389. x g nique entre les d mes qui constituent la population subdivis e est grand Ces observations permettent d expliquer par une simple difference de densite pourquoi les distributions mismatch obtenues pour le genome mitochondrial humain sont unimodales dans les populations post n olithiques et multimodales dans les populations de chasseurs collecteurs Watson et al 1996 Excoffier et Schneider 1999 voir aussi la Figure 6 de l article 3 2 1 Il n est donc pas n cessaire d invoquer une r duction de la taille des populations de chasseurs collecteurs lors du N olithique Excoffier et Schneider 1999 pour expliquer leurs distributions mismatch multimodales Finalement le fait que la diversit mol culaire observ e dans les populations actuelles d pende du flux migratoire r cent entre sous populations sugg re qu il doit tre possible d estimer le produit Nm d une population partir d un seul des d mes qui la composent Cette perspective a d ailleurs donn lieu une publication Excoffier 2004 3 2 1 Article Page suivante 1 P Dn To Se Ais Se r f rer l Annexe 2 2 1 pour une description du processus de coalescence et des d finitions qui s y rattachent Intra Deme Molecular Diversity in Spatially Expanding Populations Nicolas Ray Mathias Currat and Laurent Excoffiert Genetics and Biometry Lab Department of Anthropology and Ecology University of Geneva Geneva Switzerland and Computati
390. ymorphisme de l ADN mitochondrial et histoire du peuplement humain Th se Universit de Geneve Geneve Excoffier L Harding R M Sokal R R Pellegrini B Sanchez Mazas A 1991 Spatial Differentiation of RH and GM Haplotype Frequencies in Sub Saharan Africa and Its Relation to Linguistic Affinities Human Biology 63 273 307 Excoffier L Smouse P Quattro J 1992 Analysis of molecular variance inferred from metric distances among DNA haplotypes Application to human mitochondrial DNA restriction data Genetics 131 479 491 Excoffier L 1997 Ce que nous dit la g n alogie des g nes La Recherche N 302 82 90 Excoffier L Schneider S 1999 Why hunter gatherer populations do not show signs of pleistocene demographic expansions Proc Natl Acad Sci U S A 96 10597 602 Excoffier L Novembre J Schneider S 2000 SIMCOAL A general coalescent program for the simulation of molecular data in interconnected populations with arbitrary demography J Heredity 91 506 510 Excoffier L 2002 Human demographic history refining the recent African origin model Curr Opin Genet Dev 12 675 82 Excoffier L 2004 Patterns of DNA sequence diversity and genetic structure after a range expansion lessons from the infinite island model Mol Ecol 13 853 64 Fiedel S J 1992 Prehistory of the Americas Cambridge University Press Cambridge Fiedel S J Anthony D W 2003 Deerslayers pathfinders and iceman In Rockman M Steele J eds Col
391. zuri de Keroualin 2001 16 France Sud Ouest 1 100 Mazuri de Keroualin 2001 17 Cantabria Nord Ouest de l Espagne 800 Arias 1999 18 Portugal 400 Arias 1999 19 P ninsule Ib rique 800 Mazuri de Keroualin 2001 Calafell et Bertranpetit 1993 Table 4 2 P riode entre l arriv e des premiers l ments n olithiques et la disparition des derniers elements m solithiques dans diff rentes r gions d Europe 72 Les surfaces comprises dans chacune des zones mentionn es tant beaucoup plus grandes que les d mes du monde virtuel 50 x 50 km dans lequel nous effectuons nos simulations le temps de cohabitation dans un deme est sans aucun doute beaucoup plus court Des lors il parait raisonnable de prendre 17000 ans comme p riode maximum de cohabitation a l int rieur d un deme ce qui correspond environ 40 g n rations humaines en prenant 25 ans comme temps de g n ration moyen le temps de g n ration chez l Homme tant vraisemblablement l g rement sup rieur Tremblay et Vezina 2000 Helgason et al 2003 Nous carterons donc toutes les combinaisons de param tres qui donnent des temps de cohabitation plus longs que 40 g n rations Ceci concerne notamment tous les cas ou les valeurs de Kac et de Kcc sont trop proches 4 5 2 6 Param tres utilis s partir des estimations tir es de la litt rature nous avons d fini un intervalle de valeurs de capacit s de soutien K et de taux de croissance r utiliser Table
392. zza et al 1995 Simoni et al 1999 qui ont galement t observes l aide de marqueurs nucl aires mol culaires Chikhi et al 1998 et de fa on un peu moins vidente par certains polymorphismes du chromosome Y Semino et al 1996 Malaspina et 1 Le mod le d isolation par la distance Mal cot 1948 1955 propose que les migrations sont les principales responsables de la structure g n tique des populations humaines et que plus ces derni res sont loign es g ographiquement plus elles vont tre diff renci es g n tiquement Ce mod le permet d expliquer une grande partie de la variation g n tique des populations humaines Morton 1977 Morton 1982 principalement l chelle continentale ou mondiale p ex Sanchez Mazas et al 1994 Poloni et al 1995 La statistique Fsr Wright 1943 traduit le degr de diff renciation g n tique entre groupes d individus et peut tre calcul e de diff rentes mani res soit entre deux populations Reynolds et al 1983 Slatkin 1991 1995 soit de mani re globale entre toutes les populations Cockerham 1969 1973 Excoffier et al 1992 3 J FI 7 L4 Les marqueurs que lon appelle couramment classiques sont constitu s par des locus situ s sur les syst mes sanguins Rh sus ABO etc immunitaires HLA ou par des prot ines ou allozymes GF HP CP etc Voir Mourant 1976 Roychoudhury 1988 ou Tills 1983 pour plus de d tails 117 al

Download Pdf Manuals

image

Related Search

Related Contents

東京しごとセンター ミドルコーナー求人情報(受理日:平成27年3月23日  取り扱い説明書 〝縄ググ”魍  Ferrari by Logic3 Cavallino G150    Wonderful Communication, Mobile Life  Manual de instrucciones Temperaturregler Regulador de      Working With the VST-AU Mopho Editor  Logger Kyoritsu 6300  

Copyright © All rights reserved.
Failed to retrieve file