Des dizaines de millions d’années d’abstinence sexuelle ? Même pas cap’ !

Le sexe, c’est important, mais est-ce vital ? On a généralement pensé que oui, du fait que l’extrême majorité des Eucaryotes se reproduisent par voie sexuée. La reproduction sexuée apporterait en effet un avantage pour échapper aux parasites, en augmentant la diversité génétique dans les populations, et rendrait plus improbable le fait que le parasite puisse infiltrer les défenses de l’hôte. La reproduction sexuée permettrait aussi de se débarrasser des mutations faiblement délétères (le fardeau génétique) en générant des recombinaisons entre les portions chromosomiques. Malgré tout, il existe des Eucaryotes à reproduction asexuée mais ces lignées sont généralement considérées comme des cul-de-sacs évolutifs. Toutes ? Non, car quelques groupes d’organismes résistent encore et toujours à ce paradoxe (un ‘scandale évolutif’, d’après John Maynard Smith) : les Crustacés ostracodes, les Acariens Oribatida, les insectes Phasmes du genre Timema et les Rotifères bdelloïdes. Toutes ces espèces sont supposées avoir évolué depuis une lignée évolutive qui refuse la sexualité depuis fort longtemps. Des dizaines de millions d’années pour les Rotifères bdelloïdes, pensait-on. Ainsi, sur les centaines de milliers d’individus observés chez l’espèce de bdelloïdes Adineta vaga, aucun mâle n’a jamais été observé. Mais les Rotifères bdelloïdes n’ont-elles pas quelque chose à cacher sur leurs aventures sexuelles passées et/ou actuelles ?

Individu du rotifère bdéloïde de l'espèce Adineta vaga. La barre d'échelle représente 100 µm.

Rotifère bdelloïde de l’espèce Adineta vaga. La barre d’échelle représente 100 µm. (Source : Vakhrusheva et al. 2020)

Non, pas de sex tape en Super 8. Juste les travaux d’Olga A. Vakhrusheva et ses collaborateurs et collaboratrices russes et états-unien·ne·s, publiés dans le journal Nature Communications en décembre 2020. Cette équipe a comparé le génome de onze individus de l’espèce Adineta vaga, échantillonnés sur des mousses vivant sur des peupliers trembles (Populus tremula) en Russie. Mais les analyses de clonalité ont été réalisées sur huit génomes, sachant que les trois autres constituaient un groupe différencié qui pouvait biaiser l’analyse. Les résultats vont clairement montrer que l’hypothèse de clonalité stricte est à exclure.

Un argument probant pour appuyer cette conclusion est l’observation d’une décroissance du déséquilibre de liaison (DL) avec la distance séparant les sites variables du génome. Le déséquilibre de liaison ou déséquilibre gamétique est la co-occurrence entre les allèles de deux loci (positions dans le génome) présents sur un même chromosome. En cas de clonalité, les mutations se sont accumulées au fur et à mesure dans les génomes des ancêtres d’un individu, entraînant ces co-occurrences. En cas de reproduction sexuée, les méioses (divisions cellulaires à l’origine des gamètes) font l’objet de recombinaisons entre chromosomes homologues. Ainsi, les co-occurrences qui ont pu se former entre des allèles à différents loci sont atténuées par des échanges de segments chromosomiques et ce phénomène est d’autant plus marqué que la distance séparant les loci est grande. Les données observées chez A. vaga ont été comparées à des données simulées en cas de stricte clonalité (stabilité du DL) ou en cas de reproduction sexuée (décroissance du DL avec la distance). Du fait de la décroissance du DL observée sur son génome, Adineta vaga montre clairement un profil incompatible avec une stricte clonalité.

Décroissance du déséquilibre de liaison (DL), estimé par l'indice r², en fonction de la distance entre les variants nuclétidiques (Single Nucleotide Polymorphisms ou SNPs). En cas de stricte reproduction clonale, des simulations prédisent que le DL est maximal et stable (courbe orange). En cas de reproduction sexuée, des simulations prédisent que le DL décroît rapidement avec la distance (courbes vertes). Les nuances de vert représentent différentes valeurs du taux de recombinaison populationnel 4Nec, avec Ne l'effectif efficace de la population et c le taux de recombinaisons par nucléotide et par génération. La courbe bleue représente la décroissance réellement observée sur les données des 8 génomes de Adineta vaga analysés.

Décroissance du déséquilibre de liaison (DL), estimé par l’indice , en fonction de la distance entre les variants nucléotidiques (Single Nucleotide Polymorphisms ou SNPs). En cas de stricte reproduction clonale, des simulations prédisent que le DL est maximal et stable (courbe orange). En cas de reproduction sexuée, des simulations prédisent que le DL décroît rapidement avec la distance (courbes vertes). Les nuances de vert représentent différentes valeurs du taux de recombinaison populationnel 4Nec, avec Ne l’effectif efficace de la population et c le taux de recombinaisons par nucléotide et par génération. La courbe bleue représente la décroissance réellement observée sur les données des 8 génomes de Adineta vaga analysés.

Cependant, avant de conclure définitivement à une reproduction sexuée chez ces Rotifères bdelloïdes, l’équipe de recherche a souhaité vérifier que les résultats ne pouvaient pas être expliqués par d’autres mécanismes. En premier lieu, l’action concertée des mutations et des conversions géniques. La conversion génique est le transfert d’ADN intra-individuel entre deux copies homologues du génome et peut se faire avec ou sans recombinaison. Pour distinguer d’une part les haplotypes (combinaisons d’allèles sur un même chromosome) générés par mutation puis conversion génique sans recombinaison et d’autre part les haplotypes générés par recombinaison durant les phases de reproduction sexuée, on a recherché spécifiquement les cas où les quatre haplotypes possibles AB, Ab, aB et ab étaient présents chez deux individus différents. La présence de ces quatre haplotypes chez seulement deux individus est en effet une bonne signature de l’action de la recombinaison homologue. Ces haplotypes recombinants existent bel et bien dans le génome de Adineta vaga et sont d’autant plus fréquents que la distance entre les sites variables comparés augmente, en cohérence avec l’augmentation de la fréquence des recombinaisons avec la distance.

Confirmation de l'implication de recombinaisons homologues plutôt que de la conversion génique. (a) Mécanisme expliquant l'apparition de quatre haplotypes (notés de 1 à 4) à partir d'une mutation (b muté vers B) puis d'un événement de conversion génique (B copié sur b). Les quatre haplotypes se retrouvent dans trois organismes différents et le resteront si les organismes se reproduisent de manière clonale (sauf nouvelle mutation). (b) A partir de deux haplotypes AB/ab, un événement de recombinaison homologue peut produire deux gamètes recombinés Ab et aB. Ceux-ci peuvent finir par se retrouver dans un même individu, par reproduction sexuée. (c) Pourcentage d'haplotypes recombinants en fonction de la distance entre les SNPs constituant l'haplotype. On observe que la proportion de SNPs recombinants augmente avec la distance : elle passe de 10% pour des SNPs distants de moins de 74 paires de bases à 50% pour des SNPs distants de plus de 451 paires de bases.

Confirmation de l’implication de recombinaisons homologues plutôt que de la conversion génique. (a) Mécanisme expliquant l’apparition de quatre haplotypes (notés de 1 à 4) à partir d’une mutation (b muté vers B) puis d’un événement de conversion génique (B copié sur b). Les quatre haplotypes se retrouvent dans trois organismes différents et le resteront si les organismes se reproduisent de manière clonale (sauf nouvelle mutation). (b) A partir de deux haplotypes AB/ab, un événement de recombinaison homologue peut produire deux gamètes recombinés Ab et aB. Ceux-ci peuvent finir par se retrouver dans un même individu, par fécondation. (c) Pourcentage d’haplotypes recombinants en fonction de la distance entre les SNPs constituant l’haplotype. On observe que la proportion d’haplotypes recombinants augmente avec la distance : elle passe de 10% pour des SNPs distants de moins de 74 paires de bases à 50% pour des SNPs distants de plus de 451 paires de bases.

Toutefois, il reste la possibilité que ces recombinaisons homologues se soient passées, non pas suite à des échanges inter-individuels (fécondation à partir de gamètes issus de la méiose), mais suite à des recombinaisons mitotiques à l’intérieur d’un même organisme en absence d’échanges inter-individuels. Afin d’exclure cette dernière hypothèse, l’équipe a caractérisé le coefficient de consanguinité FIS = 1 – Ho/He, avec Ho comme le taux d’hétérozygotes observé et He le taux d’hétérozygotes attendu sous l’hypothèse d’équilibre de Hardy-Weinberg. L’équilibre de Hardy-Weinberg est un modèle théorique fondateur de la génétique des populations et repose sur huit hypothèses dont celle d’une reproduction sexuée. Ainsi, si la population biologique étudiée est à l’équilibre de Hardy-Weinberg, le taux d’hétérozygotes observé Ho est identique au taux d’hétérozygotes attendu He, ce qui entraîne un FIS nul. En cas de reproduction clonale, les mutations sont accumulées à chacun des deux allèles indépendamment, ce qui entraine l’observation d’un excès d’hétérozygotes, et par conséquent un FIS négatif. Des simulations montrent que jusqu’à 90% de taux de clonalité (1 reproduction sexuée tous les 10 cycles de reproduction), les valeurs de FIS restent proches de zéro. Toutefois, quand les reproductions sexuées viennent à se raréfier davantage, le FIS chute vers des valeurs négatives, comme le prévoit la théorie. Les sites variables détectés chez Adineta vaga montrent des valeurs de FIS proches de zéro et sont donc beaucoup plus en accord avec l’hypothèse de reproductions sexuées régulières plutôt qu’avec une reproduction clonale.

Coefficient de consanguinité FIS en fonction du taux de reproduction clonale. Les points noirs représentent des FIS calculés sur des données simulées selon le taux de clonalité, tandis que les points bleus représentent des FIS calculés sur des données observées chez les 8 génomes de Adineta vaga. Les gros points orange sont les moyennes pour chaque groupe de points.

Coefficient de consanguinité FIS en fonction du taux de reproduction clonale. Les points noirs représentent des FIS calculés sur des données simulées selon le taux de clonalité, tandis que les points bleus représentent des FIS calculés sur des données observées chez les 8 génomes de Adineta vaga. Les gros points orange sont les moyennes pour chaque groupe de points.

On a donc vérifié que le génome de ces Rotifères bdelloïdes avait été fortement influencé par des événements de recombinaison et par des échanges inter-individuels. Reste à déterminer quel type d’échanges inter-individuels parmi les deux mécanismes suivants : la reproduction sexuée méiotique (un classique !) et le transfert de gènes horizontal (HGT). Il a en effet été montré dans de précédents articles que les Rotifères bdelloïdes ont aussi largement pratiqué les transferts horizontaux (incorporation dans son propre génome d’ADN exogène) à partir de différentes espèces. Cependant, la recombinaison méiotique conventionnelle implique l’appariement de chromosomes homologues. Or, chez les Rotifères bdelloïdes, il existe bien des régions homologues entre chromosomes mais celles-ci sont assez discontinues, ce qui laisse penser que la méiose conventionnelle est peut-être compromise, même s’il existe un vif débat sur le sujet. Chez certaines plantes, dont les plantes du genre Oenothera (appelées aussi herbes aux ânes ou onagres), et probablement certains animaux, il existe un type de méiose non conventionnelle, dit ‘de type Oenothera‘, qui fonctionne sans nécessité de paires de chromosomes homologues : pendant la méiose, les chromosomes paternels et maternels sont alternés à la queue leu-leu, formant un cercle de chromosomes. Chaque lot de chromosomes paternel ou maternel est ensuite transmis à des gamètes différents. La phylogénie de différentes régions du génome de Adineta vaga a été réalisée pour clarifier le mode de transmission d’information génétique entre individus. De nombreuses incongruences ont été identifiées : pour un même individu, chaque membre d’une paire d’haplotypes avait souvent comme plus proche voisin dans la phylogénie des haplotypes provenant de différents individus. Par exemple, l’haplotype L6.1 (1er haplotype de l’individu L6) peut se retrouver proche dans la phylogénie de l’haplotype L7.1 alors que l’haplotype L6.2 (2e haplotype de l’individu L6) se retrouve proche de L9.2 au lieu de L7.2. Ces incongruences témoignent d’échanges génétiques entre individus. Une analyse plus fine sur l’ensemble du génome montre que les patrons d’incongruence sont très diversifiés et sont plus en faveur d’échanges génétiques inter-individuels par méiose conventionnelle ou par transfert de gènes horizontal plutôt que par méiose de type Oenothera.

Exemple d'incongruence sur la phylogénie de chacun des deux haplotypes des quatre individus L6 à L9. Ici, deux régions nucléotidiques délimitées par la ligne pointillée ont été utilisées pour construire chacun des arbres phylogénétiques. Des ré-échantillonnages par méthode des bootstraps a permis de tester la robustesse des nœuds de l'arbre. Les indices 1 et 2 après le nom de l'individu désigne le numéro de l'haplotype. Seuls les haplotypes dont la reconstruction est la plus fiable (écrits en couleur) ont été utilisés pour tester l'existence d'une recombinaison entre ces deux régions.

Exemple d’incongruences sur la phylogénie de chacun des deux haplotypes des quatre individus L6 à L9. Ici, deux régions nucléotidiques délimitées par la ligne pointillée ont été utilisées pour construire chacun des arbres phylogénétiques. Les indices 1 et 2 après le nom de l’individu désigne le numéro de l’haplotype. Seuls les haplotypes dont la reconstruction est la plus fiable (écrits en couleur) ont été utilisés pour tester l’existence d’une recombinaison entre ces deux régions. L’existence de deux types d’incongruence à deux régions adjacentes suggère un événement de recombinaison entre les deux régions analysées.

Il est difficile de trancher entre les deux hypothèses finales de méiose conventionnelle et de transferts de gènes horizontaux. Toutefois, les auteurs suggèrent que les trois individus laissés de côté au début de l’étude seraient des hybrides entre le groupe d’individus étudiés dans l’article et une autre population non échantillonnée ici. Ainsi, cela accréditerait plutôt l’hypothèse de reproduction sexuée par méiose conventionnelle.

Si les résultats vont dans le sens de fréquents événements de reproduction sexuée chez cette espèce qu’on considérait dériver d’une lignée ayant délaissé les reproductions sexuées depuis plusieurs dizaines de millions d’années, il n’en demeure pas moins que ces événements de reproduction sexuée ne seraient pas aussi fréquents que les événements de reproduction asexuée. Les auteurs estiment que les patrons de recombinaison observés seraient compatibles avec une fréquence de 1 méiose toutes les 10 à 100 générations, ce qui est encore beaucoup chez une espèce où aucun mâle n’a jamais été observé ! L’hypothèse de transfert de gènes horizontal (HGT) est davantage compatible avec l’absence d’observation de mâle, mais pas avec l’observation d’individus hybrides et elle requerrait une fréquence élevée de 1 HGT toutes les 1 à 10 générations.

Au final, on peut conclure que cette espèce de Rotifère bdelloïde présente de nombreuses recombinaisons dans son génome qui montrent clairement qu’elle use de mécanismes qui permettent un brassage de la diversité génétique. Les mécanismes utilisés ne sont pas encore clairement tranchés entre reproduction sexuée et transferts de gènes horizontaux. Mais la démonstration de brassage génétique fréquent chez cette espèce à reproduction (au moins majoritairement) clonale permet d’étouffer ce “scandale évolutif” d’une lignée évolutive sans avenir (cul-de-sac évolutif) mais qui perdure depuis des dizaines de millions d’années. Reste à trouver la pièce à conviction démontrant le mécanisme : sex tape ou autre…

Références de l’article

Olga A. Vakhrusheva, Elena A. Mnatsakanova, Yan R. Galimov, Tatiana V. Neretina, Evgeny S. Gerasimov, Sergey A. Naumenko, Svetlana G. Ozerova, Arthur O. Zalevsky, Irina A. Yushenova, Fernando Rodriguez, Irina R. Arkhipova, Aleksey A. Penin, Maria D. Logacheva, Georgii A. Bazykin, Alexey S. Kondrashov (2020) Genomic signatures of recombination in a natural population of the bdelloid rotifer Adineta vaga. Nature Communications 11, 6421.

Le mystère des cercles de fées : on tournait en rond avec l’hypothèse de clonalité !

Quelle n’est pas la surprise du voyageur en Namibie qui se retrouve dans un décor surprenant, à mi-chemin entre les cratères lunaires et la savane africaine. Les cercles de fées s’étendent sur des milliers de kilomètres carrés de terres arides de Namibie. Ce sont des cercles de 2 à 10 mètres de diamètre, dont la délimitation est souvent constituée de touffes d’herbes pérennes du genre Stipagrostis et dont le centre est dépourvu de végétation. Ces cercles sont disposés régulièrement, tous les 5 à 10 mètres. Ces structures semblent stables et pourraient être établies depuis des centaines d’années.

Cercles de fées en Namibie (Crédit : Stephan Getzin, commons.wikimedia.org, CC-BY-SA 3.0)

Cercles de fées en Namibie (Crédit : Stephan Getzin, commons.wikimedia.org, CC-BY-SA 3.0)

Les cercles de fées intriguent depuis longtemps et posent de nombreuses questions. Comment se forment-ils et se maintiennent-ils au niveau individuel ? Comment forment-ils des structures si régulières au niveau du paysage ?

En premier lieu, l’hypothèse de colonies de termites qui seraient localisées au centre des cercles a été écartée. Des travaux sur des structures similaires dans le désert du Néguev, en Israël, suggèrent une autre hypothèse : chaque cercle de fées y est formé d’une unique plante du genre Stipagrostis qui émettrait des rhizomes souterrains. L’épuisement des ressources entrainerait la disparition des pousses aériennes au centre tandis que de nouvelles pousses se développeraient à la périphérie. Une troisième hypothèse incrimine l’avantage des plantes à la périphérie par rapport aux plantes au centre. Des modèles mathématiques montrent l’importance du rapport entre les flux d’eau et la dispersion de la biomasse. Cette dernière hypothèse semble aussi plus plausible en cas de clonalité que de cercles de fées constitués d’individus génétiquement différents.

Le collectif de chercheurs d’Afrique du Sud, d’Allemagne et des Etats-Unis de Christian Kappel et ses collaborateurs a testé l’hypothèse de clonalité des plantes constituant un cercle de fées. Leurs travaux ont été publiés dans le journal Communications Biology en novembre 2020.

Relations d'apparentement entre les individus échantillonnés à la périphérie des cercles de fées namibiens des espèces Stipagrostis uniplumis (a) et S. ciliata (b). Il s'agit d'une étude de regroupement hiérarchique sur la base de la caractérisation moléculaire des individus. Les individus provenant du même cercle de fée sont indiqués par le même préfixe (chiffre avant le tiret) et la même couleur. Les individus avec un suffixe 1 et 2 sont échantillonnés à proximité dans chaque cercle de fée tandis que l'individu avec un suffixe 3 est échantillonné à l'opposé des deux précédents, sur le cercle de fée. Si certains individus d'un même cercle de fée présentent peu de variation génétique (ex : 2-1, 2-2 et 2-3 pour S. ciliata), d'autres sont très distincts génétiquement (3-1, 3-2 et 3-3 pour S. uniplumis). On observe aussi une nette distinction entre les individus diploïdes (notés 2n) et les autres individus, tétraploïdes.

Relations d’apparentement entre les individus échantillonnés à la périphérie des cercles de fées namibiens des espèces Stipagrostis uniplumis (a) et S. ciliata (b). Il s’agit d’une étude de regroupement hiérarchique sur la base de la caractérisation moléculaire des individus. Les individus provenant du même cercle de fées sont indiqués par le même préfixe (chiffre avant le tiret) et la même couleur. Les individus avec un suffixe 1 et 2 sont échantillonnés à proximité dans chaque cercle de fées tandis que l’individu avec un suffixe 3 est échantillonné à l’opposé des deux précédents, par rapport au cercle de fées. Si certains individus d’un même cercle de fées présentent peu de variation génétique (ex : 2-1, 2-2 et 2-3 pour S. ciliata), d’autres sont très distincts génétiquement (3-1, 3-2 et 3-3 pour S. uniplumis). On observe aussi une nette distinction entre les individus diploïdes (notés 2n) et les autres individus, tétraploïdes.

L’étude a porté sur deux régions désertiques de Namibie, dans lesquelles les cercles de fées sont formés par Stipagrostis ciliata (5 cercles étudiés avec 3 plantes échantillonnées dans chaque cercle) et S. uniplumis (idem mais pour 15 cercles) respectivement. Le génotypage à plus de 60 000 portions du génome des plantes montre que les plantes constituant un cercle de fées ont des génomes différents. Mieux, elles sont parfois de niveaux de ploïdie différents : des plantes diploïdes et des plantes tétraploïdes peuvent pousser dans le même cercle. Le coefficient de consanguinité F calculé pour les échantillons diploïdes de S. uniplumis est de -0.025, c’est-à-dire très proche de 0, indiquant des plantes parfaitement allogames.

On peut donc exclure que les cercles de fées de Namibie résultent du développement végétatif d’un seul clone. Au contraire, les cercles de fées sont constitués de plusieurs génotypes distincts, probablement apparus par semis de graines issues d’allo-fécondations. Si on remet cela dans le contexte du suivi des plantes et globalement des cercles de fées au cours du temps, cela signifie un très grand décalage entre des cercles de fées qui peuvent perdurer des centaines d’années et des plantes individuelles, non clonales, qui ont une durée de vie courte, jusqu’à une dizaine d’année, généralement moins du fait d’événements de sécheresse.

Pourquoi des individus, en compétition pour les ressources hydriques, s’organiseraient en cercle ? Pourquoi ces cercles seraient aussi réguliers en diamètre et aussi stables dans le temps, sur des centaines d’années d’alternance de périodes sèches et de périodes humides, chez des individus avec des traits d’histoire de vie aussi peu stables qu’une reproduction sexuée et un temps intergénérationnel court ? L’absence de clonalité chez les plantes constituant les cercles de fées namibiens déconstruit les principales hypothèses proposées, donne matière à penser aux écologues comme aux mathématiciens et remystifient les cercles de fées aux yeux des naturalistes. Quadrature du cercle pour les uns et féérie pour les autres.

Références de l’article

Christian Kappel, Nicola Illing, Cuong Nguyen Huu, Nichole N. Barger, Michael D. Cramer, Michael Lenhard, Jeremy J. Midgley (2020) Fairy circles in Namibia are assembled from genetically distinct grasses. Communications Biology 3, 698.

L’ab-surdité d’un débat séculaire : l’absence de « danger » des unions entre sourds sera-t-elle entendue ?

La limitation de la reproduction entre les individus jugés inaptes est l’un des fondements de l’eugénisme. Ainsi, l’inventeur du téléphone Alexander Graham Bell, qui fut aussi éducateur dans des écoles pour personnes sourdes et marié à une femme sourde, expose ses craintes en 1883 dans une publication intitulée ‘Memoir Upon the Formation of a Deaf Variety of the Human Race’. Il y explique que les mariages très fréquents entre personnes sourdes, encouragés à la fois par le déficit de communication entre personnes entendantes et personnes sourdes et par le développement de structures éducatives dédiées aux sourds, risquait à terme de créer une sous-population humaine sourde. A la demande de Bell, une étude est menée dans les années 1880 par Edward Allen Fay sur 4 471 pedigrees de sourds étudiant au Gallauget College (une Université dédiée aux sourds et malentendants, à Washington DC) ou inscrits dans des écoles de sourds des Etats-Unis. Les conclusions de cette étude démentent les craintes de Bell : les mariages entre sourds n’augmentent presque pas la probabilité de naissance d’un enfant sourd.

Le comédien et metteur en scène Levent Beskardes signant le mot "poème" pour la série Les Mots du silence, de la photographe Jennifer Lescouët (Jennifer Lescouët, CC-BY-SA 4.0).

Le comédien et metteur en scène Levent Beskardes signant le mot “poème” pour la série Les Mots du silence, de la photographe Jennifer Lescouët (Jennifer Lescouët, CC-BY-SA 4.0).

Le déterminisme génétique de la surdité, inconnu au XIXe siècle, est aujourd’hui mieux documenté. La surdité congénitale est causée dans un quart des cas par des allèles déficients récessifs du gène de la connexine 26 (GJB2), mais ce sont des mutations sur plus de 140 gènes qui ont été rapportées. Ainsi, des parents sourds peuvent être homozygotes pour des allèles déficients mais à des gènes différents ; leurs enfants, parfaitement entendants, bénéficieront d’un effet de complémentation en récupérant un allèle fonctionnel pour chacun des gènes défectueux chez leurs parents. Une autre cause de naissance d’enfants entendants issus d’un couple de sourds est que la surdité de certains parents n’a pas toujours une origine génétique, mais parfois une cause environnementale, comme par exemple des infections.

Le fait qu’une personne sourde soit plus susceptible de fonder une famille avec une autre personne sourde est considéré comme une forme d’homogamie linguistique. En biologie, l’homogamie est définie comme un choix de partenaire de reproduction en direction des individus présentant des similitudes phénotypiques avec soi. Au début du XXe siècle, les travaux des biostatisticiens Ronald Fisher et Sewall Wright sur les attendus théoriques de l’homogamie en génétique des populations sont éclairants sur ce sujet. Dans le cas théorique d’un gène unique à transmission récessive contrôlant la maladie, des parents atteints donneront systématiquement des enfants atteints. Ce modèle théorique prédit que la proportion d’homozygotes augmenterait dans la population et par conséquent le taux de personnes sourdes. Toutefois, la fréquence de l’allèle récessif déficient resterait constante.

Néanmoins des études récentes, réalisées sur la population américaine contemporaine, suggèrent que les unions entre personnes sourdes ont entrainé l’augmentation de la prévalence de la surdité dans la population, mais aussi de la fréquence des allèles responsables. De tels résultats peuvent avoir des impacts négatifs sur le financement de structures éducatives accusées de renforcer l’endogamie dans la communauté des sourds. Derek C. Braun et ses collaborateurs américains de la Gallaudet University ont cherché à tester ces conclusions par des simulations bioinformatiques incluant des paramètres choisis au regard de la littérature disponible sur ce handicap. Leur démarche et leurs résultats ont été publiés dans la revue PLoS ONE en novembre 2020.

C’est ainsi l’évolution d’une population de 200 000 individus qui a été simulée sur 20 générations, soit environ 400 ans, c’est-à-dire l’âge approximatif de la langue des signes d’après l’article. La fréquence initiale de l’allèle récessif de la surdité a été fixée à 1,304%, c’est-à-dire la fréquence de l’allèle c.35delG du gène GJB2, majoritaire chez les Américains blancs et les Européens. Une proportion de 0,8‰ des individus sains ont été rendus sourds, ce qui correspond à la proportion des cas de surdité causés par d’autres gènes, par des causes épigénétiques ou par des troubles d’origine périnatale. Quelle que soit la cause de leur surdité, les personnes sourdes ont été accouplées, avec un taux d’homogamie linguistique variable, sachant que dans la population contemporaine réelle, ce taux d’homogamie est estimé à 90%.

Effet de l’homogamie sur (a) la prévalence de la surdité et (b) la fréquence de l’allèle récessif à l’origine de la surdité au cours de 20 générations. Les droites représentent des statistiques descriptives de la dispersion des valeurs selon les simulations avec de haut en bas : le 98e percentile, le 3e quartile, la médiane, le 1er quartile et le 2e percentile. Cette dispersion est aussi visible sous forme d’un diagramme en violon, sur la droite. Ces simulations ont été réalisées avec une valeur sélective relative pour les sourds de 1.

Effet de l’homogamie sur (a) la prévalence de la surdité et (b) la fréquence de l’allèle récessif à l’origine de la surdité, au cours de 20 générations. Les courbes représentent des statistiques descriptives de la dispersion des valeurs selon les simulations avec de haut en bas : le 98e percentile, le 3e quartile, la médiane, le 1er quartile et le 2e percentile. Cette dispersion est aussi visible sous forme d’un diagramme en violon, sur la droite. Ces simulations ont été réalisées avec une valeur sélective relative pour les sourds de 1.

Après simulation des 20 générations, la fréquence des sourds est passée à 0,022% avec un taux d’homogamie de 90% contre 0,017% sans homogamie, soit une augmentation significative de 23% imputable à l’homogamie. Les simulations montrent que c’est au cours des trois premières générations d’homogamie que cette variation s’opère puis les variations sont marginales sur les générations suivantes. Au contraire, la fréquence de l’allèle récessif n’a pas varié significativement : 1,306% avec homogamie contre 1 ,304% sans homogamie. Ces simulations informatiques sont donc en accord avec les prédictions théoriques basées sur des équations mathématiques.

L’étude va plus loin en simulant l’impact synergique de l’homogamie et d’une hausse de la valeur sélective relative des individus sourds, c’est-à-dire de leur capacité à survivre et à se reproduire comparativement aux individus normaux. En supposant notamment une valeur sélective relative des sourds de 1,5, c’est-à-dire une augmentation de 50% par rapport à celle des personnes entendantes, voire plus, on observerait une augmentation significative de la fréquence de l’allèle récessif déficient dans la population. Mais cette valeur relative est loin d’être en phase avec la réalité puisque la fertilité relative des personnes sourdes est généralement faible, comprise entre 0,31 et 0,91 selon les études, c’est-à-dire toujours une fertilité plus faible que celle des personnes entendantes.

Avec cette fertilité réduite, comment expliquer que certains allèles récessifs déficients aient quand même été mesurés entre 1% et 4,4% dans les populations humaines ? Une des hypothèses avancées est celle d’une sélection équilibrante pour ces allèles. La fréquence allélique actuelle serait le résultat d’un équilibre entre l’effet négatif lié à la fécondité réduite observée chez les personnes sourdes et un effet positif que pourraient apporter ces allèles. Il a notamment été montré que le gène GJB2 est requis pour l’infection de Shigella flexneri, agent bactérien de la shigellose, une forme de dysenterie. Pour vérifier si les allèles déficients des sourds entraînent réellement une résistance à la dysenterie et si cette résistance s’exprime à l’état hétérozygote autant qu’à l’état homozygote, il faudra prêter l’oreille aux futurs travaux scientifiques.

Références de l’article

Derek C. Braun, Samir Jain, Eric Epstein, Brian H Greenwald, Brienna Herold, Margaret Gray (2020) Deaf intermarriage has limited effect on the prevalence of recessive deafness and no effect on underlying allelic frequency. PLoS ONE 15(11): e0241609.

Faut pas se « gèner » pour consommer des produits laitiers : la piste d’une adaptation culturelle ou du microbiote intestinal chez les populations pastorales d’Asie centrale davantage qu’une adaptation génétique

Les jeunes enfants sont dépendants d’une alimentation à base de lait et dans toutes les populations du monde, cela est rendu possible par l’expression du gène codant l’enzyme lactase, chargée de dégrader le lactose en galactose et glucose, des molécules plus simples et facilement incorporables par leur métabolisme. C’est à partir de trois ans que des inégalités apparaissent : certaines populations, dites « lactase persistantes » (LP) restent capables de digérer le lactose, même à l’âge adulte, tandis que d’autres perdent cette capacité du fait que le gène codant la lactase n’est plus exprimé. La répartition des populations LP, fréquentes chez les populations européennes, africaines et arabes, a été largement associée à leurs ancêtres qui ont domestiqué des animaux exploités pour leur lait depuis le Néolithique. L’hypothèse adaptative étant que chez les populations qui disposaient de la ressource en lait, le phénotype LP était avantagé car il apportait un gain nutritionnel, tandis que les individus non LP étaient victimes de crampes intestinales et de diarrhées sévères.

Une jument en cours de traite, dans la vallée de Suusamyr, au Kirghizistan (Crédit : Firespeaker, CC-BY-SA 3.0)

Une jument en cours de traite, dans la vallée de Suusamyr, au Kirghizistan (Crédit : Firespeaker, CC-BY-SA 3.0)

L’article de Laure Segurel et ses collaborateurs français et ouzbeks, publié dans PloS Biology le 8 juin 2020, vise à tester si cette hypothèse largement diffusée est généralisable à tous les peuples d’éleveurs. La comparaison de la fréquence des populations LP et de la carte des populations pastorales, dépendantes de l’élevage, montre une incohérence en Asie centrale (prise au sens large : ex-républiques soviétiques d’Asie centrale mais aussi Mongolie, Chine occidentale et sud-est de la Russie). Les éleveurs kazakhs et mongols ont seulement une fréquence d’individus LP de 12 à 30 %, malgré une consommation importante de produits laitiers. Le génotypage de 30 populations d’Asie centrale montre même que les populations d’éleveurs auraient une fréquence d’individus LP encore plus faible que les populations de fermiers, pourtant moins dépendants du lait dans leur alimentation. Ce résultat vient encore questionner la véracité de l’hypothèse adaptative sur l’ensemble de l’Eurasie.

Variation de la fréquence en Eurasie de l'allèle -13.910*T, responsable du phénotype LP, au cours des 10 000 dernières années.

Variation de la fréquence en Eurasie de l’allèle -13.910*T, responsable du phénotype LP, au cours des 10 000 dernières années. La carte de l’Eurasie est indiquée pour quatre périodes : il y a 4 000 à 10 000 ans, il y a 3 000 à 4 000 ans, les 3 000 dernières années (toutes trois alimentées par des échantillons d’Hommes issus de fouilles archéologiques) et enfin l’époque contemporaine (échantillons d’Hommes actuels). Les zones de couleurs représentent une extrapolation de la fréquence de l’allèle -13.910*T : les zones claires représentent des régions avec une faible fréquence de cet allèle (l’autre allèle C y domine) tandis que les zones sombres représentent des régions avec une forte fréquence de cet allèle. Pour les cartes de périodes anciennes, les points bleus foncés représentent l’allèle mutant T tandis que les points bleus clairs représentent l’allèle originel C. On voit sur la première carte que les premiers porteurs de l’allèle muté se situent en Europe centrale et on observe sur les suivantes l’expansion de l’allèle en Eurasie et sa forte augmentation de fréquence en Europe du Nord contrairement à l’Asie centrale où la fréquence allélique reste faible.

Vu que l’adaptation est un processus qui s’inscrit dans la durée, il est important de remettre la problématique dans une perspective temporelle, notamment parce qu’il y a pu y avoir au cours du temps des remplacements de populations. La version du gène responsable du phénotype LP, nommée allèle -13.910*T a ainsi été suivie chez 1 434 individus ayant vécu en Eurasie au cours des 10 000 dernières années. C’est en Europe centrale, il y a 5 950 ans, que l’allèle -13.910*T apparaît pour la première fois. Il se répand ensuite rapidement dans toute l’Eurasie à l’Age de Bronze tardif et on en trouve trace en Asie centrale pour la première fois il y a 3 713 ans. Et c’est à l’Age de Fer que le phénotype LP en Europe et en Asie centrale prend des trajectoires différentes : sur les 3 000 dernières années, la fréquence des individus LP s’élève en moyenne à 31% en Europe alors qu’elle n’est que de 6% en Asie centrale. Cela signifierait donc que l’allèle -13.910*T aurait été fortement sélectionné chez les peuples d’éleveurs d’Europe, notamment l’Europe du Nord, mais pas ou peu sélectionné chez les peuples d’éleveurs d’Asie centrale. Pourquoi ?

Même s’il existe une forte diversité d’animaux domestiques élevés pour leur lait en Asie centrale, le lait de jument occupe depuis très longtemps une place traditionnelle. Paradoxalement, c’est pourtant l’un de ceux dont la teneur en lactose est la plus importante mais c’est aussi l’un de ceux qui est le plus enclin à faire spontanément de la fermentation. Plus généralement, quelle que soit l’origine du lait, les peuples d’Asie centrale ont coutume de ne presque jamais consommer de lait brut, mais plutôt des produits laitiers issus de fermentation, par exemple les boissons fermentées nommées ‘kumis’ ou ‘ajrag’. Dans ces produits fermentés, la teneur en lactose est réduite et, à teneur égale, celui qui reste est plus facilement digéré dans les produits fermentés que dans les produits laitiers non fermentés. D’après l’hypothèse de l’article, si la consommation de produits laitiers en Europe du Nord et en Afrique a pu se faire par une adaptation génétique humaine, l’Asie centrale, où la mutation avantageuse était pourtant présente, a plutôt été marquée par une adaptation culturelle par consommation de produits laitiers fermentés.

Si les peuples d’Asie centrale ne se sont pas eux même adaptés à la consommation de lactose, ils auraient donc exploité les bactéries impliquées dans la fermentation. L’article pose aussi une deuxième hypothèse impliquant encore une fois des bactéries : celle d’un microbiote intestinal qui se serait adapté pour digérer le lactose. La métagénomique, c’est-à-dire l’analyse du contenu en espèces microbiennes dans un environnement donné, par exemple l’intestin, appliquée à des échantillons de différents peuples permettra de tester cette hypothèse.

Finalement, l’une des questions qui reste la plus ouverte est pourquoi y a-t-il pu y avoir adaptation génétique humaine si une autre voie était possible ? Est-ce lié au fait que l’élevage en Europe du Nord et en Afrique est dominé par les espèces bovines (spécificité en terme de quantité/qualité du lait ?) ? Ou est-ce simplement parce que les produits fermentés n’ont pas trouvé d’adeptes dans ces régions ? Nul doute que le généticien des populations ne réussira à répondre à ces questions que dans le cadre de travaux interdisciplinaires et ces passionnants futurs développements seront à surveiller… comme le lait sur le feu.

Références de l’article

Laure Segurel, Perle Guarino-Vignon, Nina Marchi, Sophie Lafosse, Romain Laurent, Céline Bon, Alexandre Fabre, Tatyana Hegay, Evelyne Heyer (2020) Why and when was lactase persistence selected for? Insights from Central Asian herders and ancient DNA. PLoS Biology 18(6): e3000742.

Les chiens ne font pas des chats (et encore moins des SHA*) : impact de la géographie, de l’usage et des pratiques de sélection sur la structuration génétique intra-race chez le chien

* A l’attention de l’historien du 4e millénaire qui aura eu la folie de choisir comme sujet de thèse “L’humour raté dans les blogues de génétique des populations au 3e millénaire”, l’auteur de ce billet précise qu’il a été rédigé en pleine période d’épidémie de Covid-19 de 2020 (la première année de l’épidémie) où la Solution Hydro-Alcoolique (SHA) était particulièrement recherchée pour ne pas tomber malade comme un chien.

Si la domestication du chien a commencé il y a 15 000 ans, le concept de races homogènes apparaît au 19e siècle et on distingue aujourd’hui 400 races de chiens. On a déjà évoqué sur ce blogue les spécificités génétiques des races modernes de chiens qui ont subi une sélection drastique des individus reproducteurs répondant aux standards de la race. La réduction de l’effectif efficace et l’augmentation de la consanguinité à l’intérieur de la race ont abouti à des races bien différenciées génétiquement, avec une perte de diversité génétique et l’accumulation d’allèles délétères chez de nombreuses races (voir aussi la sélection moderne des races équines qui a eu des effets similaires), causant des maladies génétiques fréquentes chez les races modernes. Toutefois, les races canines sont-elles réellement si homogènes génétiquement ? Ou est-on capable de distinguer plusieurs sous-populations distinctes chez des races qui, malgré une standardisation, se retrouvent mondialisées (sélectionnées sur plusieurs continents) et peuvent avoir plusieurs usages avec des schémas de sélection parfois indépendants ?

Six races de chiens étudiées dans l'article : la Levrette d'Italie (Chrsitina, CC-BY 2.0), le Shetland (Sannse, CC-BY-SA 3.0), le Lévrier anglais en pleine course (Matt Schumitz, CC-BY-SA 4.0), le Labrador Retriever guide d'aveugle (Honza Groh, CC-BY-SA 3.0), le chien finnois de Laponie (Svenska Mässan, CC-BY 2.0) et les types de Bergers belges : le Groenendael (Tsaag Valren, CC-BY-SA 4.0), le Malinois (Caronna, CC-BY-SA 3.0), le Tervueren (Ulrik Fällstrom, CC-BY-SA 2.5) et le Laekenois (Sannse, CC-BY-SA 3.0). Toutes les photos sont issues de Wikimedia Commons.

Six races de chiens étudiées dans l’article : la Levrette d’Italie (Chrsitina, CC-BY 2.0), le Shetland (Sannse, CC-BY-SA 3.0), le Lévrier anglais en pleine course (Matt Schumitz, CC-BY-SA 4.0), le Labrador Retriever guide d’aveugle (Honza Groh, CC-BY-SA 3.0), le chien finnois de Laponie (Svenska Mässan, CC-BY 2.0) et les types de Bergers belges : le Groenendael (Tsaag Valren, CC-BY-SA 4.0), le Malinois (Caronna, CC-BY-SA 3.0), le Tervueren (Ulrik Fällstrom, CC-BY-SA 2.5) et le Laekenois (Sannse, CC-BY-SA 3.0). Toutes les photos sont issues de Wikimedia Commons.

L’article de Sara Lampi et de ses collaborateurs finlandais, paru le 9 juin 2020 dans la revue Canine Medicine and Genetics, caractérise la structuration génétique intra-race de six races de chiens. Ces six races n’ont pas été choisies au hasard, mais en fonction de différentes caractéristiques :

  • Variation d’usage : la Levrette d’Italie (ou petit lévrier italien) et le Lévrier anglais (ou lévrier greyhound) sont des chiens utilisés pour les compétitions de courses de vitesse, tandis que le Labrador (ou Labrador Retriever) est utilisé comme chien de service, notamment guides d’aveugle, sachant que des individus de toutes ces races sont aussi élevés comme des chiens de compagnie ou pour les concours canins.
  • Variation de popularité : si le Shetland (ou berger des Shetland) présente une popularité internationale, le Chien finnois de Laponie est peu connu en dehors de la Finlande.
  • Variation de types : si elles sont toutes regroupées sous la race Berger Belge, on en distingue quatre variétés : le Malinois, le Groenendael, le Tervueren et le Laekenois.

Entre 90 et 608 individus de chaque race ont été comparés pour 1 319 régions ponctuelles du génome (Single Nucleotide Polymorphisms) et la structuration intra-race a été étudiée par des approches de génétique des populations.

Structuration génétique des races de levrette d'Italie (en haut) et du lévrier anglais (en bas).

Structuration génétique selon l’origine géographique pour la levrette d’Italie (en haut) et selon l’usage pour le lévrier anglais (en bas). La structuration de la diversité génétique intra-race est étudiée par deux méthodes : le positionnement multidimensionnel (ou multimensional scaling, MDS), au centre, et la méthode d’inférence bayésienne STRUCTURE, à droite. Pour la méthode MDS, les points représentent des individus de la race, colorés en fonction de l’origine géographique (levrette d’Italie) ou en fonction de l’usage (lévrier anglais). La position des points symbolise la proximité génétique des individus. On distingue un nuage de points à part pour les levrettes d’Italie américaines (rose) : cela signifie qu’elles sont génétiquement distinctes des individus européens (autres couleurs). De même, les lévriers anglais utilisés pour les courses de vitesse (orange) sont génétiquement distincts des individus utilisés comme chiens de compagnie ou pour les concours de beauté (bleu). Des traits indiquent de rares individus dont le fond génétique est en désaccord avec leur usage. Sur les analyses de STRUCTURE (à droite), les groupes génétiques inférés par l’analyse des marqueurs SNPs sont représentés par des couleurs différentes. Pour chaque race, c’est la solution à K=4 groupes qui semblait la plus vraisemblable. Les individus sont représentés par les bâtons de l’axe des abscisses tandis que les ordonnées représentent la probabilité d’assignation d’un individu à l’un des quatre groupes génétiques. Ces résultats de STRUCTURE viennent compléter les analyses de MDS. Pour la levrette d’Italie, les chiens des USA forment un ensemble homogène, assigné majoritairement au groupe génétique bleu, ce qui traduit leur diversité génétique réduite. Aucun individu européen n’est assigné majoritairement à la population bleue, ce qui traduit l’isolement des Américains vis-à-vis des Européens. Les grandes différences d’assignation des individus européens montre la diversité plus importante des levrettes d’Italie européennes, en cohérence avec l’origine européenne de la race. L’analyse STRUCTURE pour les lévriers anglais confirme aussi la distinction génétique selon les usages : les chiens de concours de beauté ou de compagnie sont majoritairement assignés au groupe génétique vert, tandis que les chiens de course sont majoritairement assignés aux groupes rouge, jaune ou bleu.

L’origine géographique est le facteur explicatif principal de la structuration génétique pour la Levrette d’Italie et le Shetland. Pour chaque race, les chiens américains semblent représenter un sous-échantillon des chiens européens. Par exemple, pour la levrette d’Italie, l’indice de fixation FST est plus grand chez l’échantillon des USA (FST=0,15) par comparaison de celui de l’échantillon européen (FST=0,08). Les individus utilisés pour la reproduction sont probablement volontiers échangés entre pays européens, dont ces races sont originaires et pour lesquels la diversité est la plus forte. Au contraire, les échanges transatlantiques sont probablement plus rares. Enfin, les individus américains seraient le résultat d’un effet de fondation, c’est-à-dire d’une réduction de la diversité consécutivement à la “colonisation” d’un nouvel espace par un sous-échantillon de la population originelle, européenne.

L’usage est le facteur explicatif majeur de la structuration génétique pour le Lévrier anglais et le Labrador. Les Lévriers anglais utilisés pour les courses se distinguent génétiquement de ceux utilisés pour les concours de beauté ou comme chiens de compagnie. Un résultat similaire est trouvé entre les Labradors utilisés comme chiens de services et les Labradors de concours. Cela témoignerait de schémas de croisements relativement indépendants entre les usages, ce qui a mené à une dérive génétique au sein de chaque usage. Les chiens de concours (FST=0,34) sont largement plus différenciés que les chiens de course (FST=0,07), chez le Lévrier anglais (résultat similaire chez le Labrador), ce qui s’explique peut-être par la sur-représentation de quelques individus primés dans les pedigrees de ce type de chiens, entraînant une diminution de l’effectif efficace.

Structuration génétique pour les variétés morphologiques chez le Berger belge (en haut) et pour les stratégies de sélection chez le Chien finnois de Laponie (en bas).

Structuration génétique pour les variétés morphologiques chez le Berger belge (en haut) et pour les stratégies de sélection chez le Chien finnois de Laponie (en bas). Pour les explications techniques sur les méthodes, voir la précédente figure. Les analyses montrent que les Malinois et les Laekenois ne sont pas génétiquement distincts, tout du moins pas sur les marqueurs SNPs répartis sur tout le génome : on pourrait probablement les distinguer en étudiant la variabilité génétique du gène expliquant l’aspect du poil, qui est le caractère phénotypique majeur distinguant ces deux variétés de Bergers belges. Les Groenendaels et les Tervuerens sont génétiquement distincts des deux premiers mais moins distincts l’un par rapport à l’autre, en cohérence avec leurs ressemblances phénotypiques (c’est principalement la couleur du pelage qui les distingue). Pour le Chien finnois de Laponie, les individus issus d’un schéma de sélection plus proche des chiens utilisés par les Samis, des éleveurs de rennes, (‘Herding background’) sont génétiquement distincts des autres individus de la race, comme le montrent la position des points sur la MDS et l’assignation majoritaire au groupe rouge par STRUCTURE, alors que les autres individus sont majoritairement assignés au groupe vert. L’article précise que des chiens issus de ce schéma de sélection proche des chiens de Samis sont régulièrement utilisés comme géniteurs dans les schémas de sélection classique (voir les individus majoritairement rouges, au milieu des individus verts). L’inverse est moins vrai (pas d’individu majoritairement vert au milieu des rouges).

L’analyse des variétés de Bergers belges montre que le Malinois et le Laekenois sont génétiquement différenciés du Groenendael et du Tervueren. Les deux premiers types partagent le point commun d’être particulièrement utilisés comme chiens de travail (bergers mais aussi comme chiens policiers) et se distinguent par le type de pelage (le Laekenois est à poils durs), qui est un caractère monogénique. Les croisements entre ces deux variétés sont autorisés, expliquant leur proximité génétique. Le Groenendael et le Tervueren se distinguent aussi pour un caractère monogénique : la couleur du pelage (noir chez le Groenendael et sable chez le Tervueren). Ainsi, dans une même portée où ce caractère ségrège, des chiots peuvent être inscrits dans l’une ou l’autre des variétés.

Deux groupes génétiques différenciés se distinguent pour les Chiens finnois de Laponie. L’analyse des pedigrees des individus a permis de comprendre les raisons de cette distinction. Même si les deux groupes génétiques sont phénotypiquement difficiles à différencier, le groupe désigné comme ‘Herding background’ correspond aux descendants de croisements menés par une association fondée en 1981 et souhaitant “revenir aux sources” de la race en repartant des chiens de berger utilisés par les Samis pour garder les rennes, l’utilisation originelle de la race.

Pour conclure, cette étude montre que malgré les standards définis pour chaque race, plusieurs sous-populations génétiquement différenciées peuvent être identifiées. La mondialisation des races de chiens les plus populaires a entraîné des effets de fondation en dehors de leurs zones d’origine et les migrations peu fréquentes entre les groupes géographiquement séparés contribuent à augmenter l’isolement génétique. L’élitisation de certains pedigrees qui donnent la part belle aux individus primés aux concours contribue aussi à entraîner une dérive génétique par rapport aux autres individus de la race utilisés comme chiens de travail. Enfin, des visions et des pratiques différentes de l’activité de sélection au sein d’une même race peut aussi entraîner une structuration de la diversité génétique. Dans un contexte où la baisse de diversité génétique chez des races modernes de plus en plus consanguines a multiplié les maladies génétiques, l’identification des populations structurées dans la race pourrait permettre d’atténuer cette consanguinité et de mieux raisonner la gestion de la diversité intra-race. Même si l’expression “malade comme un chien” trouve ses origines bien avant l’apparition des races modernes de chiens, ce progrès contribuerait peut-être à vider cette expression de son sens moderne.

Références de l’article

Sara Lampi, Jonas Donner, Heidi Anderson & Jaako Pohjoismäki (2020) Variation in breeding practices and geographic isolation drive subpopulation differentiation, contributing to the loss of genetic diversity within dog breed lineages. Canine Medicine and Genetics, 7:5.

Surf au bout du monde : vagues de peuplement des îles Samoa

L’archéologie montre que quand les peuples de langue papoue et les Aborigènes d’Australie réalisent le premier peuplement humain de l’Océanie il y a environ 50 000 ans, ils ne colonisent que l’Océanie proche (jusqu’aux Iles Salomon). Une seconde vague de migration, composée de peuples de langues austronésiennes, survient beaucoup plus récemment il y a 5 000 ans et se poursuit cette fois-ci jusqu’à l’Océanie lointaine, notamment le Vanuatu, la Nouvelle-Calédonie, Fidji, Tonga et Samoa. Ainsi, les restes archéologiques font remonter les premiers peuplements aux îles Samoa il y a seulement 2 750 à 2 880 ans avant une histoire démographique assez floue jusqu’à l’arrivée des premiers Européens au XVIIIe siècle.

Trois jeunes femmes samoanes de 1902. Photographie de Ernst von Hesse-Wartegg (1854-1918), publiée dans le livre Samoa, Bismarckarchipel und Neuguinea - Drei deutsche Kolonien in der Südsee; (Allemagne, 1902). Photographie du domaine public.

Trois jeunes femmes samoanes de 1900. Photographie de Ernst von Hesse-Wartegg (1854-1918), publiée dans le livre Samoa, Bismarckarchipel und Neuguinea – Drei deutsche Kolonien in der Südsee; (Allemagne, 1902). Photographie du domaine public.

L’étude de Daniel N. Harris et ses collaborateurs américains, néo-zélandais et samoans, publiée dans le journal Proceedings of the National Academy of Sciences of the United States of America vise à comprendre l’évolution démographique des Samoans au cours de leur Histoire. Un total de 1 197 génomes complets de Samoans ont été séquencés et soumis à des analyses de génomique des populations.

L’analyse génétique confirme que les Samoans sont très majoritairement d’origine austronésienne, avec de rares introgressions de populations d’Europe de l’Ouest, du Sud de l’Asie et d’Afrique de l’Ouest. Toutefois, les Samoans auraient en moyenne 24 % d’origine papoue. Cela suggère un phénomène déjà montré pour d’autres peuples océaniens : avant d’arriver en Océanie lointaine, les peuples de langues austronésiennes se seraient hybridés avec les peuples papous rencontrés en Océanie proche. L’étude montre aussi que l’origine papoue est corrélée à l’origine dénisovienne. Les Dénisoviens ou Hommes du Denisova représentent une espèce d’Hommes “fossiles” apparentés aux Hommes de Néanderthal. Les Papous sont issus de populations humaines s’étant hybridées avec ces Dénisoviens, peut-être en Asie du Sud-Est, et conservent 3 à 6% de leur génome hérité de leurs ancêtres dénisoviens. Par leur ascendance papoue, les Samoans auraient aussi hérité de quelques portions de génome de Dénisoviens, à un degré moindre.

Variation de l’effectif efficace Ne, représenté ici après une transformation logarithmique, dans la populations des deux îles Savaii (rouge) et Upolu (bleu) en fonction du nombre de générations depuis le présent. Il y a 92 à 96 générations (2 750 à 2 880 ans), l’île d’Upolu est colonisée par des peuples de culture Lapita. Il y a 70 à 90 générations (2 100 à 2 700 ans), les autres îles sont colonisées par de petits groupes isolés. Il y a 50 à 67 générations (1 500 à 2 000 ans), possibles migrations d’individus depuis les îles Carolines. Il y a 33 à 50 générations (1 000 à 1 500 ans), les poteries disparaissent, en même temps qu’un premier goulot d’étranglement majeur sur les îles Samoa. Il y a 27 à 33 générations, les voyages entre archipels du Pacifique s’intensifient. Il y a 17 à 27 générations, des indices montrent une forte activité humaine aux Samoas:développement de chefferies, de monuments, d’infrastructures agricoles en terrasses, etc. Il y a 8 générations (230 ans), arrivée des premiers Européens qui apportent des maladies sur les îles, aboutissant au 2e goulot d’étranglement majeur sur les îles Samoa.

Variation de l’effectif efficace Ne, représenté ici après une transformation logarithmique, dans la populations des deux îles de Savai’i (rouge) et d’Upolu (bleu) en fonction du nombre de générations depuis le présent. La variation de l’effectif efficace est indiquée par une ligne. Cette ligne est comprise dans un polygone qui symbolise son intervalle de confiance à 95%. Les principaux événements historiques supposés sur les îles Samoa sont indiqués par des pictogrammes. Il y a 92 à 96 générations (2 750 à 2 880 ans), l’île d’Upolu est colonisée par des peuples de culture Lapita. Il y a 70 à 90 générations (2 100 à 2 700 ans), les autres îles sont colonisées par de petits groupes isolés. Il y a 50 à 67 générations (1 500 à 2 000 ans), possibles migrations d’individus depuis les îles Carolines (Micronésie). Il y a 33 à 50 générations (1 000 à 1 500 ans), les poteries disparaissent, en même temps qu’un premier goulot d’étranglement majeur sur les îles Samoa. Il y a 27 à 33 générations (800 à 1 000 ans), les voyages entre archipels du Pacifique s’intensifient. Il y a 17 à 27 générations (500 à 800 ans), des indices montrent une forte activité humaine aux Samoa : développement de chefferies, de monuments, d’infrastructures agricoles en terrasses, etc. Il y a 8 générations (230 ans), arrivée des premiers Européens qui apportent des maladies sur les îles, aboutissant au 2e goulot d’étranglement majeur sur les îles Samoa.

Le modèle démographique construit à partir des données génétiques donne des indications sur les changements d’effectif efficace de la population des Samoa. Cet effectif efficace représente l’effectif d’une population théorique qui serait soumise à la même dérive génétique que la population réelle. Les variations de l’effectif efficace sont à mettre en relation avec les événements historiques connus. L’histoire démographique des Samoa commencerait par une période de croissance débutée il y a 100 générations. En considérant un temps intergénérationnel de 30 ans, cela représente environ 3 000 ans. Ce temps est cohérent avec les premiers restes archéologiques et l’apparition de la culture Lapita, connue pour ses poteries décorées. Pendant 70 générations, l’effectif efficace des Samoans serait resté très faible (entre 700 et 3 440 individus), ce qui suggère de petites populations sur les îles Samoa. Cela confirme aussi la faible quantité de sites archéologiques découverts sur les îles Samoa en comparaison des îles Fidji et Tonga qui ont connu une croissance démographique plus précoce.

Alors que l’histoire démographique était jusqu’alors restée similaire entre les deux îles, l’histoire démographique de l’île d’Upolu, qui compte aujourd’hui les villes les plus importantes des Samoa, diverge de celle de Savai’i à partir de 30 à 35 générations avant aujourd’hui, soit il y a 900 à 1 050 ans, après une longue période de goulot d’étranglement (réduction de la taille de la population). Après cette date, la population des Samoa est marquée par une forte période de croissance exponentielle. Ce brusque changement d’effectif efficace suggère un changement démographique important il y a 900 à 1 050 ans. La période du goulot d’étranglement commence après l’arrivée supposée de peuples venus des îles Carolines et/ou de Micronésie. Que s’est-il passé sur cette période ? Y a-t-il eu un remplacement de la population initiale des Samoa par ces nouveaux arrivants ? Les deux populations se sont-elles mélangées ? On manque pour le moment de données susceptibles d’aider à répondre à ces questions, notamment d’ADN ancien qui pourrait être extrait des squelettes des habitants de l’époque.

Beaucoup plus récemment, à la fin de la période de croissance exponentielle, on est capable d’identifier un deuxième goulot d’étranglement il y a environ 10 générations, c’est-à-dire 300 ans. Cela correspond à l’époque des premiers contacts avec les Européens qui ont apporté des maladies auxquelles le système immunitaire des Samoans n’était pas préparé, notamment la rougeole qui se révèle dangereuse lorsque cette maladie virale est contractée à l’âge adulte.

Références de l’article

L’écho des savanes : effets de fondation en série chez le moustique Anopheles gambiae, principal vecteur de la malaria

Les contraintes spatiales sont des facteurs évolutifs importants pour les populations d’êtres vivants. Les phénomènes de migration (échanges d’allèles entre populations) peuvent être réduits par des barrières physiques (océans, routes, etc.) ou des barrières écologiques (environnements défavorables). Par exemple, les moustiques de l’espèce Anopheles gambiae sont rencontrés de l’Ouest à l’Est de l’Afrique sub-saharienne, sur une aire de répartition très large comprenant des fleuves, des montagnes et des mers.

En tant que vecteurs du paludisme, les moustiques représentent par ailleurs encore une menace de santé publique très sérieuse avec plus de 200 millions de malades par an dont environ 500 000 cas mortels. Parmi les nouvelles méthodes de lutte à l’étude, le forçage génétique (‘gene drive’ en anglais) consiste à introduire parmi les populations de moustiques des individus génétiquement modifiés. La modification génétique empêche le moustique de transmettre la maladie et a la capacité de se multiplier dans la population de manière plus rapide qu’une simple transmission mendélienne classique, grâce à la technologie de nucléase site-spécifique de type CRISPR/Cas9. Le déploiement de cette stratégie, encore très controversée, nécessite de mieux comprendre les relations génétiques entre les populations de moustiques en région sub-saharienne.

Moustique femelle de l'espèce Anopheles gambiae, se nourissant de sang humain.

Moustique femelle de l’espèce Anopheles gambiae, se nourrissant de sang humain (Crédit photo : James D. Gathany, Centers for Disease Control and Prevention, Domaine Public).

Les travaux de Hanno Schmidt et de ses collaborateurs des Etats-Unis, de Zambie et des Comores, publiés dans le journal Communications Biology, visent à comprendre l’impact de ces barrière géologiques sur l’évolution génétique des moustiques de l’espèce Anopheles gambiae. Pour atteindre cet objectif, ils ont réalisé le séquençage du génome complet de 111 moustiques échantillonnés de l’Ouest à l’Est de la zone subsaharienne : au Mali, au Cameroun, en Zambie, en Tanzanie et sur les îles de Grande Comore, de Mohéli et d’Anjouan qui constituent les îles principales de l’archipel des Comores.

Les moustiques de chacun de ces pays se regroupent au sein de groupes génétiques distincts. Il est à noter que pour les Comores, ce sont trois groupes génétiques distincts, un pour chaque île, qui sont identifiés. Les distances génétiques entre ces groupes génétiques ne sont pas corrélées aux distances géographiques; le facteur insulaire semble beaucoup plus déterminant : ainsi, la différentiation entre les populations des îles de l’archipel des Comores est plus importante qu’entre les populations du continent, y-compris les plus éloignées (Mali vs Tanzanie).

Dendrogramme basé sur les indices de différentiation FST.

Dendrogramme non enraciné basé sur les valeurs de FST par paires. La longueur des branches est proportionnelle aux valeurs de FST (indice de différentiation). Les couleurs représentent l’origine des moustiques échantillonnés : le Mali (bleu foncé), le Cameroun (bleu turquoise), la Zambie (vert foncé), la Tanzanie (vert clair), l’île de Grande Comore (violet), l’île de Mohéli (orange) et l’île d’Anjouan (rouge). Cet arbre met en avant la proximité génétique des populations du Mali et du Cameroun séparées par des branches courtes et met en relief la forte différentiation génétique des populations des trois îles de l’archipel des Comores, pourtant proches géographiquement. La topologie de l’arbre montre aussi un continuum génétique entre les populations de l’Ouest (Mali, Cameroun) à gauche du graphique et de l’Est (Zambie, Tanzanie, l’ïle de Grande Comore et les deux autres îles majeures de l’archipel) vers la droite de l’arbre.

La taille efficace (taille d’une population idéale soumise aux mêmes niveaux de dérive génétique que la population étudiée) estimée à partir de chaque population suit des trajectoires similaires sur les périodes les plus anciennes, à une époque où toutes les populations n’en formaient qu’une. Puis il y a 200 000 ans, les populations occidentales (Mali et Cameroun) et orientales (les autres populations) africaines se séparent, sachant que la taille efficace des populations orientales baisse. Les estimations montrent ensuite une succession de réduction en cascade de taille efficace, d’abord pour la Tanzanie pour la plus ancienne, puis la Zambie, puis les îles d’Anjouan et de Mohéli et la plus récente, celle de la Grande Comore.

Ces estimations de taille efficace sont bien corrélées avec la diversité génétique des populations : les populations présentant le plus de diversité génétique sont celles de l’Ouest (Mali et Cameroun) tandis qu’à l’Est, les populations des Comores ont le moins de diversité.

Taille efficace

Effets de fondation en série chez Anopheles gambiae. En haut, estimation de la taille efficace de la population en fonction de la période. La barre verticale à gauche représente la période la plus récente (il y a 30 000 ans) pour laquelle l’estimation est disponible pour toutes les populations. Sont aussi représentées les dates de formation géologique des îles de Mohéli, d’Anjouan et de Grande Comore. En bas, boîtes à moustaches représentant la variabilité génétique de chaque population. Le nombre d’individu (n) étudié pour chaque population est précisé. On observe une bonne corrélation entre la taille efficace d’une population et sa variabilité génétique.

Si l’origine de Anopheles gambiae se trouve vers le Mali, où la diversité génétique de cette espèce est maximale, le fait que ces réductions successives de la taille efficace soient corrélées avec l’expansion de la zone de répartition de cette espèce vers l’Afrique orientale suggère des effets de fondation successifs, c’est-à-dire une réduction de la diversité chez une population constituée à partir de l’échantillonnage d’une population originelle. Comme l’écho d’un son s’atténuant après chaque réverbération, la diversité génétique diminue entre chaque effet de fondation.

L’étude a permis de dater ces effets de fondation, mais aussi de proposer des hypothèses quant aux barrière géographiques qui auraient pu les causer. Ainsi, le franchissement du bassin du fleuve Congo, du rift est-africain et du canal du Mozambique ont pu limiter les migrations des populations de moustique et éroder leur diversité génétique au cours des 200 000 dernières années.

Il est intéressant de noter que cette espèce de moustiques aurait atteint l’archipel des Comores, il y a 70 000 ans, bien avant l’établissement permanent des populations humaines sur cet archipel, il y a seulement 1 300 ans. Avant l’arrivée de ces premières populations humaines, les moustiques comoriens auraient eu d’autres hôtes, comme des chauve-souris ou des oiseaux. Ces résultats viennent confirmer de précédentes études suggèrant que les moustiques de l’espèce Anopheles gambiae ne se seraient adaptés pour être capables de se nourrir de sang humain que très récemment, il y a environ 10 000 ans.

Modèle de dispersion de Anopheles gambiae depuis son centre d'origine en Afrique de l'Ouest, jusqu'à l'île de Grande Comore, en passant par la Zambie, la Tanzanie et les îles de Mohéli et d’Anjouan (Comores), au cours des 200 000 dernières années. Chaque région est caractérisée par une population de A. gambiae formée à partir d’un sous-échantillon de la population directement plus occidentale. Par exemple, la population de Tanzanie est formée d’un sous-échantillon de moustiques issus de Zambie. Chaque formation de nouvelle population est le résultat du succès de quelques moustiques à franchir une barrière écologique, par exemple le bassin de la rivière Congo, le rift africain ou le canal de Mozambique. Chaque constitution de nouvelle population par échantillonnage de la précédente s’accompagne d’une perte de diversité, aboutissant à terme à ces effets de fondation en série.

Modèle de dispersion de Anopheles gambiae depuis son centre d’origine en Afrique de l’Ouest, jusqu’à l’île de Grande Comore, en passant par la Zambie, la Tanzanie et les îles de Mohéli et d’Anjouan (Comores), au cours des 200 000 dernières années. Chaque région est caractérisée par une population de A. gambiae formée à partir d’un sous-échantillon de la population directement plus à l’Ouest. Par exemple, la population de Tanzanie est formée d’un sous-échantillon de moustiques issus de Zambie. Chaque formation de population est le résultat du succès de quelques moustiques à franchir une barrière écologique, que ce soit le bassin du fleuve Congo, le rift est-africain ou le canal du Mozambique. Chaque constitution de nouvelle population par échantillonnage de la précédente s’accompagne d’une perte de diversité, aboutissant à terme à ces effets de fondation en série.

Dans un contexte où l’efficacité des stratégies de forçage génétique pour lutter contre le paludisme reste à prouver, les auteurs suggèrent que des tests en situation réelle pourraient être réalisés sur certaines îles des Comores. L’isolement génétique des populations de moustique des îles comoriennes vis-à-vis des autres îles de l’archipel et a fortiori vis-à-vis du continent pourrait offrir des gages de confinement (relatif) pour de telles expériences, avant d’envisager sa généralisation à l’ensemble de l’Afrique ou son abandon, en fonction des résultats.

Références de l’article

Hanno Schmidt, Yoosook Lee, Travis C. Collier, Mark J. Hanemaaijer, Oscar D. Kirstein, Ahmed Ouledi, Mbanga Muleba, Douglas E. Norris, Montgomery Slatkin, Anthony J. Cornel & Gregory C. Lanzaro (2019) Transcontinental dispersal of Anopheles gambiae occurred from West African origin via serial founder events. Communications Biology, 2:473. Publié le 19 décembre 2019

Révolution et contre-révolution : émergence de populations virulentes de pathogènes suite au déploiement massif d’une source de résistance unique chez le riz pendant la Révolution verte

Si l’effet de la domestication et de la création variétale sur la diversité des plantes cultivées est largement étudié, l’impact des activités humaines sur les populations de pathogènes affectant les plantes reste beaucoup moins connu. Parmi l’histoire récente de l’agriculture, la Révolution verte est, dans un contexte d’accroissement démographique après la Seconde Guerre mondiale, une période marquée par de profondes transformations du système agricole, parmi lesquelles la croissance exponentielle de la monoculture. Ainsi, aux Philippines, de nombreuses variétés locales ont été cultivées par les fermiers pendant près de 3 500 ans jusqu’à la création dans les années 1960 de l’International Rice Research Institute (IRRI) pour répondre aux enjeux de croissance démographique et de sécurité alimentaire. Les travaux d’amélioration génétique de cet institut ont mené à l’obtention des variétés à haut rendement IR20 en 1967 puis IR64 au milieu des années 1980, toutes deux porteuses du gène Xa4, permettant la résistance à la bactériose du riz, une maladie foliaire causée par la bactérie Xanthomonas oryzae pv. oryzae (appelée ‘Xoo’ dans la suite de l’article). Le succès de ces variétés et de leurs descendantes fut tel qu’elles furent déployées sur des millions d’hectares dans toute l’Asie. Suite à cela, des populations de bactéries Xoo virulentes, c’est-à-dire contournant la résistance, sont apparues aux Philippines.

Symptômes de bactériose sur des feuilles de riz, causée par la bactérie Xanthomonas oryzae pv. oryzae

Symptômes de bactériose sur des feuilles de riz, causés par la bactérie Xanthomonas oryzae pv. oryzae (crédit photo : Donald Groth, publié sur Wikimedia Commons sous licence Creative Commons Attribution 3.0)

Le travail de Ian Lorenzo Quibod et de ses collaborateurs des Philippines, d’Indonésie et du Gabon, publié dans la revue The ISME Journal fin octobre 2019, vise à comprendre les mécanismes de cette apparition de populations virulentes de pathogènes en réponse au déploiement des variétés de riz résistantes. Plus de 70 % des variétés de riz obtenues entre 1960 et 2010 portent la résistance Xa4, alors qu’il existe d’autres sources de résistance qui ont été très peu utilisées (xa5, xa13, Xa7, Xa21). La part de culture des variétés portant le gène de résistance Xa4 a même atteint son maximum en 1988 avec 91,5 % de la surface cultivée en riz aux Philippines portant cette résistance, avant de décroître par la suite, du fait de l’émergence de bactéries Xoo virulentes sur ces cultures. Les tests pathologiques réalisés pour 1822 isolats de bactéries Xoo échantillonnés entre 1970 et 2015 ont montré que la proportion de souches virulentes vis-à-vis des riz portant Xa4 était d’environ 20 % au début des années 1970 puis a rapidement dépassé 50 % jusqu’à la fin des années 1980 avant d’atteindre 84 % au début des années 1990, lors du maximum du déploiement de la résistance Xa4 parmi les variétés de riz cultivées dans l’archipel des Philippines.

L’étude des 11 races de bactéries Xoo identifiées en fonction de leur capacité à se développer sur un panel de variétés de riz portant différentes résistances montre que certaines races sont retrouvées tout au long de l’intensification du déploiement de la résistance Xa4 (races 2 et 3 par exemple) alors que le complexe de races 9com semble, lui, émerger vers le début des années 1990.

Phylogénie de Xanthomonas

Relations phylogénétiques et représentation temporelle et spatiale des souches de Xanthomonas oryzae pv. oryzae aux Philippines entre 1970 et 2015. A. Arbre phylogénétique construit par comparaison des régions génomiques communes entre souches. Selon la topologie de l’arbre, chaque souche est ainsi classée dans l’un des six groupes génétiques identifiés : PX-A1, PX-A2, PX-A3, PX-B1, PX-B2, PX-C1. En plus d’être comparées au niveau génomique, les souches Xoo ont aussi été comparées en terme de virulence vis-à-vis de huit variétés de riz présentant chacune un gène de résistance Xa différent (en haut à droite de la figure). Chaque variété de riz est ainsi indiquée comme sensible (S), moyennement sensible (MS), moyennement résistante (MR) ou résistante (R) à la souche correspondante. En fonction de leur capacité à infecter ces variétés de riz témoins, les souches sont classées en races. B. Distribution dans le temps de la proportion de souches de bactéries Xoo isolées entre 1970 et 2015. Les souches sont indiquées selon le groupe génétique qui leur a été assigné. Les couleurs du graphique sont les mêmes que celles de l’arbre phylogénétique. Les périodes de temps réunissent les souches échantillonnées sur cinq années consécutives. L’axe des ordonnées indique la proportion sur l’ensemble des 91 souches étudiées sur la période 1970-2015. On notera par exemple que les souches, non virulentes, du groupe PX-B2 (violet) ont fini par disparaître au cours du suivi, tandis que les souches, virulentes, du groupe PX-A1 (vert le plus foncé), absentes au début du suivi, ont émergé au cours de l’étude, en parallèle du déploiement de la résistance. C. Distribution spatiale des souches de Xoo dans l’archipel des Philippines. Les souches sont représentées en fonction de leur assignation aux groupes génétiques. Les couleurs sont les mêmes que pour l’arbre phylogénétique.

Afin de comprendre les changements génomiques des bactérie sur cette période, le génome de 91 souches de Xoo a été séquencé. La comparaison de ces génomes a permis de distinguer six groupes génétiques : PX-A1, PX-A2, PX-A3, PX-B1, PX-B2 et PX-C1. Ces groupes étaient très variables en terme de mutations et de recombinaisons, montrant une histoire évolutive complexe. Plusieurs variations nucléotidiques étaient associées à la virulence vis-à-vis du gène Xa4, notamment pour des gènes impliqués dans les systèmes de sécrétion, la dégradation de la paroi cellulaire, la détoxification des Reactive Oxygen Species (ROS) et la production de lypopolysaccharides. Plusieurs de ces variations se sont aussi avérées être sous sélection purifiante, c’est-à-dire comme subissant une intense contre-sélection contre les mutations affectant la fonction des gènes correspondants. La multiplicité des gènes candidats associés à l’émergence de la virulence vis-à-vis de la résistance Xa4 suggère que plusieurs acteurs moléculaires différents auraient pu évoluer en réponse au déploiement de la résistance Xa4 parmi les variétés de riz cultivées.

Globalement, l’étude montre plusieurs destinées possibles des souches de bactéries Xoo avant, pendant et après le déploiement des variétés de riz portant la résistance Xa4. Les souches de Xoo non virulentes, par exemple celles du groupe génétique PX-B2, en forte fréquence avant le déploiement, ont fini par disparaître du fait qu’elles n’étaient plus capables d’infecter les nouvelles variétés de riz résistantes. Les souches virulentes vis-à-vis de la résistance Xa4, comme celles du groupe génétique PX-B1, notamment la race 2, déjà présentes en fréquence limitée avant le déploiement, car non avantagées, ont par la suite été avantagées par le déploiement de la résistance Xa4 et ont augmenté en fréquence. Enfin, des souches inconnues avant le déploiement, comme celles du groupe génétique PX-A1, notamment le complexe de races 9com, ont pu émerger suite au déploiement.

Synthèse des modifs

Schéma synthétique montrant l’effet du déploiement progressif au cours de la Révolution verte des variétés de riz portant la résistance Xa4 (cf. graphique) sur l’évolution des fréquences de souches de Xanthomonas oryzae pv. oryzae. Avant la Révolution verte (gauche du schéma), les souches virulentes (bleu) et les souches non virulentes (violet) co-existaient. Puis le déploiement de la résistance chez le riz a agi comme un goulot d’étranglement sur la diversité des souches pré-existantes : les souches non virulentes, incapables d’infecter ces nouvelles variétés de riz résistantes, ont disparu tandis que les souches virulentes ont augmenté en fréquence car elles étaient les seules à pouvoir se développer dans les cultures de riz. Cette forte pression de sélection sur les pathogènes a même pu entraîner l’apparition de nouvelles souches virulentes (vert), jusqu’alors inconnues dans l’archipel des Philippines. A droite, le goulot d’étranglement a cessé quand la résistance Xa4 n’a plus été systématiquement incorporée aux nouvelles variétés de riz cultivées dans l’archipel. Toutefois, la composition des populations de pathogènes avait drastiquement changé entre avant et après le goulot d’étranglement.

La prise en compte de la co-évolution entre la plante hôte et ses pathogènes dans un contexte de changement de pratiques agricoles est une question primordiale pour la sécurité alimentaire. Des études comme celle-ci permettront peut-être de mieux réfléchir aux stratégies futures de déploiement spatial et temporel des sources génétiques de résistance, à l’avenir.

Références de l’article

Ian Lorenzo Quibod, Genelou Atieza-Grande, Eula Gems Oreiro, Denice Palmos, Marian Hanna Nguyen, Sapphire Thea Coronejo, Ei Ei Aung, Cipto Nugroho, Veronica Roman-Reyna, Maria Ruby Burgos, Pauline Capistrano, Sylvestre G. Dossa, Geoffrey Onaga, Cynthia Saloma, Casiana Vera Cruz, Ricardo Oliva (2019) The Green Revolution shaped the population structure of the rice pathogen Xanthomonas oryzae pv. oryzae. The ISME Journal, doi:10.1038/s41396-019-0545-2. Publié le 30 octobre 2019

De la percée du cheval persan au ré-étalon-nage à la baisse de la diversité à l’époque moderne : 5 000 ans d’histoire du cheval parcourus au galop

La domestication du cheval a révolutionné les civilisations humaines, aussi bien en terme de moyens de transport, d’échanges commerciaux ou de stratégies de guerre. Les premières traces de traite de jument, de harnachement ou de mise en captivité de cheval remontent à 5 500 ans dans les steppes d’Asie centrale. Cependant, les chevaux concernés ne seraient pas les ancêtres des chevaux modernes (Equus caballus) mais ceux des chevaux de Przewalski (Equus przewalskii). Une part de mystère subsiste quant au lieu de la domestication du cheval moderne : les steppes pontiques (au Sud-Est de l’Europe), l’Anatolie ou la péninsule ibérique ? Une précédente étude suggère aussi que suite à cette domestication, le génome du cheval aurait beaucoup changé au cours des 2 300 dernières années.

Reconstitution d'un cataphractaire sassanide. Les guerres entre les Sassanides (dynastie perse) et les Byzantins au début du IVe siècle auraient contribué à introduire le cheval persan en Europe.

Reconstitution d’un cataphractaire sassanide. Les guerres entre les Sassanides (dynastie perse) et les Byzantins à partir du IVe siècle suivies des invasions arabes auraient contribué à introduire le cheval persan en Europe. Source : John Tremelling, GNU Free Documentation License, Wikimedia.

Antoine Fages, Kristian Hanghøj, Naveed Khan et leurs collaborateurs d’un large consortium international ont cherché à tester ces hypothèses dans un article publié dans le journal Cell, le 30 mai 2019. Ils se sont basés sur sur le génome de 30 chevaux modernes, les génomes anciens obtenus de 129 individus répartis sur les six derniers millénaires, plus des marqueurs génétiques à l’échelle du génome pour 149 autres chevaux fossiles.

Il apparaît ainsi qu’alors que la diversité génétique était restée stable pendant 4 millénaires, celle-ci a baissé de 16% au cours des 200 à 400 dernières années. Cette période coïnciderait avec de forts changements de pratiques d’élevage marqués par une réduction du nombre de chevaux reproducteurs, entraînant une réduction de la taille efficace de la population, c’est-à-dire le nombre d’individus d’une population idéale chez laquelle on observerait un degré de dérive génétique équivalent à celui de la population réelle. Cette réduction n’est pas sans impact : la théorie prédit que les petites populations seraient en effet marquées par une atténuation de la sélection purifiante (sélection contre le maintien des allèles délétères), entraînant l’accumulation d’un fardeau génétique. La comparaison des patrons de sélection sur les sites synonymes et sur les sites non synonymes ainsi que sur ceux classés comme délétères par comparaison avec les variations conservées chez les espèces de Vertébrés a permis de vérifier cet attendu théorique chez les populations de chevaux : le fardeau génétique a bien augmenté chez les chevaux modernes, corrélativement à la perte de diversité. Cette réduction de diversité s’expliquerait par des stratégies drastiques de sélection d’étalons pour la reproduction. La diversité nucléotidique sur le chromosome Y, transmis par les étalons, diminue ainsi, à la fois en Asie et en Europe, au cours des deux derniers millénaires et chute aux niveaux actuels à partir de 850-1 350 de l’ère commune (anciennement appelée période après Jésus-Christ).

Diversité

Évolution de la diversité et du fardeau génétique chez le cheval domestique au cours du temps. En haut, la diversité, évaluée par l’hétérozygotie, chute brusquement chez les chevaux modernes par comparaison aux chevaux anciens. En bas, le fardeau génétique augmente corrélativement à la baisse de diversité, chez les chevaux modernes.

L’étude des relations phylogénétiques entre chevaux anciens et modernes est très informative quant aux échanges survenus les siècles passés. En plus des chevaux domestiques et des chevaux de Przewalski, les échantillons les plus anciens indiquent l’existence de deux autres lignées, aujourd’hui éteintes, de chevaux sauvages, l’une dans la péninsule ibérique, l’autre en Sibérie. Bien que présentes à l’époque de la domestication du cheval domestique, ces deux lignées n’auraient eu qu’une contribution marginale à la diversité des chevaux domestiques modernes, permettant de rejeter l’hypothèse d’un centre de domestication du cheval dans la péninsule ibérique.

En se focalisant sur la phylogénie des chevaux domestiques, on remarque que les poneys Shetlands et les chevaux Islandais modernes se classent à proximité de chevaux anciens du Nord de l’Europe. Ces deux races de chevaux prendraient peut-être leur origine dans les conquêtes vikings des VIIIe-XIe siècles. Le clade formé par ces chevaux est un clade frère de chevaux anciens européens, de la période Gallo-Romaine ou de la Tène (culture archéologique du 2nd Age du fer), traduisant une certaine cohésion génétique des chevaux européens anciens. Les chevaux modernes européens, autres que les poneys Shetlands et les chevaux Islandais, se retrouvent dans un autre clade, qui apparaîtrait en Europe au IXe siècle en Croatie, à une époque où ce fond génétique est encore absent en Europe du Nord. Sachant que cette période correspond à de fréquents raids arabes sur les côtes méditerranéennes et que ce clade correspond aussi à celui de chevaux persans sassanides des IVe et Ve siècles, ces résultats suggèrent une forte influence génétique des chevaux persans en Europe à partir du IXe siècle. Des résultats similaires ont été relevés en Asie avec le remplacement des fonds génétiques pré-existants en Asie centrale et en Mongolie par les chevaux d’origine persane à partir des VIIIe-IXe siècles.

Cet échantillon est aussi une opportunité de comprendre les gènes sélectionnés et par conséquent les caractères qui auraient été recherchés au cours de l’histoire du cheval domestique. Ainsi, la comparaison des fréquences alléliques entre les chevaux anciens asiatiques et européens et les chevaux byzantins de l’époque post-VIIe-IXe siècles, déjà largement marqués par l’introgression des chevaux d’origine persane, montre que les gènes impliqués dans la morpho-anatomie auraient beaucoup évolué sous l’influence des chevaux d’origine persane. Le gène MSTN impliqué dans la vitesse serait aussi un candidat sélectionné chez ces chevaux byzantins d’origine persane. Plus récemment, au cours du dernier millénaire, la sélection d’allèle à ce gène MSTN, mais aussi à deux autres gènes PDK4 et ACN9 connus pour influencer la vitesse des chevaux, confirme que l’accroissement de la vitesse de ses montures a été une préoccupation majeure de l’Homme.

Synthèse de l'histoire démographique du cheval cultivé.

Synthèse de l’histoire démographique du cheval cultivé, publiée dans l’article. Les conquêtes islamiques auraient entraîné une diffusion des chevaux de types persans qui auraient remplacé presque toutes les lignées de chevaux anciens présents en Asie et en Europe.

Références de l’article :

Antoine Fages, Kristian Hanghøj, Naveed Khan, Charleen Gaunitz, Andaine Seguin-Orlando, Michela Leonardi, Christian McCrory Constantz, Cristina Gamba, Khaled A.S. Al-Rasheid, Silvia Albizuri, Ahmed H.Alfarhan, Morten Allentoft, Saleh Alquraishi, David Anthony, Nurbol Baimukhanov, James H. Barrett, Jamsranjav Bayarsaikhan, Norbert Benecke, Eloísa Bernáldez-Sánchez, Luis Berrocal-Rangel, Fereidoun Biglari, Sanne Boessenkool, Bazartseren Boldgiv, Gottfried Brem, Dorcas Brown, Joachim Burger, Eric Crubézy, Linas Daugnora, Hossein Davoudi, Peter de Barros Damgaard, María de los Ángeles de Chorro y de Villa-Ceballos, Sabine Deschler-Erb, Cleia Detry, Nadine Dill, Maria do Mar Oom, Anna Dohr, Sturla Ellingvåg, Diimaajav Erdenebaatar, Homa Fathi, Sabine Felkel, Carlos Fernández-Rodríguez, Esteban García-Viñas, Mietje Germonpré, José D. Granado, Jón H. Hallsson, Helmut Hemmer, Michael Hofreiter, Aleksei Kasparov, Mutalib Khasanov, Roya Khazaeli, Pavel Kosintsev, Kristian Kristiansen, Tabaldiev Kubatbek, Lukas Kuderna, Pavel Kuznetsov, Haeedeh Laleh, Jennifer A. Leonard, Johanna Lhuillier, Corina Liesau von Lettow-Vorbeck, Andrey Logvin, Lembi Lõugas, Arne Ludwig, Cristina Luis, Ana Margarida Arruda, Tomas Marques-Bonet, Raquel Matoso Silva, Victor Merz, Enkhbayar Mijiddorj, Bryan K. Miller, Oleg Monchalov, Fatemeh A. Mohaseb, Arturo Morales, Ariadna Nieto-Espinet, Heidi Nistelberger, Vedat Onar, Albína H. Pálsdóttir, Vladimir Pitulko, Konstantin Pitskhelauri, Mélanie Pruvost, Petra Rajic Sikanjic, Anita Rapan Papeša, Natalia Roslyakova, Alireza Sardari, Eberhard Sauer, Renate Schafberg, Amelie Scheu, Jörg Schibler, Angela Schlumbaum, Nathalie Serrand, Aitor Serres-Armero, Beth Shapiro, Shiva Sheikhi Seno, Irina Shevnina, Sonia Shidrang, John Southon, Bastiaan Star, Naomi Sykes, Kamal Taheri, William Taylor, Wolf-Rüdiger Teegen, Tajana Trbojević Vukičević, Simon Trixl, Dashzeveg Tumen, Sainbileg Undrakhbold, Emma Usmanova, Ali Vahdati, Silvia Valenzuela-Lamas, Catarina Viegas, Barbara Wallner, Jaco Weinstock, Victor Zaibert, Benoit Clavel, Sébastien Lepetz, Marjan Mashkour, Agnar Helgason, Kári Stefánsson, Eric Barrey, Eske Willerslev, Alan K. Outram, Pablo Librado, Ludovic Orlando (2019) Tracking Five Millennia of Horse Management with Extensive Ancient Genome Time Series. Cell, 177(6) :1419-1435.e31. Publié le 30 mai 2019

Doit-on parler de races humaines comme on parle de races canines ? La réponse des génétic(h)iens

En 1956, le généticien Haldane posait la question suivante à des anthropologues : « Les différences biologiques entre les groupes humains sont-elles comparables avec celles de groupes d’animaux domestiques, tels que les lévriers ou les bulldogs ?». Les prolongements de cette question ont donné lieu à un débat populaire qui connaît son paroxysme dans des décisions politiques, qui sans revenir à l’idéologie nazie, ont abouti aux cinq catégories raciales actuellement en vigueur dans la législation américaine (Blanc /Noir ou Afro-Américain / Amérindien ou natifs d’Alaska /Asiatique / Hawaïen ou natifs d’autres îles du Pacifique). Mais le concept de races humaines ne serait-il pas davantage une construction sociale plutôt qu’une réalité biologique comparable aux races d’animaux domestiques, notamment les races canines ?

Races canines vs races humaines

A gauche, planche de races de chiens, tirée de ‘The New Student’s Reference Work’ (Ed. Chandler B. Beach, Chicago) publié en 1914. A droite, planche de visages humains d’origine variée, tirée de ‘Evolution of Life’ par Henri C. Chapman en 1873 (Ed. J.B. Lippincott, Philadelphie). Illustrations du Domaine public.

C’est la question à laquelle la chercheuse américaine Heather L. Norton et ses collaborateurs ont tenté de répondre dans un article de synthèse paru le 9 juillet 2019 dans la revue Evolution: Education and Outreach. Le concept génétique de races repose sur le fait qu’il existerait des groupes distincts au sein d’une espèce, c’est-à-dire pour lesquels la diversité intra-groupe serait minime alors que la diversité inter-groupes serait très importante. Chez l’Homme, les anthropologues ont comparé les individus par rapport à des critères comme la couleur de la peau, des mesures de crânes, les groupes sanguins ou encore des marqueurs génétiques.

Ainsi, l’analyse de la diversité génétique de chiens à partir de marqueurs moléculaires classait les individus dans des groupes génétiques qui correspondaient aux races dans 99 % des cas. Le même type d’analyse mené sur un groupe d’humains échantillonnés sur l’ensemble de la planète aboutissait au modèle le plus vraisemblable distinguant six groupes génétiques répartis en : (1) Afrique, (2) Europe/Moyen-Orient/Asie centrale, (3) Extrême-Orient, (4) Océanie, (5) Amériques et (6) les Kalashs, une population isolée du Nord-Ouest du Pakistan. La plupart de ces groupes génétiques s’explique par la barrière reproductive que représentent les limites entre continents. Toutefois, contrairement aux chiens, ces groupes génétiques ne doivent pas être interprétés comme des races. Déjà, l’analyse n’aboutit pas à un modèle incontestable de structure et il existe plusieurs modèles plausibles. On peut même parler de modèles imbriqués, indiquant plusieurs niveaux de structuration génétique plus ou moins marqués. Ainsi, si on sépare l’humanité en deux groupes on distinguera les populations d’Afrique/Europe/Moyen-Orient/Asie centrale de celles de l’Extrême-Orient/Océanie/Amériques. Si on sépare l’humanité en trois groupes, les populations d’Afrique de distinguent des populations d’Europe/Moyen-Orient/Asie centrale. Le découpage en quatre groupes génétiques sépare les populations d’Amériques de celles d’Extrême-Orient/Océanie. Ce dernier groupe est séparé dans le cas d’une subdivision en cinq groupes génétiques. Par ailleurs, peu importe le découpage, la probabilité d’assignation d’un humain à un groupe génétique n’est souvent pas totale et une personne est généralement assignée à plusieurs groupes génétiques simultanément.

Structure génétique observée pour 85 races de chiens.

Structure génétique observée pour 85 races de chiens. (a) L’abscisse montre les 85 races de chiens représentées par plusieurs individus. L’ordonnée indique la probabilité d’assignation aux groupes génétiques, représentés par des couleurs différentes. Les groupes génétiques identifiés sont généralement cohérents avec les races canines. (b) Analyses effectués indépendamment sur des couples de races que l’analyse globale n’avait pas réussi à différencier car ces races ont une origine commune (ex : Mastiff et Bullmastiff). A l’exception de deux types de Bergers Belges (le Groenendael et le Tervueren), ces analyses sur des sous-échantillons ont permis de différencier génétiquement les races. Cette figure a initialement été publiée dans Parker et al. (2004).

Structure des populations humaines

Structure génétique observée pour 52 populations humaines échantillonnées dans le monde entier. Les cinq analyses effectuées en fonction du nombre de groupes génétiques (K=2 à 6) montrent ce concept de structure imbriquée. L’origine géographique, notamment l’appartenance à un continent, est le facteur le plus structurant. Toutefois, de nombreux individus sont assignés à plus d’un groupe génétique. Ces résultats ont été publiés pour la première fois dans un article de Rosenberg et al. 2002.

L’analyse de la variance moléculaire (AMOVA) est un outil statistique permettant de décomposer la variance génétique selon différents niveaux hiérarchiques de structuration. Elle s’avère donc un bon moyen de tester la pertinence des groupes génétiques détectés. Si 27 % des différences génétiques observées entre les chiens se situent entre races canines, seulement 3,3 à 4,7 % de la variation génétique totale observée chez les humains se situent entre les groupes continentaux ou régionaux évoqués plus haut.

Comment expliquer ces différences entre la structuration des populations canines et des populations humaines ? La plupart des races de chiens ont une origine récente, correspondant à environ cent ans de sélection drastique où l’Homme a empêché les chiens de se reproduire en dehors de la race et n’a autorisé les reproductions qu’entre un petit nombre d’individus correspondant aux standards fixés pour la race. Il en résulte une diversité réduite qu’on peut estimer par l’hétérozygotie attendue H, c’est-à-dire la probabilité de tirer deux allèles différents connaissant les fréquences alléliques de la population. Chez une race canine, H est compris entre 0,313 et 0,610. Cette consanguinité est par ailleurs à l’origine d’un nombre considérable de maladies génétiques propres à chaque race. Du côté de l’espèce humaine, les facteurs qui empêchent les flux de gènes entre groupes régionaux sont des facteurs géographiques, culturels et linguistiques, qui, même s’ils s’exercent depuis plus longtemps que la sélection des races modernes de chiens, n’a pas eu un effet d’isolement génétique aussi marqué. Il en résulte une diversité génétique intra-groupe plus élevée que celles des races canines (H=0,664-0,792). L’indice de fixation FST qui marque l’ampleur de la différentiation génétique entre des populations était aussi largement plus élevé entre races canines (FST=0,33) qu’entre groupes continentaux humains (FST=0,052-0,083).

Le concept de race suppose aussi une homogénéité phénotypique. Un caractère aussi stigmatisant que celui de la couleur de la peau chez l’humain varie en fait assez largement au sein d’un continent puisque les populations originaires des tropiques et des hautes altitudes présentent les couleurs de peau les plus sombres, afin d’apporter une forte protection contre les UV. Ces continuums de couleurs de peau sont aussi permis par un contrôle génétique complexe de ce caractère de couleur de peau chez l’Homme (des centaines de gènes impliqués) contrairement aux chiens (neuf gènes identifiés). Quant à la taille des individus, leurs distributions se chevauchent largement entre catégories raciales américaines. Cela contraste fortement aux très impressionnantes différences de taille entre les races de chiens.

Alors, que reste-t-il au concept de race chez l’espèce humaine ? Une construction sociale bâtie en parallèle du racisme permettant à une élite dominante de stigmatiser des minorités. Preuve en est que ces classes raciales ont évolué au cours du temps pour appuyer des motivations politiques telles que l’esclavage ou les politiques migratoires. On peut définir le racisme comme l’idéologie politique selon laquelle les groupes humains ne seraient pas dotés des même capacités et qu’on leur attribuerait un jugement de valeur en distinguant des races supérieures et des races inférieures. L’historien Harrington considère que l’apparition du concept de races humaines aux États-Unis n’est pas étrangère à la généralisation dans les années 1880 des races pures de chiens, par opposition à ce qu’on appelle aujourd’hui les ‘village dogs’ qui sont aux chiens ce que le ‘chat de gouttière’ est aux chats. Cet événement coïncide avec le rejet des immigrants irlandais, allemands, italiens, juifs par les White Anglo-Saxon Protestants (WASP) déjà présents aux États-Unis.

Références de l’article :

Heather L. Norton, Ellen E. Quillen, Abigail W. Bigham, Laurel N. Pearson, Holly Dunsworth (2019) Human races are not like dog breeds: refuting a racist analogy. Evolution: Education and Outreach, 12: 17.