Movatterモバイル変換


[0]ホーム

URL:


Aller au contenu
Wikipédial'encyclopédie libre
Rechercher

Projet 1000 Genomes

Un article de Wikipédia, l'encyclopédie libre.
Logo de 1000 Génomes

Leprojet 1 000 Genomes, démarré en, est une recherche internationale pour établir le catalogue desvariations génétiques humaines le plus détaillé. Les scientifiques projettent deséquencer lesgénomes d'au moins un millier de participants anonymes dans de nombreux groupes ethniques différents dans les trois années, en utilisant les nouvelles technologies qui sont plus rapides et moins coûteuses. En 2010, le projet a terminé sa phase pilote, décrite en détail dans un article deNature[1]. Depuis fin 2010, le projet est en phase production avec un objectif croissant de séquencer 2 000 individus.

Ce projet réunit des équipes multidisciplinaires d'unités de recherche dans des instituts à travers le monde, incluant leRoyaume-Uni, laChine et lesÉtats-Unis. Chacune contribue au travail d'établir l'ensemble des séquences et à améliorer lacarte du génome humain, qui sera librement accessible dans des bases publiques de données à la communauté scientifique comme au public.

En fournissant un panorama de toute la diversité génétique humaine, et non seulement de ce qui relève de labiologie médicale, le consortium générera un outil très utile pour tous les champs des sciences biologiques, spécialement dans les disciplines de lagénétique, lamédecine, lapharmacologie, labiochimie et labioinformatique[2].

Historique

[modifier |modifier le code]

Dans les trente dernières années, les avancées dans lagénétique des populations humaines et lagénomique comparative ont rendu possible d'augmenter la compréhension de ce qu'est la diversité génétique. Cependant, nous commençons seulement à comprendre des processus comme le choixaléatoire desgamètes, lesmutations (insertions/délétions ouindel), les variations du nombre de copies d'un segment dans le génome (sigle anglais CNV), lesrétrotransposons, lespolymorphismes nucléotidiques simples (sigle anglais SNP) et lasélection naturelle ont façonné les niveaux et modèles des variations à l'intérieur desespèces et aussi entre espèces[3],[4],[5],[6], sur la comparaison des séquences des régions MHC classe I chez les humains et les chimpanzés qui dévoilent des insertions/délétions comme le moyen principal de ladivergence génétique.

Variations génétiques humaines

[modifier |modifier le code]

L'appariement aléatoire des gamètes durant la reproduction conduit à ladérive génétique — une fluctuation aléatoire dans la fréquence d'un caractère dans la population — dans les générations suivantes et il en résulte la perte de toute variation en l'absence de pression externe. On postule que le taux de la dérive génétique est inversement proportionnel à la taille de la population, et qu'elle peut être accélérée dans des situations spécifiques comme lesbouchons (en anglais « bottleneck »), où la taille des populations est réduite pendant une certaine période de temps, et par l'effet fondateur (Les individus d'une population descendent d'un petit nombre d'individus fondateurs)[3].

Anzaiet al. ont démontré que lesindel, comptent pour 90,4 % de toutes les variations observées dans la séquence deslocus majeurs d'histocompatibilité (sigle anglais MHC) entrehumains etchimpanzés. Après avoir pris de multiples indels en considération, le haut degré de similarité génétique entre les deux espèces (98,6 % d'identité dans laséquence nucléotidique totale) tombe à seulement 86,7 %. Par exemple, une large suppression ("délétion") de 95 kilobases (kb) entre leslocus humains pour lesgènesMICA etMICB, donne un seul gène hybride du chimpanzéMIC, liant cette région au développement de plusieurs infectionsrétrovirales spécifiques à l'espèce et la susceptibilité résultante à diversesmaladies auto-immunes. Les auteurs concluent qu'au lieu desSNP plus subtils, les indels sont le mécanisme essentiel dans la spéciation des primates[4].

À côté desmutations,SNP et autres modifications structurelles comme le nombre de copies d'un gène (CNV), contribuent à la diversité génétique dans les populations humaines. En utilisant lespuces à ADN, près de 1 500 régions à nombre de copies variables, couvrant environ 12 % du génome et contenant des centaines de gènes, de locus de maladies, d'éléments fonctionnels et de duplications de segments, ont été identifiées dans la collection de séquencesHapMap. Cependant la fonction spécifique des CNVs reste peu apparente, le fait que les CNVs utilisent plus de contenu nucléotidique dans le génome que les SNP montrent l'importance des CNVs dans la diversité génétique et l'évolution[5].

L'investigation sur les variations génomiques humaines possèdent un grand potentiel pour identifier les gènes qui pourraient sous-tendre des différences dans la résistance aux maladies (exemplerégion CMH) ouMétabolisme des médicaments[7].

Sélection naturelle

[modifier |modifier le code]

Lasélection naturelle dans l'évolution d'un trait peut être divisée en trois classes. La sélection positive ou directionnelle se réfère à la situation où un certain allèle a une plus grande affinité avec d'autresallèles, et en conséquence augmente sa fréquence dans la population (exempleRésistance aux antibiotiques des bactéries). En contraste, la sélection négative ou stabilisatrice (aussi connue sous le nom de sélection purificatrice) abaisse la fréquence ou même supprime des allèles dans une population à cause des désavantages qui lui sont associés en présence d'autres allèles. Finalement, nombre des formes de sélection balancée existent; celles-ci augmentent la diversité à l'intérieur d'une espèce en rendant les individus (hétérozygotes mieux adaptés que les individushomozygotes, exempleG6PD, le gène impliqué dans ladrépanocytose et la résistance à lamalaria) où la diversité peut varier géographiquement pour une espèce qui habite différentes niches écologiques, favorisant ainsi différents allèles[8]. Quelques différences dans le génome ne peuvent pas affecter sa bonne viabilité. Ce sont les variations neutres, qu'on pensait auparavant être de l'ADN superfétatoire le « junk DNA » et qui ne sont pas affectées par la sélection naturelle donnant une variabilité génétique plus élevée dans de tels sites quand on compare aux sites où les variations influencent la bonne viabilité[9].

Il n'est pas pleinement compris comment la sélection naturelle crée des différences dans la population. Cependant, les régions génétiques candidates à la sélection sont identifiées depuis récemment[6]. Des modèles depolymorphismes ADN peuvent être utilisés avec confiance pour détecter des signatures de sélection et aider à identifier les gènes qui pourraient sous-tendre les variations dans la résistance aux maladies et dans le métabolisme des médicaments[8],[9]. Barreiroet al. ont prouvé que la sélection négative a réduit la différenciation des populations en modifiant au niveau desacides aminés (particulièrement pour les gènes relatifs aux maladies), tandis que la sélection positive assure l'adaptation régionale des populations humaines en augmentant la différenciation régionale dans des segments des gènes (principalement lesmutations non-sens ou non synonymes et les variants del'extrémité du gène non codante 5')[6].

On pense que la plupart des désordres génétiques et desmaladies mendéliennes (sauf les maladies d'apparition tardive où on présume que les individus trop âgés ne contribuent plus à de nouvelles naissances) auront un effet sur la survie et/ou la reproduction, ainsi, les facteurs génétiques sous-tendant ces maladies devraient être influencées par la sélection naturelle. Lamaladie de Gaucher (mutations dans le gèneGBA), lamaladie de Crohn (mutation deNOD2) et lacardiomyopathie hypertrophique familial (mutations dansCMH1,CMH2,CMH3 etCMH4) sont tous des exemples de sélection négative. Ces mutations cause de maladies sont d'abord récessives et se raréfient comme attendu à une fréquence faible, supportant l'hypothèse de la sélection négative. Peu de cas ont été rapportés où des mutations cause de maladies apparaissent avec une fréquence élevée supportée par la sélection balancée. L'exemple le plus notable est pour les mutations du locusG6PD où, si déficience par homozygotie de l'enzyme G6PD et en conséquence le résultat est ladrépanocytose, mais les hétérozygotes sont partiellement protégés contre lamalaria. D'autres explications possibles pour la raréfaction des allèles entraînant des maladies à des fréquences modérées ou élevées incluent la dérive génétique et des altérations récentes entraînant une sélection positive causée par des changements environnementaux telles que des diètes ou un « auto-stop génétique » quand le gène responsable accompagne des gènes voisins et favorables dans la reproduction[7].

Les analyses comparatives de larges parties du génome de différentes populations humaines, aussi bien que celles entre des espèces (exemple homme comparé au chimpanzé) nous aident à comprendre les relations entre les maladies, les sélections et fournissent des preuves de mutations dans des gènes sensibles parce qu'ils sont disproportionnellement associés avec des maladies héréditaires (phénotypes). Les gènes impliqués dans des désordres complexes tendent à être sous une sélection moins négative que les gènes de maladies à transmission mendélienne[7].

Description du projet

[modifier |modifier le code]

Buts

[modifier |modifier le code]

Il y a deux sortes de variants génétiques relatifs à des maladies. La première sorte sont de rares variants qui entraînent de sévères et prédominants effets sur de simples traits (exemple lamucoviscidose, lamaladie de Huntington).Dans la seconde, plus commune, les variants ont un effet atténué et on les pense être impliqués dans des traits complexes (exemplediabètes,maladies cardiaques). Entre ces deux types de variants il y a un significatif écart dans les connaissances, que le projet 1 000 Genomes est destiné à réduire[2].

Le but premier de ce projet est de créer un catalogue complet et détaillé de ladiversité génétique humaine, qui a son tour peut être utilise pour lesétudes transdisciplinaires reliant variation génétique et maladie. En travaillant ainsi le consortium projette de découvrir plus de 95 % des variants (par exempleSNP, CNV, indels) avec de faiblesfréquences allèliques aussi basses que 1 % à travers le génome et de 0,1 à 0,5 % dans les gènes, aussi bien que d'estimer leurs fréquences dans la population, leurs liens avec leshaplotypes et la structuration desdéséquilibres de liaison pour les allèles variants[10].

Les buts seconds incluront l'utilisation de meilleurs SNP, la sélection de sondes pour des plateformes degénotypage des futures études et l'amélioration de laséquence humaine de référence. En plus, la base de données terminée sera un instrument utile pour étudier les régions ADN sous pression de sélection, les variations dans de nombreuses populations et comprendre les processus sous-tendus de mutation et lesrecombinaisons génétiques[10].

Aperçus

[modifier |modifier le code]

Legénome humain consiste approximativement de 3 milliards depaires de bases ADN et est estimé porter 20 000 à 25 000protéines codantes, lesgènes. En dessinant ce projet, le consortium souhaitait pouvoir répondre à de sévères critiques concernant des indicateurs de projet tels que les défis technologiques, les standards de qualité des données et la couverture du séquençage[10].

Au cours des trois années suivantes, les scientifiques auCentre Sanger, à l'Institut du Génome de Beijing BGI àShenzhen et au réseau de séquençage à grande échelle duNational Human Genome Research Institute, planifient le séquençage d'un minimum de 1 000 génomes humains. À cause du très grand nombre de données de séquence qui demande à être générées et analysées, il est possible que d'autres participants soient recrutés durant cette période[2].

Presque 10 milliards de bases seront séquencées chaque jour sur la période de deux ans de la phase de production. Ceci fait plus de deux génomes humains tous les 24 heures ; une capacité révolutionnaire. Un défi aux meilleurs experts de labioinformatique et des statistiques génétiques, la base des séquences comprendra 6 000 milliards de bases ADN, 60 fois plus de données séquence que ce qui a été publié dans les bases de données ADN dans les 25 dernières années[2].

Pour pouvoir déterminer le plan final de tout le projet, trois études furent conçues et mises à exécution dans la première année du projet. L'intention du premier pilote était de génotyper 180 personnes de 3groupes géographiques majeurs avec une couverture basse (2 passages). Pour l'étude du deuxième pilote, les génomes de deux familles nucléaires (les deux parents et un enfant adulte) allaient être séquencées avec une couverture profonde (20 passages par génome). L'étude du troisième pilote impliquait le séquençage des régions codantes (exons) de 1 000 gènes chez 1 000 personnes avec une couverture profonde (20 passages)[2],[10].

Le projet est estimé devoir probablement coûter plus de 500 millions de dollars si les technologies standards de séquençage ADN sont employées. Cependant, plusieurs nouvelles technologies (exempleSolexa,454,SOLiD) seront appliquées, abaissant les coûts attendus dans une fourchette de 30 millions à 50 millions de dollars. Le support majeur sera fourni par leWellcome Trust Sanger Institute, Hinxton, Angleterre; l'Institut Génomique de Beijing, Shenzhen (BGI Shenzhen), Chine; et leNHGRI, une branche du National Institutes of Heath (NIS)[2].

Les données compilées de séquence du génome sont libres d'accès.

Échantillons de génomes humains

[modifier |modifier le code]

Basés sur les buts globaux du projet, les échantillons seront choisis pour fournir une connaissance puissante des populations avec laquelle les études s'y rapportant sur les maladies communes pourront être faites. En outre, les échantillons ne demanderont pas d'y ajouter l'information médicale ou sur lephénotype puisque le catalogue proposé sera une ressource de base sur la diversité humaine[10].

Pour les études pilotes, les échantillons de génomes humains provenant de la collection duHapMap seront séquencés. Il sera utile de se concentrer sur des échantillons qui ont déjà des données additionnelles disponibles (comme les séquences du projet universitaire américainENCODE, les génotypes connus sur de grandes parties du génome, les séquences fin des fosmides qui sont descosmides basés sur lesplasmides-F, les testeurs de variations structurels, et les agents d'expression des gènes) pour être capable de comparer les résultats avec ceux d'autres projets[10].

En se conformant aux procédures d'éthique les plus complètes, le Projet 1000 utilisera des échantillons venant de donneurs volontaires. Les populations suivantes seront incluses dans l'étude :Yorubas d'Ibadan,Nigeria ;Japonais deTokyo ;Chinois deBeijing ; résidents de l'Utah avec des ancêtres du nord et l'ouest de l'Europe ;Luhyas deWebuye,Kenya ;Maasai de Kinyawa, Kenya ;Toscans d'Italie ; Péruviens duPérou ; IndiensGujarâtî deHouston ; Chinois deDenver ; ancêtresmexicains àLos Angeles et ancêtresafricains dans le sud-ouest desÉtats-Unis[2].

Résultats

[modifier |modifier le code]

Résultats en génétique médicale

[modifier |modifier le code]
Cette section est vide, insuffisamment détaillée ou incomplète.Votre aide est la bienvenue !Comment faire ?

Résultats en génétique des populations

[modifier |modifier le code]

En 2011, des milliers de marqueurs dans lechromosome Y furent trouvés par des amateurs sur les données brutes de la base du projet 1000 Genomes après leur analyse par des programmes informatiques. Ces découvertes permettent de considérablement développer les arbres deshaplogroupes Y, très utiles pour l'histoire desmigrations humaines et pour lagénéalogie génétique. Des nouveaux marqueurs ainsi trouvés sont déjà dans les catalogues des compagnies detests ADN.

Les publications principales du Projet, portant sur la fin de phase 3, ont été publiées dans Nature (https://www.internationalgenome.org/1000-genomes-project-publications) en:

- “A global reference for human genetic variation” Nature 526 68-74 2015;- “An integrated map of structural variation in 2,504 human genomes” Nature 526 75-81 2015.

Notes et références

[modifier |modifier le code]
  1. The 1000 Genomes Project Consortium, A map of human genome variation from population-scale sequencing, Nature (2010) 467, 1061–1073 (http://www.nature.com/nature/journal/v467/n7319/full/nature09534.html)
  2. abcdef etgG Spencer, International Consortium Announces the 1000 Genomes Project, EMBARGOED (2008)http://www.1000genomes.org/files/1000Genomes-NewsRelease.pdf
  3. a etbJC Long, Human Genetic Variation: The mechanisms and results of microevolution, American Anthropological Association (2004)
  4. a etbT Anzai et al., comparative sequencing of human and chimpanzee MHC class I regions unveils insertions/ deletions as the major path to genomic divergence, PNAS (2003) vol. 100 no. 13: 7708–7713
  5. a etbR Redon et al., Global variation in copy number in the human genome, Nature, Volume 444 (2006)
  6. ab etcLB Barreiro et al., Natural selection has driven population differentiation in modern humans, Nature Genetics (2008) published online
  7. ab etcR Nielsen et al., Recent and ongoing selection in the human genome, Nature Reviews, Volume 8 (2007)
  8. a etbEE Harris et al., The molecular signature of selection underlying human adaptations, Yearbook of Physical Anthropology 49: 89-130 (2006)
  9. a etbM Bamshad, Signatures of natural selection in the human genome, Nature Reviews, Volume 4 (2003)
  10. abcde etfMeeting Report: A Workshop to Plan a Deep Catalog of Human Genetic Variation, (2007)http://www.1000genomes.org/files/1000Genomes-MeetingReport.pdf

Voir aussi

[modifier |modifier le code]

Liens externes

[modifier |modifier le code]
Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Projet_1000_Genomes&oldid=224171261 ».
Catégorie :
Catégories cachées :

[8]ページ先頭

©2009-2025 Movatter.jp