Toutes les versions de cet article :
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Au début des années 1990, la communauté scientifique internationale a jeté les bases d’un projet qu’on a parfois qualifié, en raison de son ampleur, de « projet Apollo de la biologie ». L’objectif était d’obtenir, pour le début du troisième millénaire, la séquence complète du génome humain - 3,2 milliards de nucléotides, soit, en caractères, le contenu de 2000 livres de 500 pages. En raison de la taille de ce génome, les grands centres de séquençage, réunis en un consortium international, ont convenu de diviser le travail. Chacune des 20 institutions du consortium « public » (travaillant sur fonds publics ou caritatifs) s’est chargée de régions chromosomiques ou de chromosomes particuliers, parmi les 24 types de chromosomes humains (voir la liste des membres du consortium et leurs contributions respectives). Chaque centre s’est également engagé à déposer les séquences, dès leur obtention, dans des bases de données publiques.
Les premières années du projet Génome humain ont été consacrées à un travail de cartographie : établissement de cartes physiques (couverture de chaque chromosome par un ensemble de grands fragments génomiques ordonnés sur la base de leurs chevauchements) et de cartes de liaison (ensemble de marqueurs dont on détermine les positions relatives le long des chromosomes). Le travail de séquençage proprement dit n’a commencé pour l’essentiel qu’en 1998.
La fin du projet Génome humain était initialement prévue en 2005, mais les progrès accomplis en matière de séquençage au cours des années 1990, ainsi que le soutien financier renouvelé des institutions de tutelle, ont permis d’aboutir avant cette date : une première ébauche de la séquence du génome humain a été célébrée en juin 2000 à la Maison blanche, et le travail de finition s’est achevé en avril 2003, avec deux ans d’avance : une version complète et précise à 99,99% de la séquence du génome humain est aujourd’hui librement accessible en ligne, à la disposition des chercheurs du monde entier. Le travail d’identification des gènes humains se poursuit, mais la plupart sont déjà repérés le long de cette séquence et caractérisés.
Le projet Génome humain incluait des objectifs annexes, qui ont également été atteints en avance sur les délais. Il s’agit notamment d’un catalogue des positions variables d’un individu à un autre dans la séquence « générique » du génome humain (plus de 4 millions ont déjà été répertoriées), et de l’obtention d’une séquence de bonne qualité du génome de la souris : la connaissance du génome de ce mammifère, animal modèle en génétique depuis près d’un siècle, est d’une grande importance pour l’interprétation de la séquence du génome humain.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
La séquence du génome humain aujourd’hui accessible dans les bases de données est aussi complète que les techniques actuelles le permettent. Elle correspond essentiellement à la partie « séquençable » du génome, celle qui contient la quasi totalité des gènes. Cette fraction du génome, nommée euchromatine, représente 2,9 milliards de nucléotides, soit 90% des 3,2 milliards de nucléotides de l’ensemble du génome humain. Elle a été séquencée à 99% (le 1% restant correspondant aux quelques centaines de trous que l’on n’est pas parvenu à boucher). La partie du génome qui n’était pas inclue dans le projet Génome humain est nommée hétérochromatine. Formée de séquences d’ADN hautement répétées, elle est très monotone et pratiquement vide de gènes. On trouve notamment l’hétérochromatine au niveau de structures chromosomiques nommées centromères, ainsi qu’aux extrémités des chromosomes, nommées télomères. Il est extrêmement difficile de séquencer cet ADN très répétitif avec les techniques courantes, ce qui explique qu’il ait été laissé de côté dans un premier temps. Toutefois, ces régions pourraient faire l’objet de travaux ciblés, car elles jouent un rôle important dans le fonctionnement des chromosomes, et quelques gènes pourraient s’y dissimuler.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Le nombre de gènes humains fait depuis longtemps l’objet d’évaluations selon diverses méthodes plus ou moins directes. Toutefois, seule une séquence complète et de bonne qualité du génome humain pouvait permettre de mener une recherche systématique des gènes et d’aboutir à un compte à peu près définitif. Une telle séquence est aujourd’hui disponible, et le travail « d’annotation », c’est-à-dire de recherche et de caractérisation des gènes, est en bonne voie. On dénombre à ce jour près de 25 000 gènes humains. Ce chiffre ne devrait plus beaucoup évoluer à l’avenir : d’un côté, certains des gènes déjà répertoriés seront peut être supprimés du décompte, car ils correspondraient à des vestiges de gènes aujourd’hui inactifs ; d’un autre côté, de nouveaux gènes resteraient à découvrir et pourraient compenser cette révision à la baisse. Les chercheurs du Genoscope ont été parmi les premiers à suggérer, en 2000, un nombre total de gènes humains de l’ordre de 30 000, soit une valeur bien inférieure aux estimations qui avaient cours à cette époque (plus d’une centaine de milliers de gènes humains pour certains) (voir le communiqué de presse et le contexte). Des paris avaient même été pris de façon informelle en 2000 sur le nombre de gènes humains, et un chercheur du Genoscope figure parmi les trois parieurs qui se sont approchés le plus près du décompte actuel.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
S’il vous prenait l’envie de parcourir les trois milliards de lettres qui composent la séquence du génome humain, vous seriez bien en peine de repérer, dans cette suite interminable de A, T, G et C, les parties qui correspondent aux instructions, ou gènes. Aucune caractéristique évidente ne les signale à l’œil nu. Et il y a peu de chances pour que votre lecture, commencée au hasard, vous conduise rapidement sur un gène : chez l’homme comme chez les autres mammifères, les gènes occupent moins de 30% de l’ADN du génome. Il faut également compter avec leur morcellement : chez les animaux et les plantes, la partie biologiquement significative des gènes est divisée en blocs nommés exons, séparés par des séquences intercalaires nommées introns. Or les exons représentent moins de 3% du génome humain et ne sont pas faciles à délimiter. Par exemple, les 24 exons du gène codant la neurexine 3, séparés par de très grands introns, sont dispersés sur près de 1,5 million de nucléotides le long de la séquence du chromosome 14 humain !
Pour l’ordinateur, la séquence du génome humain est toutefois plus lisible que pour l’œil humain. La recherche de caractéristiques associées de façon statistique aux gènes a débouché sur des programmes informatiques de recherche des gènes, utiles pour une annotation préliminaire à grande échelle. Toutefois, ces programmes peuvent prédire faussement l’existence ou les frontières d’un exon, ou bien manquer un exon existant. Ils sont donc complétés par une approche qui fait appel aux données expérimentales. Cette approche consiste à rechercher des similarités entre la séquence du génome humain et divers types de séquences : d’une part, les séquences de produits d’expression des gènes (ARN messagers et protéines), déterminées en grand nombre depuis les années 1990 chez l’homme et chez d’autres organismes ; d’autre part, des séquences génomiques, qui peuvent être issues du génome humain ou d’autres génomes. Dans le premier cas, la séquence d’un gène est délimitée par alignement avec la séquence de son propre ARN messager, ou de l’ARN messager d’un gène apparenté ; dans le cas des comparaisons entre séquences génomiques, les gènes sont repérés parce que leurs parties « codantes » ont été davantage conservées au cours de l’évolution que le reste de la séquence du génome. Le Genoscope utilise ainsi les régions conservées entre le génome de l’homme et celui d’un petit poisson, Tetraodon nigroviridis, pour améliorer la prédiction des gènes humains.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
L’ADN séquencé dans le cadre du projet Génome humain ne provient pas d’un seul, mais de plusieurs donneurs anonymes, recrutés aux Etats-Unis. La procédure adoptée garantit que l’identité des volontaires ne puisse être révélée. Le recrutement s’est effectué au moyen d’annonces diffusées aux environs des deux laboratoires où les « banques » d’ADN devaient être préparées. Les donneurs, d’origines diverses, ont été informés sur le projet avant de donner leur consentement éclairé. L’ADN recueilli était celui de cellules sanguines prélevées par une simple prise de sang. Toutes les précautions ont été prises pour qu’on ne puisse remonter de l’échantillon à l’identité du donneur. En outre, cinq à dix échantillons ont été préparés pour chaque échantillon utilisé, de sorte qu’aucun donneur ne peut être sûr que son ADN fait bien partie du matériel séquencé.
Même si l’on était parti d’un donneur unique, on n’aurait pas obtenu une version unique de la séquence. En effet, chaque être humain a reçu un jeu de chromosomes de son père et un autre de sa mère, et la séquence d’un chromosome reçu du père diffère en certaines positions de la séquence du chromosome homologue reçu de la mère. Dans l’hypothèse d’un donneur unique, les grands fragments d’ADN sélectionnés par les chercheurs pour construire une « carte » du chromosome pourraient provenir de l’un ou l’autre des deux exemplaires chromosomiques. La séquence de chaque grand fragment serait homogène, d’origine paternelle ou maternelle, mais des différences apparaîtraient dans les régions où deux grands fragments d’origines différentes se chevauchent. Comme la séquence de chaque grand fragment est établie avec un haut niveau de confiance, de telles divergences peuvent être distingués d’erreurs de séquençage et répertoriées comme polymorphismes. C’est un avantage de la stratégie « clone par clone » suivie par le consortium. En partant de plusieurs donneurs, l’on séquence des grands fragments qui peuvent provenir non seulement de deux chromosomes homologues d’un même individu, mais aussi d’individus différents, et l’on découvre ainsi davantage de polymorphismes.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Les membres du consortium se sont engagés à déposer sans délai les séquences produites dans les bases de données publiques. Si le séquençage du génome humain avait été abandonné aux sociétés de génomique, le risque était grand que la séquence ait été « confisquée » dans des bases de données privées, consultables seulement au prix fort. C’est d’abord en ce sens que le projet public a évité « l’appropriation » de la séquence du génome humain. En divulguant la séquence d’un gène, les chercheurs du consortium suppriment en outre l’élément de nouveauté nécessaire à la délivrance d’un brevet, et rendent donc impossible le brevetage de la séquence elle-même. Il reste toutefois possible de breveter une application dérivée de la connaissance de la séquence. Beaucoup admettent que le libre accès à la séquence génomique est la meilleure façon de stimuler la recherche biomédicale, et que la compétition industrielle doit se déplacer en aval de la séquence, vers la compréhension biologique de la fonction des gènes dans l’organisme.
Toutefois, des gènes humains ont bel et bien été brevetés, et ce, avant même le début du projet Génome humain. D’une part, des programmes de séquençage d’ADN complémentaires (copies des ARN messagers issus de l’expression des gènes) ont débouché dans les années 1990 sur de nombreuses demandes de brevet, de la part de sociétés biotechnologiques mais aussi d’institutions publiques. D’autre part, des brevets ont pu être pris à l’issue de programme de séquençage d’ADN génomique. Par exemple, la société Celera Genomics a tiré parti de son effort de séquençage du génome humain pour déposer des demandes de brevet sur un nombre non précisé de gènes humains.
Toutes ces demandes n’aboutiront pas. Les critères pour l’attribution d’un brevet sur une séquence d’ADN sont devenus plus sévères, tant aux Etats-Unis qu’en Europe, à mesure que les progrès techniques faisaient du séquençage une activité de routine. Pour que le brevet soit attribué, l’« invention » doit répondre à un critère d’activité inventive, ainsi que d’utilité (aux Etats-Unis) ou d’application industrielle (en Europe). Il est donc devenu impossible de breveter une séquence « brute », sans caractérisation de la fonction du gène et sans évocation non triviale des possibles applications de la séquence, telles que le diagnostic, la thérapie génique ou la création d’animaux modèles transgéniques... En outre, une fois le brevet délivré, la portée de ses revendications peut être contestée sur ces mêmes bases. Enfin, il faut rappeler qu’un tel brevet n’est pas un titre de propriété sur un gène présent dans le corps de tout un chacun : il s’agit surtout d’une arme pour empêcher un concurrent de commercialiser une application dérivée de la connaissance de ce gène. Toutefois, un tel pouvoir d’interdire, lorsque les revendications ont une portée abusive, peut avoir pour effet de stériliser un domaine de recherche, surtout s’il est joint à une politique de licence exclusive.
Nul ne sait exactement quelle part du génome et des gènes humains peut être exploitée librement à des fins commerciales. Fin 2000, l’office américain des brevets (USPTO) avait accordé des brevets sur plus de 6000 séquences d’ADN, dont plus de 1000 humaines, et plus de 20 000 demandes de brevets sur des gènes étaient en attente. Il reste à savoir combien seront accordés, combien des déposants iront jusqu’au bout, et combien de ces brevets tiendront.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Depuis que nous avons appris à lire la séquence de l’ADN au cours des années 1970, nous rêvons de connaître notre propre génome. Ce rêve est pratiquement réalisé aujourd’hui, même si nous ne sommes pas encore capables de connaître le sens de toutes les instructions contenues dans la séquence du génome.
L’interprétation de la séquence du génome humain est aujourd’hui en bonne voie, et de nombreuses retombées sont attendues dans les décennies à venir. Les plus importantes auront lieu dans les domaines de la médecine et de la recherche fondamentale en biologie, mais les retombées scientifiques seront elles-mêmes à l’origine de la grande majorité des nouvelles applications. Toutefois, ces fruits de la séquence ne seront pas engrangés immédiatement : plusieurs années de recherches seront nécessaires. A l’inverse, ces recherches ne pouvaient être entreprises sans la séquence du génome.
La séquence du génome humain permet en premier lieu de procéder à l’identification des gènes de l’homme. C’est même le seul moyen de dresser un inventaire exhaustif et précis des gènes humains. Au cours des années 1990, certains plaçaient leurs espoirs dans le séquençage des ARN messagers, produits de l’expression des gènes ; ils jugeaient inutile et coûteux de séquencer les 3 milliards de nucléotides du génome humain, dont seuls 3% correspondent à la partie « codante » des gènes (voir « Pourquoi est-ce difficile de trouver les gènes dans la séquence ? »). La suite a prouvé que, sans la séquence du génome, les collections de séquences d’ARN messagers ne permettent pas d’aboutir à un inventaire fiable des gènes humains. Le séquençage systématique du génome est apparu en outre comme plus économique, à terme, qu’une étude des gènes humains au cas par cas, impliquant des efforts redondants. C’est ce qui a motivé le lancement du projet Génome humain au début des années 1990.
L’inventaire des gènes humains profitera en premier lieu à la recherche des gènes impliqués dans les maladies génétiques. Très souvent, des études génétiques permettent de définir, le long d’un chromosome, un « intervalle » où se trouverait le gène causant la maladie dans sa forme mutée. L’inventaire des gènes de l’intervalle en question (obtenu par l’analyse de la séquence) permet alors de retenir ceux qui ont le plus de chances d’être impliqués dans la pathologie, du fait des propriétés connues ou supposées de leurs produits, et de commencer les travaux sur les meilleurs candidats. Avant que la séquence du génome humain soit disponible, les généticiens devaient explorer en aveugle des intervalles de plusieurs millions de nucléotides, à la recherche des centaines de gènes qui pouvaient s’y trouver. Grâce à la séquence finie et « annotée », ces équipes gagnent jusqu’à plusieurs années d’un travail fastidieux. Cela devrait se traduire dans un proche avenir par la découverte de plusieurs milliers de gènes responsables de maladies génétiques.
La connaissance d’un gène dont la mutation provoque une maladie génétique permet la mise au point d’un test diagnostic à partir de l’ADN. Pour les maladies les plus graves, le diagnostic génétique peut être pratiqué avant la naissance dans les familles à risque. L’identification du gène responsable permet aussi de comprendre le mécanisme physiologique de l’apparition de la maladie et donc, dans certains cas, d’explorer de nouvelles possibilités thérapeutiques. C’est ainsi qu’un traitement prometteur de l’Ataxie de Friedreich, directement issu de la connaissance du gène et de sa fonction, a été développé en 1999 par une équipe française à l’Hôpital Necker.
Enfin, la séquence du génome humain, jointe à l’inventaire des positions variables d’une personne à une autre, va faciliter l’identification des facteurs génétiques de susceptibilité aux maladies communes. Ces maladies, telles que le diabète ou l’artériosclérose, ont certes une composante génétique, mais une multitude de facteurs y contribuent chacun pour une faible part, et interagissent avec les facteurs de l’environnement de façon complexe. Grâce au degré de résolution atteint aujourd’hui par les études génétiques, nous allons peut-être commencer à démêler cet écheveau pour comprendre les mécanismes moléculaires de ces maladies et mieux faire la part de l’environnement. Cela pourrait conduire, d’une part, à des nouveaux traitements, d’autre part, à des mesures de prévention plus efficaces.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Le consortium international pour le séquençage du génome humain réunissait 20 centres de séquençage dans six pays (Allemagne, Chine, Etats-Unis, France, Japon, Royaume-Uni). En voici la liste :
| Abbréviation | Centre |
|---|---|
| BCM | Human Genome Sequencing Center / Baylor College of Medicine, Houston (Texas) ; USA |
| Beijing | Human Genome Center / Beijing Genomics Institute, Académie chinoise des sciences, Beijing ; Chine |
| CSHL | Lita Annenberg Hazen Genome Center / Cold Spring Harbor Laboratory, Cold Spring Harbor (N.Y.), USA |
| GBF | Gesellschaft fur Biotechnologische Forschung mbH, Braunschweig ; Allemagne |
| GS | Genoscope, Evry ; France |
| GTC | GTC Sequencing Center / Genome Therapeutics Corp., Waltham (Mass.) ; USA |
| IMB | Department of Genome Analysis / Institute of Molecular Biotechnology, Jena ; Allemagne |
| JGI | Joint Genome Institute / U.S. Department of Energy, Walnut Creek (Calif.) ; USA |
| Keio | Département de biologie moléculaire / Ecole de médecine de l’université Keio, Tokyo ; Japon |
| MPIMG | Max Planck Institute for Molecular Genetics, Berlin ; Allemagne |
| MSC | Multimegabase Sequencing Center / The Institute for Systems Biology, Seattle (Wash.) ; USA |
| RIKEN | RIKEN Genomic Sciences Center, Yokohama ; Japon |
| SC | The Wellcome Trust Sanger Institute (Sanger Center), Hinxton ; Royaume-Uni |
| SGTC | Stanford Genome Technology Center, Stanford (Calif.) ; USA |
| SHGC | Stanford Human Genome Center, Stanford (Calif.) ; USA |
| UOACGT | University of Oklahoma / Advanced Center for Genome Technology, Norman (Okla.), USA |
| UTSW | University of Texas / Southwestern Medical Center, Dallas (Tex.) ; USA (ce centre n’est plus en activité) |
| UWGC | University of Washington Genome Center, Seattle (Wash.) ; USA |
| WI | Whitehead Institute / MIT Center for Genome Research, Cambridge (Mass.) ; USA |
| WUGSC | Washington University / Genome Sequencing Center, St Louis (Mo.) ; USA |
D’autres institutions et centres de séquençage, sans faire officiellement partie du consortium, ont également contribué de façon substantielle à l’effort de séquençage du génome humain. Voici quelques uns des plus importants contributeurs :
| CGM | Center for Genetics in Medicine (Perkin Elmer/Washinton Univ.) St Louis (Mo.) ; USA (ce centre n’est plus en activité) |
| JST | Japan Science and Technology Corporation (équipes sous contrat à la fondation japonaise pour la recherche sur le cancer (JFCR) et aux universités Keio, Kitasato et Tokai) ; Japon |
| TIGR | The Institute for Genomic Research, Rockville (Maryland) ; USA |
| YMGC | The National Yang Ming University Genome Center, Taipei ; Taiwan |
Enfin, trois institutions ont joué un rôle crucial dans le projet au niveau bioinformatique :
| NCBI | Center for Biotechnology Information aux National Institutes of Health, USA |
| EBI | European Bioinformatics Institute, Cambridge, UK |
| UCSC | Université de Californie à Santa Cruz, USA |
L’EBI a notamment créé, avec son voisin le Sanger Institute, le projet Ensembl (e !), qui effectue une recherche automatique des gènes dans la séquence du génome humain et permet de « naviguer » le long de cette séquence « annotée ». L’UCSC propose également un tel navigateur.
Les différents centres impliqués dans le séquençage du génome humain ont retenu des chromosomes ou des régions chromosomiques de tailles différentes, chacun selon sa capacité. Leurs contributions respectives (mesurées en pourcentage de la séquence finie non redondante présente dans les bases de données début 2003) sont représentées ci-dessous :
Sur le plan international, les contributions des 6 pays impliqués dans le projet sont les suivantes :
| pays | Contribution |
|---|---|
| Etats-Unis | 60,8 % |
| Royaume-Uni | 28,9 % |
| Japon | 4,9 % |
| France | 2,8 % |
| Allemagne | 1,5 % |
| Chine | 0,7 % |
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Le Genoscope, seul représentant de la France au sein du consortium, a choisi de séquencer le bras long du chromosome 14 humain (la partie séquençable de ce chromosome, celle qui contient les gènes ; voir plus haut), soit environ 3% du génome humain. L’effort de séquençage a été coordonné et assuré à 86 % par le Genoscope, qui s’est également chargé de la recherche des gènes, ou annotation. Le chromosome 14 est représenté ci-dessous parmi les 23 autres types de chromosomes humains.
Cet effort de séquençage a abouti, courant 2002, à une séquence continue de 87 410 661 nucléotides, qui s’étend d’un bout à l’autre de la partie séquençable du bras long du chromosome 14. Les résultats de l’analyse de cette séquence ont été publiés le 1er janvier 2003 dans la revue Nature (voir le communiqué de presse). Il s’agissait de la première séquence d’un chromosome humain publiée sans trou résiduel et, au moment de la publication, de la plus longue séquence d’ADN jamais déterminée d’un seul tenant. Pour mesurer les progrès accomplis en une décennie, on peut se souvenir du séquençage du génome de la levure, achevé en 1996, qui avait mobilisé près d’une centaine de laboratoires pendant 6 ans ; or le génome de la levure ne mesure que 13 millions de nucléotides, contre 87 millions pour le chromosome 14...
Les chercheurs du Genoscope ont mis à profit leur expertise en bioinformatique pour identifier les gènes dans la séquence du chromosome 14. Aux 506 gènes déjà connus sur ce chromosome, ils ont ajouté 344 autres gènes, validés ou « putatifs ». En outre, deux régions d’une grande importance pour le système immunitaire ont été caractérisée. Près de 60 gènes du chromosome 14 avaient déjà été impliqués dans des maladies génétiques. Depuis le début de la décennie, les progrès du séquençage ont aidé diverses équipes à identifier 6 nouveaux gènes de maladies génétiques sur ce chromosome, en leur faisant économiser de nombreux mois de travail (voir « A quoi servira le projet Génome humain ? » et « Qu’est-ce qu’une maladie génétique ? »). Des dizaines d’autres gènes « morbides » devraient suivre. Pour que ces recherches puissent aboutir, il est important que les gènes soient correctement délimités et que l’inventaire des gènes soit complet. Les chercheurs du Genoscope s’efforcent donc de parfaire leur travail d’annotation, et disposent même d’outils pour évaluer et améliorer l’annotation de l’ensemble du génome humain.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Le coût total du projet Génome humain est d’environ 2,7 milliards de dollars (dollars de l’année fiscale 1991), alors qu’il avait été estimé à 3 milliards de dollars au début du projet, en 1990. Cette économie résulte de progrès techniques considérables et de l’accélération du projet, terminé avec deux ans d’avance sur les prévisions. Une grande part de la somme a été dépensée pour la finition de l’ébauche génomique obtenue en 2000. Le séquençage du chromosome 14, quant à lui, a coûté environ 10 millions d’euros, auxquels s’ajoutent plusieurs millions d’euros pour l’analyse et l’annotation.
Les bénéfices attendus pour la société dans son ensemble excéderont sans doute largement le montant de cet investissement : les recherches fondées sur le génome devraient déboucher dans les prochaines décennies sur un essor de l’industrie biotechnologique, de nouveaux traitements et médicaments et de grands progrès pour la santé humaine, par exemple dans le domaine du diagnostic.
1 : Qu’est-ce que le projet public de séquençage du génome humain ?
2 : Le génome humain est-il complètement séquencé à présent ?
3 : Combien y a-t-il de gènes humains ?
4 : Pourquoi est-ce difficile de trouver les gènes dans la séquence du génome humain ?
5 : De qui provient l’ADN humain qui a été séquencé ?
6 : Le génome humain est-il « libre de droits » ? Si non, qui le possède ?
7 : Pourquoi le projet Génome humain ? A quoi servira-t-il ?
8 : Qui étaient les membres du consortium international ? Quelle a été la part de chacun ?
9 : Quelle a été la contribution française au projet Génome humain ?
10 : Combien a coûté le projet Génome humain ?
11 : Avec la fin du projet Génome humain, les grands centres de séquençage ont-ils encore une utilité ?
Loin de diminuer, la liste des génomes à séquencer ne cesse en fait de s’allonger. Pour interpréter la séquence d’un génome, il est en effet précieux de la comparer à celle d’autres génomes. Les espèces comparées peuvent être proches, ou issues de lignées ayant divergé tôt au cours de l’évolution. Les enseignements ne seront pas les mêmes. Plus deux espèces seront distantes en termes d’évolution, plus leurs séquences génomiques auront divergé, ce qui peut limiter la portée de la comparaison. Toutefois, les parties ayant le moins divergé, à savoir les gènes, seront plus clairement distinguées du reste de la séquence : ces régions « conservées » entre les deux génomes serviront d’indices pour la recherche des gènes. Il est donc instructif de disposer des génomes d’un spectre d’espèces choisies en des points clés de l’arbre évolutif.
Prenons l’exemple du génome humain. Le chimpanzé est notre plus proche parent dans le monde animal, et le séquençage de son génome, identique à 99 % au nôtre, livrera des informations passionnantes sur les changements génétiques qui ont eu lieu au cours des derniers millions d’années de l’évolution de la lignée humaine. Le séquençage du génome de la souris, achevé en 2003, va quant à lui profiter à l’ensemble des recherches biomédicales, car ce rongeur est de longue date un animal modèle en génétique. Les séquences des génomes d’autres mammifères placentaires viendront compléter les enseignements du génome de la souris. Il sera également instructif de séquencer le génome d’un représentant des marsupiaux, tôt séparés du reste des mammifères. Le génome du kangourou pourrait éclairer les étapes les plus précoces de l’histoire des mammifères, et offrir un bon compromis pour la recherche des gènes humains.
Au delà, ce sont les représentants d’autres branches de vertébrés qui faciliteront cette recherche, car les vertébrés ont conservé pour l’essentiel un bagage commun de gènes. Parmi les vertébrés au génome séquencé ou en voie de l’être, un oiseau, le poulet, et deux poissons au génome compact, dont l’un, Tetraodon nigroviridis, a été séquencé pour moitié au Genoscope. Le Genoscope s’est servi en 2000 de comparaisons entre les séquences génomiques de Tetraodon et de l’être humain pour estimer le nombre de gènes humains à 30 000, et il continue de s’en servir pour parfaire l’annotation du génome humain. Plus loin encore, on trouve les génomes d’une ascidie, animal marin proche parent des vertébrés, puis du ver Caenorhabditis elegans et de la mouche Drosophila melanogaster. Le génome d’organismes multicellulaires très simples pourrait révéler les changements qui ont accompagné l’organisation des cellules en « sociétés cellulaires ». Enfin, le génome de la levure, organisme unicellulaire, est utile pour découvrir les éléments communs à l’ensemble des eucaryotes, êtres vivants au génome abrité dans un noyau au sein de la cellule, de l’homme au chêne ou à l’infusoire. La compréhension de mécanismes eucaryotes fondamentaux comme la condensation, la recombinaison ou la ségrégation des chromosomes lors de la division cellulaire est d’une grande importance dans l’étude de certaines maladies humaines.
Aux raisons énoncées ci-dessus pour entreprendre de nouveaux programmes de séquençage s’ajoutent des raisons plus spécifiques. La séquence du génome de tel ou tel organisme peut être importante pour des raisons économiques (microbe important pour l’industrie laitière, par exemple) ou médicales (quelle batterie de gènes explique la virulence d’une bactérie par rapport à une espèce voisine ?). On comprend aisément l’intérêt du séquençage du génome du riz, base de l’alimentation de la moitié de l’humanité, ou du génome de l’anophèle, moustique vecteur du paludisme qui tue plus d’un million de personnes chaque année. Nombre de pathogènes - bactéries ou eucaryotes - ont déjà été séquencés, et d’autres le seront bientôt. Enfin, l’exploration du monde bactérien dans son ensemble occupera les centres de séquençage pour de nombreuses décennies : les études de génomique entreprises depuis quelques années dans des milieux très divers (sol, océan, boues d’épuration, etc.) ont en effet révélé une formidable diversité bactérienne. Nous ne connaîtrions qu’environ 1% des espèces de bactéries, les autres étant passées jusque là inaperçues, faute d’être cultivables. Les bactéries font preuve d’une grande inventivité métabolique, et ces espèces mystérieuses constituent donc un riche réservoir de gènes qui pourraient avoir une grande importance dans le domaine de l’industrie ou de l’environnement. L’exploration des génomes de ces bactéries est une tâche d’une ampleur comparable à celle du projet Génome humain, pour laquelle les grands centres de séquençage restent plus que jamais nécessaires.
© Genoscope - Centre National de Séquençage
2 rue Gaston Crémieux CP5706 91057 Evry cedex
Tél: (+33) 0 1 60 87 25 00
Fax: (+33) 0 1 60 87 25 14
Accueil
|
Présentation
|
Projets |
Actualités |
Panorama de presse |
Ressources |
Contact
RSS 2.0
| Plan du site
|
Crédits
|
Mentions légales