Toutes les versions de cet article :
Qu’est-ce que la séquence de l’ADN ?
Pourquoi séquence-t-on l’ADN ?
Comment séquence-t-on l’ADN ?
Qu’est-ce que l’assemblage ?
Pourquoi a-t-on crée des centres de séquençage autrement nommé Genome Centers ?
Comme on vient de le voir, chaque manipulation de séquençage, ou lecture, ne livre à l’heure actuelle qu’une séquence de 500 à 1000 bases. Il est donc impossible de lire « d’une traite » la séquence des immenses molécules d’ADN, nommées chromosomes, qui renferment l’information héréditaire d’un organisme. Les chromosomes humains, par exemple, sont longs de plusieurs dizaines à plusieurs centaines de millions de nucléotides. Pour reconstituer ces séquences gigantesques, il faut réaliser un grand nombre de lectures, et même produire un volume de séquence plusieurs fois supérieur à la taille du chromosome : ces lectures redondantes permettent de raccorder les séquences les unes aux autres et de s’assurer de la qualité du résultat de chaque lecture.
En pratique, on commence par casser de façon aléatoire la grande molécule d’ADN à séquencer afin d’obtenir des sous-fragments de quelques milliers de nucléotides. En procédant à la lecture des extrémités d’un grand nombre de ces sous-fragments pris au hasard, on obtient des séquences qui se recouvrent en partie.
La comparaison de ces séquences entre elles permet de reconnaître et d’aligner les parties séquencées plusieurs fois. Grâce à ces séquences chevauchantes, on peut assembler un certain nombre de lectures pour reconstituer des enchaînements plus grands (nommés contigs), voire la totalité de la séquence du fragment de départ. Cette opération d’assemblage, réalisée par des programmes informatiques, permet de reconstituer de proche en proche des séquences de plusieurs millions à plusieurs dizaines de millions de bases.
Dans des génomes tels que le génome humain, il est nécessaire d’opérer avec une redondance d’un facteur 8 à 10 (« profondeur de 8 à 10X ») pour réassembler la séquence d’un fragment d’ADN de grande taille. En d’autres termes, pour séquencer un tel fragment, il faut le réduire en petits segments, puis réaliser un nombre de lectures suffisant pour que ces lectures, mises bout à bout, représentent 10 fois la longueur de la séquence du grand fragment. Cela revient à ce que chaque base de cette séquence soit représentée dans 10 lectures en moyenne. Même à ce niveau de redondance, il subsistera quelques trous lors de l’assemblage, car les lectures résultent d’un échantillonnage aléatoire : certaines régions seront représentées par plus de 10 lectures, d’autres par moins de 10, et quelques unes ne seront pas du tout couvertes. Le nombre et la taille des trous seront d’autant plus importants que le niveau de redondance des lectures est faible. Ces trous peuvent ensuite être « comblés » par un travail ciblé.
Une autre difficulté dans l’assemblage des séquences de « grands » génomes est causée par les séquences répétées, présentes plus ou moins à l’identique en plusieurs endroits du génome. Elles sont particulièrement abondantes dans les génomes de mammifères et représentent 50% du génome humain. Ces séquences répétées peuvent conduire à assembler ensemble deux séquences provenant en réalité de régions distantes du génome. Pour cette raison, elles sont « masquées » lors de l’assemblage.
La séquence du génome humain, avec ses 24 types de chromosomes, comporte environ 3 milliards de bases. Pour déterminer la séquence complète des chromosomes humains à une profondeur de 10X, il faut réaliser des dizaines de millions de lectures. Il est cependant possible d’obtenir une première ébauche avec un niveau de redondance moindre. Dans ce cas, les fragments réassemblés seront assez petits. Par exemple, avec un niveau de redondance de 5X, on obtient pour le génome humain des contigs d’environ 5000 bases. La séquence du génome ainsi obtenue sera donc éclatée en plusieurs centaines de milliers de morceaux.
Liste des questions
© Genoscope - Centre National de Séquençage
2 rue Gaston Crémieux CP5706 91057 Evry cedex
Tél: (+33) 0 1 60 87 25 00
Fax: (+33) 0 1 60 87 25 14
Accueil
|
Présentation
|
Projets |
Actualités |
Panorama de presse |
Ressources |
Contact
RSS 2.0
| Plan du site
|
Crédits
|
Mentions légales