Стратегия секвенирования генома

Определение "Стратегия секвенирования генома" в ЭБНБ


При рассмотрении работ, в которых сообщается об определении нуклеотидной последовательности целого генома какого-либо организма, обращает на себя внимание очень большое число соавторов. Впрочем, это не удивительно, если представить объем выполненной работы. Так, например, секвенирование генома дрожжей Saccharomyces cerevisiae было осуществлено усилиями около 600 ученых разных стран. Причем, при выполнении этого проекта было задействовано два глобальных подхода или даже, можно сказать, стратегии. Они заключались в том, что в выполнении этого проекта наряду с 5 научно-исследовательскими центрами крупного и среднего размеров, специализирующимися на секвенировании ДНК (названных в статье А. Гоффи и соавт. [Goffeau et al., 1996] - "фабриками") принимало участие и множество обычных лабораторий из разных стран. Так вот, эта сеть из 92 лабораторий внесла решающий вклад в осуществление данного проекта (как отмечают авторы - к удивлению некоторых), определив 55% всей последовательности генома, что наглядно продемонстрировало возможность международной кооперации очень большого числа ученых при выполнении крупномасштабных проектов по секвенированию ДНК целых геномов различных организмов.


Что касается выбора стратегий непосредственного получения данных по секвенированию ДНК "на рабочем месте", то следует отметить, что в цитируемых выше работах, в которых сообщалось о завершении секвенирования какого-либо генома, не использовалось чего-то особенного, поскольку специальной стратегии секвенирования геномов как бы нет и используются те или иные подходы, описанные выше в гл. 8. Причем разными исследовательскими группами на этапе получения первичной информации применялись отличающиеся подходы. Так, секвенирование геномов микроорганизмов Haemophilus influenzae [Fleischmann et al., 1995], Mycoplasma genitalum [Fraser et al., 1995] и Methanococcus jannaschii [Bult et al., 1996] и некоторых других, осуществленное одними и теми же группами ученых, было проведено с помощью вариантов случайного подхода путем механического расщепления их ДНК с последующим секвенированием случайно клонированных последовательностей. Секвенирование генома Methanobacterium thermoautotrophicum [Smith et al., 1997] было проведено, главным образом, с помощью мультиплексной технологии как ферментативным методом (38 мембранных фильтров), так и методом химической деградации (31 мембранный фильтр). Сообщается, что около трети генома микоплазмы Mycoplasma capricolum (250 тпн из 750 тпн) секвенировано методом химической деградации с помощью мультиплексной геномной "прогулки" [Dolan et al., 1995]. Однако, как правило, завершающие этапы этих и других проектов проводятся с использованием ПЦР и праймерной "прогулки".



Стратегии секвенирования протяженных фрагментов ДНК ориентированы, в основном, на определение последовательности нуклеотидов в клонированных вставках длиною от 2 тпн до 45 тпн, что соответствует клонам в обычных плазмидных или космидных векторах. Однако простое переложение этих стратегий для секвенирования полных геномов невозможно, поскольку здесь должен действовать комплексный подход. Более того, учитывая большой объем предстоящей работы при секвенировании целых геномов организмов, должен соблюдаться некий баланс между производительностью выбранного метода, включая избыточность, получаемой с его помощью информации и стоимостью всего проекта. Это вместе с большими размерами геномов как бактерий, так и тем более высших организмов диктует свои особенности. Для последних считается, что усилия, прилагаемые на этапе картирования генома, должны соотноситься с тем количеством нуклеотидов, которые необходимо определить [Roach et al., 1995].


Так, общая стратегия, специально предложенная для секвенирования геномов микроорганизмов [Fraser, Fleischmann, 1997], выглядит следующим образом: фрагментация ДНК бактерии случайным образом; субклонирование этих фрагментов; их секвенирование; компьютерная состыковка ставших известными нуклеотидных последовательностей клонированных фрагментов ДНК; выявление не полностью перекрытых участков; выбор дальнейшей стратегии секвенирования таких участков или с помощью ПЦР или праймерной "прогулкой"; заключительный анализ секвенированной последовательности; составление кольцевой хромосомы.


Первый этап этой общей стратегии состоит в получении полностью случайного набора фрагментов ДНК бактерии и их клонировании в плазмидных, фаговых или фагмидных векторах. Расщепление ДНК частощепящими рестрикционными эндонуклеазами зависит от распределения их сайтов узнавания в последовательности ДНК, которое не бывает равномерным, и это может привести к образованию фрагментов ДНК различной длины и с большим разбросом. Результатом этого будет то, что последовательность нуклеотидов более крупных субклонов не сможет быть "прочитана" в одном эксперименте и, следовательно, при состыковке субклонов это приведет к появлению несеквенированных промежутков. Во избежание этого предлагается разрушать ДНК с помощью ультразвукового или механического воздействий, практически независящих от конкретной последовательности нуклеотидов в цепи ДНК и генерирующих фрагменты ДНК с небольшими вариациями по длине.


Затем, перед началом выполнения крупномасштабного проекта по секвенированию всего генома какого-либо микроорганизма, необходимо убедиться действительно в случайном характере полученных субклонов. С этой целью проводится секвенирование от 500 до 1000 таких субклонов и последующий компьютерный анализ секвенированных нуклеотидных последовательностей позволяет определить нет ли в данной клонотеке каких-либо фрагментов, представленных в большей пропорции. При обнаружении подобного факта необходимо создать такую клонотеку заново, не допуская подобной избирательности, имевшую место для первой клонотеки. В противном случае значительные усилия и время будут тратиться на секвенирование одних и тех же участков генома, что приведет к его большому покрытию, но не позволит определить полную последовательность. Таким образом, от качества созданной клонотеки в значительной мере зависит успешное выполнение всего проекта по секвенированию полных геномов и в связи с этим данному аспекту необходимо уделять самое пристальное внимание.


Характер накопления данных при секвенировании случайным подходом условного генома протяженностью 1 мпн с помощью клонотеки ДНК с размерами вставок 500 пн

Количество клоновОбщее количество секвенированных нуклеотидовПокрытие генома (кратность)Несеквенированныи геном (пн)Несеквенированный геном (%)
500025000002,5821008,21
1000050000005,067000,67
1500075000007,56000,06
200001000000010,0400,004
250001250000012,530,0003

Но и работа даже с такой полностью случайной клонотекой неизбежно приведет к повторному секвенированию одних и тех же участков ДНК, незначительно сдвигающихся от клона к клону. Не очень сложные математические расчеты показывают, чтобы полностью секвенировать почти весь геном, необходимо определить количество нуклеотидов, более чем в 10 раз превышающее необходимое. Табл. позволяет сопоставить общее количество "прочитанных" нуклеотидов и достигаемое при этом покрытие генома.


Из таблицы видно, что в рассматриваемом частном случае определения нуклеотидной последовательности условного генома, состоящего из 1 мпн, секвенирование первых 5000 клонов даст свыше 90% нуклеотидной последовательности всего генома, тогда как следующие 5000 клонов прибавят лишь около 8% новых последовательностей. И в дальнейшем эффективность получения новых данных при продолжении секвенирования ДНК случайным подходом будет снижаться. Достаточно оптимальным является достижение 6-кратного покрытия генома и завершение всего проекта с помощью каких-либо других стратегий направленного подхода [Bouk et al, 1998]. В этой же работе говорится, что 3-4-кратное покрытие генома приведет к формированию знаний, которые могут оказаться полезными при первичном анализе кодирующих областей, тогда как 2-кратное покрытие может дать предварительную информацию об экзонах и позволит вовлечь в анализ EST-последовательности. После компьютерной состыковки "прочитанных" последовательностей и выявления незавершенных промежутков приступают к их секвенированию или с помощью ПЦР, или праймерной "прогулкой". Разработанная специальная программа BULLET, позволяющая проводить компьютерную симуляцию нарастания данных при секвенировании ДНК с помощью случайного подхода, показала, что когда становятся известны 98% от всей последовательности секвенируемого фрагмента ДНК (по одной цепи), это должно соответствовать приблизительно его 80%-ному покрытию по обеим цепям [Smith, Bernstein, 1995]. Другая компьютерная программа PRIMO была способна после состыковки фрагментов, секвенированных случайным подходом, автоматически подбирать олигонуклеотидные праймеры для завершения всего проекта по секвенированию с помощью праймерной "прогулки" [Li et al., 1997]. Несколько ранее был предложен подход к секвенированию больших геномов только с использованием праймерной "прогулки" [Szybalski, 1993], в основе которой лежал принцип формирования затравочных молекул из библиотеки предсинтезированных 6-мерных олигонуклеотидов путем их лигирования Т4 ДНК-лигазой непосредственно на самой матрице ДНК [Szybalski, 1990], что теоретически позволяет снизить избыточность первичной информации и секвенировать геномы со значительно меньшим покрытием.


Предложенная относительно недавно стратегия геномного секвенирования более крупных геномов, включая геном человека [Venter et al., 1996], несколько отличается от таковых, рассчитанных на секвенирование бактериальных хромосом [Fraser, Fleischmann, 1997] и от применявшихся ранее для крупных геномов, где считалось, что каждый регион должен быть прежде картирован. В ее основе лежит принцип последовательного получения случайных субклонов с уменьшающимися размерами вставок в соответствующих векторах, начиная с вектора на основе искусственной бактериальной хромосомы. Так, ВАС-вектор на основе бактериальной искусственной хромосомы (Bacterial Artifial Chromosome) способен нести вставки размером до 350 тпн и, таким образом, весь человеческий геном с 15-кратным покрытием может "поместиться" в клонотеке из 300 тысяч таких клонов, принимая средний размер вставки равным приблизительно 150 тпн. Важным преимуществом ВАС-вектора перед YAC-векторами на основе дрожжевой искусственной хромосомы (Yeast Artificial Chromosome) является его большая стабильность [Shizuya et al., 1992], поскольку считается, что до 50% YAC-клонов могут быть химерами, что внесет сильную путаницу при состыковке секвенированных участков и заключительной реконструкции полного генома. Полученные клоны в ВАС-векторе распределяются по микротитраторным планшетам, хранятся соответствующим образом и берутся для исследования по мере надобности. Следующим этапом является получение очередной клонотеки уже вставки из ВАС-вектора в фаговом, плазмидном или фагмидном векторе. Так, 3000 субклонов со вставками длиной около 1000 пн в этих типах векторов будут достаточны для субклонирования каждого такого клона из ВАС-вектора с условным двойным покрытием. Секвенирование концевых 500 нуклеотидов вставки каждого В АС-клона (с каждого из концов, граничащих с векторными последовательностями) сделает известной около 10% (3x108 пн) всей последовательности человеческого генома (3x1099 пн). Теоретически секвенированные таким образом участки будут встречаться во всем геноме в среднем через 5 тпн, что позволит потом каждый ВАС-клон соотнести с 30 другими, в которых будут находиться эти же последовательности нуклеотидов (150 тпн/5 тпн). Авторы цитируемой работы обозначили такие нуклеотидные последовательности концов вставок в ВАС-клонах как STC (sequence-tagged connector). В дальнейшем, после завершения секвенирования каждого набора субклонов, соответствующего одному ВАС-клону, проводится этап состыковки известных последовательностей и с помощью STC выявляются участки перекрытия вставок из ВАС-клонов. При этом может оказаться, что для секвенирования всего генома человека, имеющего размер (3x109 пн), или любого другого, ему подобного, может оказаться достаточным всего 20 тыс клонов с ВАС-векторами. Для организмов с еще меньшими геномами потребуется соответственно и меньшее число ВАС-клонов.


Считается, что современная техника секвенирования ДНК позволяет завершить проект определения нуклеотидной последовательности какого-либо прокариотического организма с геномом до 2 мпн за 6 мес, если задействовать требуемое число сотрудников и получить должное финансирование. Секвенирование геномов с размерами от 2 до 6 мпн уже требует значительно большего времени, значительных усилий и средств. Так, считается, что на сегодняшний день стоимость одного определенного нуклеотида составляет около 50 центов и предполагается, что к моменту завершения секвенирования генома человека за счет продолжающегося усовершенствования методов секвенирования ДНК она будет составлять не более 25 центов [Collins et al., 1998].




"ЭБНБ" >> "С" >> "СТ" >> "СТР"

Статья про "Стратегия секвенирования генома" в Энциклопедии БНБ была прочитана 6662 раз
Пицца в сковороде
Куриный суп

TOP 15