Геномы прокариотических организмов

Определение "Геномы прокариотических организмов" в ЭБНБ


В июле 1995 г. в американском журнале "Science" появилась статья, сообщающая об определении нуклеотидной последовательности полного генома самостоятельно существующего организма - бактерии Haemophilus influenzae, состоящего из 1 830 137 пн [Fleischmann et al., 1995]. В выполнении этого проекта приняло участие 40 ученых из 4 исследовательских центров США. Но основная нагрузка выпала на долю сотрудников Института геномных исследований (TIGR - The Institute for Genomic Research) и его директора Дж.К. Вентера. Весьма примечательным можно считать то, что второй руководитель проекта Г. Смит, являющийся лауреатом Нобелевской премии и получивший ее за открытие рестрикционных эндонуклеаз, обнаружил эти ферменты чет-верь века назад именно у данного вида микроорганизмов [Smith, Wilcox, 1970]. Так что бактерия Haemophilus influenzae, уже дважды открывшая для молекулярной биологии новые перспективы, может этим "гордиться".


Основной стратегией определения нуклеотидной последовательности при выполнении проекта по секвенированию генома бактерии Haemophilus influenzae, RD штамма KW20 можно считать случайный подход с субклонированием фрагментов ДНК, разрушенных механическим путем. На разных стадиях выполнения проекта осуществлялось и секвенирование вставок, клонированных в Х-векторах. Заключительная ликвидация промежутков проводилась с помощью праймерной "прогулки". В результате было достигнуто 6-кратное покрытие всего генома.


Проведенная компьютерная состыковка секвенированных участков позволила выявить, что полный геном бактерии состоит из 1 830 137 пн и характеризуется относительно низким содержанием GC-пар (38%), причем найдено 7 протяженных участков с более высоким (около 50%) содержанием GC-nap. Дальнейший анализ нуклеотидной последовательности привел к обнаружению предположительного ориджина репликации, состоящего из 280 пн, 6 оперонов рРНК, 54 генов тРНК для всех 20 аминокислот. На основании полученных данных авторами была составлена кольцевая карта хромосомы Haemophilus influenzae, состоящая из нескольких концентрических колец, несущих различную информацию о данном геноме. Из 1743 предполагаемых кодирующих регионов для 736 не удалось выявить их функции. 389 предсказанных кодирующих участков не показали значимой гомологии с известными на тот момент сведениями, содержащимися в ГенБанке и прочих базах данных. Таким образом, около 78% открытых рамок считывания Haemophilus influenzae имели гомологию с обнаруженными ранее и представленными в базах данных подобными последовательностями других организмов, причем для 20% из этих 78% функциональная роль кодируемых ими гипотетических белков неизвестна.



В заключительном разделе цитируемой статьи авторы говорят о важных уроках, которые они извлекли при выполнении данного проекта и выражают уверенность, что это поможет в дальнейшем при секвенировании геномов других микроорганизмов. Доказательством этому явилось сообщение уже в октябрьском номере "Science" о секвенировании практически тем же коллективом авторов полного генома еще одной бактерии Mycoplasma genitalum [Fraser et al., 1995], причем для выполнения этого проекта потребовалось всего 4 мес.


Полная нуклеотидная последовательность генома Mycoplasma genitalum оказалась равной "всего" 580070 пн. Изучение такого небольшого генома свободно-живущего, хотя и ведущего паразитический образ жизни организма, представляло интерес в связи с возможностью выявления чуть ли не минимального набора генов, необходимых для самостоятельного существования. Генеральная стратегия секвенирования ДНК этого объекта принципиально не отличалась от таковой при секвенировании генома Haemophilus influenzae. Было определено в общей сложности 3 806 280 нуклеотидов в виде первичных данных, что составило приблизительно 6,5-кратное покрытие полного генома.


Дальнейший анализ показал, что нуклеотидный состав генома Mycoplasma genitalum варьирует от 27 до 37% GC-nap со средней величиной, равной 34%. Самое низкое содержание GC-nap, как и у Haemophilus influenzae, отмечено в области предполагаемого ориджина репликации, а самое высокое характерно для генов рРНК (44%) и тРНК (52%), что легко объясняется присущей этим молекулам сильной вторичной структурой. Выявление открытых рамок считывания позволило обнаружить 470 регионов, которые могли бы кодировать белки. 96 регионов не обнаружили при этом заметной гомологии с другими последовательностями, находящимися в базах данных, что не позволило приписать им какую-либо функцию. Оставшиеся 374 оказалось возможным идентифицировать, исходя из имеющейся гомологии и разделить на условные ферментативные группы, отвечающие за те или иные процессы в жизнедеятельности клетки.


Сравнительная геномика этих двух микроорганизмов - Haemophilus influenzae и Mycoplasma genitalum - показала некоторую разницу между ними в доле тех или иных генов, кодирующих белки с определенной биологической ролью, от всего генома или, правильнее сказать, от общего числа обнаруженных открытых рамок считывания. Так, для Mycoplasma genitalum гены с биологической ролью в виде репликации, транскрипции и трансляции составляют несколько большую долю по сравнению с таковыми у Haemophilus influenzae. Что касается таких функциональных категорий, как биосинтез аминокислот, метаболизм жирных кислот и фосфолипидов, биосинтез кофакторов и некоторых других, то можно видеть, что гены, относящиеся к этим группам, в геноме Mycoplasma genitalum представлены очень скупо. Причиной этому является как раз довольно малый размер генома и вынужденная "экономия" своей ДНК. Это же объяснение может быть распространено и на то, что доля потенциальных белковых продуктов с невыясненной ролью у Haemophilus influenzae составляет 43% от всех теоретически выявленных, а у Mycoplasma genitalum - только 32%.


Очередным геномом, нуклеотидная последовательность которого стала известна благодаря, в основном, той же группе авторов, стал геном архебактерии Methanococcus jannaschii [Bult et al., 1996]. Стратегия его секвенирования также принципиально не отличалась от задействованных при секвенировании двух предыдущих геномов Haemophilus influenzae и Mycoplasma genitalum и лишь покрытие генома было приблизительно 10-кратным. Особенностью данного генома можно считать то, что он состоит из трех частей, кольцевой хромосомы (1664976 пн), большого экстрахромосомного элемента (58407 пн) и малого экстрахромосомного элемента (16550 пн). Главная составная часть генома в виде кольцевой хромосомы имеет средний GC-состав около 31% и содержит 1682 региона, для которых обнаружены открытые рамки считывания. GC-состав экстрахромосомных элементов незначительно различается и составляет 28,2% для большого и 28,8% для малого. В большом экстрахромосомном элементе найдено 44 потенциальных региона, кодирующих белки, тогда как для малого их выявлено всего 12. Дальнейший анализ всех этих потенциальных белков показал, что только для 38% из них в базах данных обнаруживаются гомологичные последовательности с известной функцией и еще для 6% имеется заметная гомология с некими гипотетическими белками. Следует отметить, что для ранее секвенированных геномов Haemophilus influenzae и Mycoplasma genitalum характерны другие соотношения, причем 83% потенциальных белков Mycoplasma genitalum имело своих гомологов в геноме Haemophilus influenzae. Для предсказанных белков Methanococcus jannaschii характерно лишь 11%-ное совпадение с белками Haemophilus influenzae и 17%-ное с Mycoplasma genitalum. Таким образом, для большинства генов и потенциально кодируемых ими белков Methanococcus jannaschii не выявлена их функция, исходя из гомологии последовательностей. В геноме Methanococcus jannaschii обнаружено два оперона рРНК и 37 генов тРНК, причем некоторой особенностью последних является то, что почти все аминокислоты, кодируемые парами триплетов, у данной бактерии представлены только одним типом тРНК для каждой из них. Исключение составляет лишь глутаминовая кислота, для которой в геноме присутствуют оба типа тРНК.


Однако следует особо подчеркнуть, что у архебактерии Methanococcus jannaschii для части генов с известными функциями, как, например, отвечающими за клеточное деление, метаболизм, продукцию энергии, более высокая гомология обнаруживается с прокариотическими организмами. Тогда как гены, вовлеченные в процессы репликации, транскрипции и трансляции, более подобны таковым эукариот. Это может лишний раз свидетельствовать, что архебактерии имеют с эукариотами общую эволюционную траекторию, независимую от эволюции эубактерий.


В связи с обнаруженными в результате этих работ серьезными различиями между эубактериями и архебактериями теперь и на геномном уровне особое значение приобрело определение полной нуклеотидной последовательности другого представителя архебактрий - Methanobacterium thermoautotrophicum [Smith et al., 1997]. В выполнении этого проекта принимала участие большая группа ученых из четырех исследовательских центров США, возглавляемая Д.Р. Смитом.


Стратегия секвенирования полного генома этой бактерии Methanobacterium thermoautotrophicum АН заметно отличалась от применяемых сотрудниками Дж.К. Вентера и Г. Смита. Так, нуклеотидная последовательность значительной части генома была определена с помощью мультиплексного секвенирования, причем как ферментативным методом, так и методом химической деградации. В общей сложности было секвенировано около 14,8 мпн, что соответствовало 8,5-кратному покрытию всего генома, который в итоге составил 1 751 377 пн и содержал около 49,5% GC-nap. Проведенный анализ этой последовательности нуклеотидов позволил выявить 1855 открытых рамок считывания. Для 844 из них (46%) была идентифицирована предполагаемая функция на основе аналогичных последовательностей, хранящихся в различных базах данных. Кроме этого, 514 (28%) регионов соответствовали гипотетическим белкам с неизвестной функцией, но представленным в банках данных. Оставшиеся 496 (27%) или вообще не имели какой-либо гомологии, или характеризовались ее низким уровнем с известными последовательностями, что также не позволило приписать им какую-либо функциональную роль. В геноме Methanobacterium thermoautotrophicum обнаружено 2 оперона рРНК и 39 генов тРНК, причем для этой бактерии, как и для Methanococcus jannaschii, характерно существование только по одному типу тРНК для аминокислот, кодируемых парами триплетов. Исключение также составляет лишь глутаминовая кислота, для которой в геноме Methanobacterium thermoautotrophicum присутствуют оба типа тРНК.


Проведенный сравнительный анализ предсказанных белков Methanobacterium thermoautotrophicum с известными последовательностями в специальных базах данных по эубактериям, архебактериям и эукариотическим организмам показал, что 54% предположительных генных продуктов этой архебактерии показывают все же более высокую гомологию именно с архебактериями. Это было бы совсем не удивительно, если бы не факт довольно низкой гомологии между двумя представителями метаносбраживающих архебактерии Methanobacterium thermoautotrophicum и Methanococcus jannaschii. Так, только 352 (19%) предсказанных белковых продукта Methanobacterium thermoautotrophicum обнаруживаются и у Methanococcus jannaschii. Анализ предсказанных белков Methanobacterium thermoautotrophicum показал, что 42% из них все же ближе к эубактериальным и только 13% имеют более высокую гомологию с эукариотическими. Причем, как и в случае Methanococcus jannaschii, к последним относятся ферменты и прочие белки, вовлеченные в метаболизм ДНК, транскрипцию и трансляцию. К бактериальному же типу принадлежат белковые продукты, принимающие участие в общем метаболизме клеток.


Пожалуй, наиболее долгожданным из прокариотических геномов, чья полная нуклеотидная последовательность была определена, явился геном кишечной палочки Escherichia coli. Поскольку этот микроорганизм был наиболее широко используемым и исследуемым объектом в молекулярной генетике и биологии, то можно было предполагать, что уж его-то геном будет секвенирован в первую очередь. Более того, к моменту только начала выполнения проектов по секвенированию геномов некоторых бактерий для Е. coli было уже известно около 800 тысяч нуклеотидных пар. Однако весьма значительный размер генома данной бактерии (около 4,7 мпн) позволил ей стать только шестым микроорганизмом с полностью известным геномом, определение нуклеотидной последовательности которого в рамках специального проекта заняло около 6 лет [Blattner et al., 1997].


4 639 221 пн генома Е. coli К-12 штамма MG1655 была определена с помощью различных стратегий секвенирования, главной из которых было клонирование в специализированном векторе М13 Janus, созданном в лаборатории генетики Висконсинского университета, где преимущественно и выполнялся данный проект [Blattner et al., 1997]. Кроме этого, еще три исследовательских центра США и один Мексики приняли участие в осуществлении этого проекта. Так, на первом этапе было достигнуто 4-5-кратное покрытие генома за счет секвенирования случайных субклонов в фаговом векторе М13 Janus. После компьютерной состыковки "прочитанных" последовательностей применялось секвенирование недостающих клонов в фаге лямбда, а также ограниченная праймерная "прогулка".


Содержание GC-nap в геноме Е. coli составило 50,8%. Проведенный компьютерный анализ выявил 4288 открытых рамок считывания, принадлежащих как действительно существующим белок-кодирующим генам, так и только гипотетическим. Дальнейший анализ показал, что для 38% из них пока не может быть определена функциональная роль. Для реальных и потенциальных белков стартовыми кодонами являются ATG (3542 случая), GTG (612), TTG (130). Возможно еще есть один СТС и один CTG кодоны в качестве стартовых. Частоты встречаемости терминирующих кодонов также заметно различаются: ТАА (2705 раз), TGA (1257), TAG (326). 405 генов показывают перекрытие стартового и терминирующего кодонов: ATGA (224 случая), TAATG (98), TGATG (48), GTGA (28), TAGTG (4), TTGA (3). Было проведено сравнение белков (открытых рамок считывания) Е. coli с аналогичными Haemophilus influenzae, причем в расчет принималось только совпадение по крайней мере 60% всего белка с 30%-ной идентичностью аминокислот. В результате оказалось, что ИЗО потенциальных белков Haemophilus influenzae из 1743 возможных совпадают с таковыми кишечной палочки. Привлеченные в анализ полные геномы других бактерий Synechocystis sp. и Mycoplasma genitalum показали несколько худшее совпадение. Следует отметить, что 111 генов были присущи всем сравниваемым организмам. В то же время геномы организмов, относящихся к другим группам архебактерий и эукариот ( Methanococcus jannaschii и Saccharomyces cerevisiae соответственно), имели с Е. coli 231 и 254 сходных белка. Однако для всех этих геномов, принадлежащих разным организмам (Е. coli, Haemophilus influenzae, Mycoplasma genitalum, Synechocystis sp., Methanococcus jannaschii, Saccharomyces cerevisiae), характерно только 16 общих белков с заданным при данном сравнении уровнем гомологии.


Выявленный ориджин репликации и место его терминации разделили геном Е. coli на две реплицирующиеся в противоположных направлениях половины, названных авторами реплихорами. Оказалось, что около 55% генов расположены в направлении, совпадающем с репликацией. Так, все семь оперонов рРНК и 53 из 86 генов тРНК транскрибируются в направлении репликации. Давно известна чрезвычайно редкая встречаемость в ДНК Е. coli сайтов узнавания рестрикционной эндонуклеазы Mael (CTAG), причины которой так до конца и не ясны, хотя в литературе высказывались различные предположения. Полная нуклеотидная последовательность генома Е. coli позволила подтвердить это с помощью компьютера и оказалось, что количество таких сайтов составляет всего 886 против 18101 теоретически ожидаемого. Как отмечают авторы цитируемой статьи, еще предстоит тщательный анализ нуклеотидной последовательности потенциальных генов и кодируемых ими белков Е. coli и сопоставление этих результатов с известными биохимическими данными.


О начале секвенирования полного генома другого штамма Escherichia coli К-12 W3110 и об объединении для этой цели нескольких групп исследователей из Японии и США было объявлено в конце 1992 г. [Kasai et al., 1992]. В настоящее время японскими учеными полностью завершено секвенирование участка генома 0-68,8 мин. Совместно с банком данных DDBJ на основе секвенированного ими генома Escherichia coli разрабатывается информационная интерактивная система, охватывающая различные аспекты геномики этой бактерии [Tateno et al., 1998]. Причем отмечается, что данная система может послужить прообразом для представления в сети WWW прочих полных геномов организмов.


Секвенирование полного генома грамположительного микроорганизма - почвенной бактерии Bacillus subtilis, штамма 168 - было осуществлено усилиями международного консорциума, в который входили 25 европейских, 7 японских и 1 лаборатория из Южной Кореи [Kunst et al., 1997]. Каждая исследовательская группа была вольна в выборе той или иной стратегии секвенирования, однако общим требованием было секвенирование обеих цепей ДНК. Размер генома Bacillus subtilis оказался довольно большим и составил 4 214 810 пн. Усредненный GC-состав ДНК генома равен 43,5%, однако, если принимать в расчет кодирующие последовательности ДНК по одной цепи, то соотношения нуклеотидов будут весьма различаться между собой (G - 24%, А - 30%, С -20%, Т - 26%). При анализе генома были обнаружены открытые рамки считывания для приблизительно 4100 потенциальных белков, причем следует отметить, что около четверти из них организованы в генные семейства. Самым большим таким семейством является группа из 77 генов, кодирующих белки-транспортеры, что вполне объяснимо, учитывая особенности организации клеточной стенки у грамположительных бактерий. Еще одно крупное семейство генов кодирует белки, секретирующиеся в культуральную среду, что также характерно для данной группы бактерий. Стартовым кодоном для 78% генов служит ATG, для 13% - TTG и для 9% - GTG, что несколько отличается от обнаруженных у кишечной палочки. У бациллы выявлены также и необычные стартовые кодоны для нескольких белков - АТТ и CTG.


Значительный интерес представляло сравнение геномов двух бактерий Bacillus subtilis и Е. coli даже по причине сходства их размеров. Так, в цитируемой работе было определено, что около 1000 генов бациллы имеют своих ортологов в геноме кишечной палочки, причем некоторые из них характеризуются иным порядком генов в едином опероне. Так, например, арабинозный оперон в геноме бациллы организован как araABD, тогда как у Е. coli он представлен в виде araBAD. Сравнительный анализ большого генома Bacillus subtilis и "крохотного" генома Mycoplasma genitalum позволил сделать интересные заключения, поскольку считается, что микоплазмы произошли от грамположительных бактерий. Действительно, 300 генных продуктов микоплазмы совпадают с таковыми у бациллы. Из оставшихся 146 открытых рамок считывания у миклоплазмы 3 совпадают с белками других видов бацилл, еще 9 - с белками других грамположительных бактерий, 25 - подобны белкам разных грамотрицательных бактерий, 19 - с белками других видов микоплазм. Таким образом, можно предполагать, что только 90 генов у Mycoplasma genitalum кодируют белки, вовлеченные во взаимодействие микроорганизма и его хозяина. Как видно из приведенного примера, сравнительная геномика уже сейчас позволяет выявлять определенные гены какого-либо организма (пока микроорганизма), кодирующие белки, ответственные за те или иные особенности его жизнедеятельности.


Еще одним грамположительным организмом, геном которого секвенирован, стала бактерия Mycobacterium tuberculosis [Cole et al., 1998]. Геном Mycobacterium tuberculosis довольно крупный (4411 529 пн) и превосходит по размеру геном Bacillus subtilis и лишь немного уступает геному кишечной палочки. К особенностям данного генома можно отнести довольно высокое содержание GC-nap, равное 65,6%. Кроме этого, в геноме этой бактерии обнаружена повторяющаяся ДНК, мультигенные семейства, дуплицированные гены. Число открытых рамок считывания насчитывает 3924. В 35% случаев стартовым кодоном является GTG, что объясняется высоким GC-составом ДНК этой бактерии.


Из других бактериальных геномов, полные нуклеотидные последовательности которых известны, можно отметить небольшой геном (816 394 пн) Mycoplasma pneumonia, содержащий информацию о 677 открытых рамках считывания, причем для 75,9% из них обнаруживаются гомологичные последовательности в банках данных [Himmelreich et al., 1996]. Геном несколько большего размера характерен для патогенной бактерии Borrelia burgdorferi B31, содержащей линейную хромосому (910 725 пн), а также серию плазмид общей протяженностью около 533 тпн [Fraser et al., 1997]. Определена полная нуклеотидная последовательность генома одноклеточной цианобактерии Synechocystis sp. штамма РСС6803, составившая 3 573 470 пн [Kaneko et al., 1996]. Компьютерным анализом найдены потенциальные открытые рамки считывания для 3168 белков, из которых 145 были идентичны известным ранее генам. Более 50% белковых продуктов показали определенную гомологию с последовательностями белков, занесенными в банки данных, как с известными функциями (1257), так и с гипотетическими (340) соответственно. Оставшиеся 45% не имели значимой гомологии с последовательностями в банках данных.


Секвенирован геном бактерии Helicobacter pylori штамма 26 695, состоящий из 1 667 867 пн [Tomb et al., 1997]. К некоторым особенностям белков, кодируемых этим микроорганизмом, ответственного, как считается, за хронический гастрит, можно отнести повышенное содержание основных аминокислот (аргинина, лизина), что, видимо, является следствием его приспособления к кислотности желудочного сока. Определена нуклеотидная последовательность всего генома еще одного опасного для человека микроорганизма Treponema pallidum, являющегося возбудителем сифилиса [Fraser et al., 1998]. Его размер оказался равен 1 138 006 пн с довольно высоким GC-составом (52,8%). Обнаружена 1041 открытая рамка считывания и для 287 из них (28%) не обнаружено гомологичных белковых продуктов в банках данных. Следует отметить наличие в относительно небольшом геноме бледной спирохеты Treponema pallidum 61 типа (всех возможных) генов тРНК. Недавно сообщено о завершении секвенирования полного генома другого опасного микроорганизма Rickettsia prowazekii, являющегося внутриклеточным паразитом и вызывающего сыпной тиф [Andersson et al., 1998]. Его геном состоит из 1 111 523 пн и несет информацию о 834 белковых продуктах. Своеобразной чертой этого генома можно считать высокую долю некодирующих последовательностей (около 24%), что не характерно для прочих микроорганизмов. Так, для генома Haemophilus influenzae этот показатель составляет 13%, а для генома Aquifex aeolicum [Deckert et al., 1998] - он еще меньше (6%). Другой интересной особенностью генома Rickettsia prowazekii является высокая гомология значительной части его генов и кодируемых ими белков с митохондриальными. Секвенированный геном гипертермофильной бактерии Aquifex aeolicum, являющейся облигатным хемолитоавтотрофом, состоит из 1 551 335 пн с GC-составом 43,4% [Deckert et al., 1998]. 93% генома кодирует какие-либо белки. Так, 849 открытых рамок считывания гомологичны белкам с известной функцией, 256 - белкам с неизвестной функцией и для оставшихся 407 в банках данных не обнаружено гомологичных последовательностей. Кроме главной хромосомы, у данной бактерии имеется еще экстрахромосомный элемент протяженностью 39 456 пн с более низким GC-составом (36,4%). Он кодирует только 1 белок с известной функцией, 4 белка с неизвестными функциями, но представленными в банках данных и 27 гипотетических белков, не выявленных у других организмов ранее.


Небольшая плазмида, имеющая размер 7493 пн, характерна и для генома другой бактерии Chlamydia trachomatis, состоящего из 1 042 5119 пн и содержащего 41,3% GC-nap [Stephens et al., 1998]. Геном этой бактерии был секвенирован с помощью клонирования случайных фрагментов в векторе на основе фага М13, что привело приблизительно к 10-кратному покрытию. Анализ открытых рамок считывания позволил выявить белковые продукты, потенциально связанные с вирулентностью. 255 потенциальных белков (28%) не обнаружили гомологии с ранее секвенированными последовательностями, представленными в банках данных. Особенностью генома этой бактерии является наличие ряда генов, показывающих заметную гомологию с эукариотическими, причем наиболее удивительным является то, что они оказались более близки генам представителей царства растений и только затем -крысе и человеку. Подобные гены бактерий Е. coli, Haemophilus influenzae и Helicobacter pylori оказались еще более удаленными. В то же время у Chlamydia trachomatis выявлено 58 семейств паралогичных генов, что сравнимо с количеством таковых у прочих микроорганизмов с небольшими геномами.


Большинство микроорганизмов, геномы которых оказались секвенированы, характеризуются относительно низким содержанием GC-nap, доходящим у Rickettsia prowazekii даже до 29,1%. Некоторым исключением является спирохета Treponema pallidum, геном которой содержит более 50% GC-nap (52,8%). Геном Е. coli несет приблизительно равное соотношение GC-nap и АТ-пар - 50,8%, однако авторы отмечают заметный уровень компрессии, мешавший эффективному секвенированию ДНК этой бактерии. Самый высокий GC-состав (65,6%) среди всех секвенированных геномов характерен для грамположительной бактерии Mycobacterium tuberculosis, что вызывало высокий уровень компрессии при секвенировании ДНК. Также большие трудности поджидали экспериментаторов при секвенировании симбиотической мегаплазмиды клубеньковой азотфиксирующей бактерии Rhizobium sp., штамма NGR234 [Freiberg et al., 1996]. Причиной тому было высокое содержание GC-nap у этого микроорганизма, варьирующее от 59 до 65% и приводящее к значительной компрессии (до 400 случаев на среднюю космидную вставку). После завершения секвенирования ДНК этой крупной плазмиды (536 165 пн), лишь немного уступающей целому геному Mycoplasma genitalum (580 070 пн), оказалось, что усредненное содержание GC-nap в данной плазмиде составляет 58,5%, тогда как полный геном этой бактерии Rhizobium sp. характеризуется еще более высоким GC-составом (62,2%), определенным пока только косвенными методами [Freiberg et al., 1997].


Секвенирован геном еще одной архебактерии Archaeoglobus fulgidus, размер которого составил 2 178 400 пн [Klenk et al., 1997]. В его последовательности найдено 2436 открытых рамок считывания, четвертая часть из которых приходится на не охарактеризованные еще белки и, в свою очередь, две трети которых совпадают с также не охарактеризованными гипотетическими белками Methanococcus jannaschii. Другая архебактерия Pyrococcus horikoshii штамм ОТЗ имеет несколько меньший размер генома, состоящий из 1 738 505 пн с GC-составом 42,0% [Kawarabayasi et al., 1998]. Проведенный поиск выявил 2002 открытые рамки считывания протяженностью более 100 аминокислотных остатков, 44,4% которых кодировали гипотетические белки, не обнаруженные ранее у других организмов.


В настоящее время около 50 проектов по секвенированию полных геномов прокариотических организмов находятся или на стадии завершения или активно выполняются. Следует отметить, что значительная часть бактерий, полная нуклеотидная последовательность геномов которых уже определена (Chlamydia trachomatis, Borrelia burgdorferi, Helicobacter pylori, Mycobacterium tuberculosis, Mycoplasma pneumonia, Mycoplasma genitalum, Rickettsia prowazekii, Treponema pallidum), а также и тех, что еще только секвенируются (Campylobacter jejuni, Chlamydia pneumoniae, Clostridium acetobutylicum, Desulfovibrio vulgaris, Enterococcus faecalis, Francisella tularensis, Lactobacillus acidophilus, Legionella pneumophila, Mycobacterium leprae, Neisseria gonorrhoeae, Neisseria meningitidis, Pseudomonas aeruginosa, Pseudomonas putida, Salmonella typhimurium, Staphylococcus aureus, Streptococcus pneumoniae, Streptococcus pyogenes, Treponema denticola, Ureaplasma urealyticum, Vibrio cholerae, Yersinia pestis), относится к возбудителям опасных заболеваний человека. Так, знание нуклеотидной последовательности всего генома этих микроорганизмов может оказать большую помощь в борьбе с данными инфекциями. В процессе выполнения находятся и проекты, направленные на выяснение полных геномов архебактерий: Halobacterium salinarium, Methanosarcina mazei, Pyrococcus furiosus, Sulfolobus solfataricus, Thermoplasma acidophilum и некоторых других.


Значительное внимание, уделенное в данной главе именно геномам прокариотических организмов, объясняется завершенностью большого числа этих проектов, их изученностью и возможностью сравнительного анализа. Другой причиной служит то серьезное влияние, которое оказала расшифровка первого полного бактериального генома Haemophilus influenzae не только на молекулярную биологию, но и на микробиологию и, как отмечается в одной статье, привела к новому пониманию прокариотического мира [Tang et al., 1997].




"ЭБНБ" >> "Г" >> "ГЕ" >> "ГЕН"

Статья про "Геномы прокариотических организмов" в Энциклопедии БНБ была прочитана 7903 раз
Коптим скумбрию в коробке
Семга на горелке

TOP 15