Анализ полного генома

Определение "Анализ полного генома" в ЭБНБ


Главной задачей, стоящей перед исследователями, и решению которой служит расшифровка всей последовательности ДНК, является выяснение всех аспектов жизнедеятельности того или иного организма, геном которого оказался полностью секвенированным. Решение этой задачи в полном объеме дело будущего, причем, наверное, отдаленного. Однако приближение к такому полному знанию лежит через постепенное выяснение основных принципов и особенностей функционирования геномов. Необходимым этапом служит обнаружение in silico (т.е. на уровне ДНК) всех потенциальных белковых продуктов, составляющих протеом исследуемого организма. Далее необходимо каким-то образом определить функции этих еще гипотетических белков. Весьма заметную роль в таком познании выполняет сравнительный анализ этих белковых продуктов с уже известными.


После завершения составления нуклеотидной последовательности полного генома, исключающей какие-либо неоднозначности, с помощью специальной компьютерной программы, например Consed [Gordon et al., 1998] или GRM [Lawrence et al., 1994], наступает этап анализа всего генома через последовательность его ДНК. Кроме становящихся автематически известными общего количества нуклеотидов в геноме и GC-состава ДНК, следуют стандартные процедуры по определению количества рибосомных оперонов, генов тРНК, повторяющихся элементов, транспозонов, обнаружения ориджина репликации и др. [Fraser, Fleischmann, 1997]. Пожалуй, самым важным элементом анализа, как уже отмечалось выше, является обнаружение всех потенциальных открытых рамок считывания, имеющих достаточную протяженность и выявление, таким образом, всего протеома. Идентификация среди потенциальных продуктов протеома тех, что обнаруживают заметную гомологию с белками с известной функцией, ранее занесенными в банки данных, позволяет приписать им конкретную роль. Однако выявленные подобным образом гомологичные гены могут быть как ортологичными, так и паралогичными, что, естественно, скажется на функции, выполняемой их белковыми продуктами. Проблема заключается в том, что паралогичные гены, возникающие в результате дупликации, часто за счет дивергенции накапливают определенные замены, приводящие к тому, что кодируемые ими белки могут уже выполнять отличающуюся функцию. Но при этом уровень гомологии таких генов может оказаться довольно значительным, что в итоге приведет к ошибке при определении роли какого-либо нового белка из протеома исследуемого организма. Кроме орто- и паралогичной, принято различать еще несколько типов гомологии генов, характерные примеры которых приведены ниже:



ГомологичныеГены, имеющие общего предка, например все глобины
ОртологичныеГомологичные гены, дивергировавшие после событий видообразования (например, β-глобин человека и β-глобин шимпанзе)
ПаралогичныеГомологичные гены, дивергировавшие после событий дупликации (например, (β- и γ-глобины)
КсенологичныеГомологичные гены, дивергировавшие после событий горизонтального переноса генов (например, гены устойчивости к антибиотикам у бактерий)
Позиционная гомологияСпецифические позиции аминокислот или нуклеотидов в разных белках или кодирующих их генах, совпадающие с таковыми у их общих предковых форм

В то же время нельзя забывать, что такой эволюционный процесс, как конвергенция, может привести к образованию подобных по своей последовательности белков и их генов, которые при этом не будут гомологичными.


Большое значение в анализе протеома приобретает сравнительная геномика [Koonin et al., 1996], ставшая возможной после завершения секвенирования нескольких геномов прокариот. Причем сравнение одного полного генома микроорганизмов даже с незавершенным геномом другого позволило выявить важные черты обоих [Tatusov et al., 1996]. Сравнение полных геномов микроорганизмов на предмет их сходства и эволюционных взаимоотношений вызвало к жизни термин "филогеномика" [Eisen, 1998]. В этой работе автор проводит анализ подходов при выявлении эволюционных семейств белков и предостерегает от ошибочного выбора. Проведенное сравнение белковых продуктов, кодируемых 6 прокариотическими геномами, включая 1 архебактериальный, и одним эукариотическим, позволило уже другим авторам выявить так называемые кластеры ортологичных групп (Clusters of Orthologous Groups или COGs) [Tatusov et al., 1997]. В результате оказалось идентифицировано 720 таких групп, каждая из которых представлена как минимум 3 белками, причем для большинства этих групп уже известна функциональная роль белков, входящих в данный COG. Поскольку ортологичные гены обычно кодируют белки с одинаковыми функциями, то, основываясь на этих выявленных кластерах, становится значительно легче приписывать "новым" белкам конкретную роль.


Кодирующие и некодирующие участки генома могут быть также обнаружены и путем определения частот встречаемости отдельных олигонуклеотидов с помощью подхода, получившего название "внутреннего" [Borodovsky et al., 1994]. "Внешний" подход, также использованный этими авторами, заключался в обнаружении значительного подобия продуктов потенциальных открытых рамок считывания, представленных в геноме данного организма с уже известными белковыми последовательностями. Был предложен метод анализа протяженных последовательностей ДНК, применимый и к полным геномам, основанный на определении частот встречаемости октануклеотидных блоков и рассчитанный на выявление нетипичных для данного организма регионов, возможно являющихся следствием горизонтального переноса генов или каких-то других событий [Scherer et al., 1994]. Интересный подход для анализа полных бактериальных геномов и просто устроенных эукариотических был предложен другими авторами [Lashkari et al., 1997]. Его суть заключалась в амплификации всех потенциальных открытых рамок считывания и получения соответствующих фрагментов ДНК, пригодных затем для проведения с ними различных экспериментов. Причем авторы отмечают, что синтез такого большого количества олигонуклеотидных праймеров возможен с помощью созданного ими ранее высокопроизводительного мультиплексного ДНК-синтезатора [Lashkari et al., 1995], способного после некоторой проведенной модификации синтезировать за 8 ч 288 25-мерных праймеров (три 96-луночных микротитраторных планшета).


Для анализа эукариотических, более сложно устроенных, геномов, кроме некоторых из этих подходов, также используют и другие, связанные, в первую очередь, с существованием у этих организмов мРНК, несущих поли(А)-последовательность. Так, например, выявление кодирующих последовательностей возможно путем сравнения ДНК генома и 3'-участков мРНК в виде последовательностей, известных как EST и уже упоминавшихся выше при описании генома человека. Специфичность функционирования отдельных генов может выясняться с помощью процедуры, называемой Different Display. К более сложному анализу можно отнести недавно предложенную "интегрированную процедуру идентификации генов", которая объединяет многие из независимо существующих методов [Wang, Rowley, 1998]. Большие возможности в идентификации генов заключены в использовании приготовленных с помощью фотолитографии ДНК-чипов.




"ЭБНБ" >> "А" >> "АН" >> "АНА"

Статья про "Анализ полного генома" в Энциклопедии БНБ была прочитана 3756 раз
Бургер двойного помола
Шотландский Стовис

TOP 15