ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК

 том 70, № 5, с. 412-424 (2000)

 
© Л.Л. Киселев

ГЕНОМ ЧЕЛОВЕКА И БИОЛОГИЯ XXI ВЕКА

Л. Л. Киселев

Киселев Лев Львович - член-корреспондент РАН,
заведующий лабораторией Института молекулярной биологии им. В.А. Энгельгардта РАН,
председатель научного совета
Российской национальной программы "Геном человека"
Министерства науки и технологий РФ.

 

В 1988 г. один из первооткрывателей знаменитой двойной спирали ДНК, нобелевский лауреат Дж. Уотсон, публично высказал мысль о том, что наука вплотную приблизилась к раскрытию химической основы наследственности, причем не какого-либо низшего организма, а "царя природы" - человека. К тому времени было уже известно, что наследственный аппарат человека, геном, то есть совокупность всех генов и межгенных участков ДНК, составляет около 3 млрд. нуклеотидных пар. (Напомним, что нуклеотид - элементарное химическое звено, мономер, из которых построена полимерная цепь ДНК.) Эта величина казалась необозримо большой, и сама мысль, что такой объем информации может быть получен, представлялась совершенно фантастической. Критики считали, что решение данной задачи малореально в научном отношении, к тому же потребует разорительных затрат.

В том же самом 1988-м с аналогичной идеей выступил выдающийся российский молекулярный биолог и биохимик, академик А.А. Баев (1904-1994). После консультаций с коллегами он обратился к М.С. Горбачеву с письмом, в котором предложил организовать государственный научный проект по изучению генома человека. В России, как и за ее пределами, эта идея также была встречена весьма критически, однако время шло, и очень скоро научное сообщество во всем мире стало обсуждать ее всерьез. С 1989 г. и в США, и в СССР функционируют соответствующие научные программы; позднее возникла Международная организация по изучению генома человека (HUGO), вице-президентом которой несколько лет был академик А.Д. Мирзабеков.

В СССР по решению правительства было открыто финансирование и организован Научный совет по программе "Геном человека" под руководством А.А. Баева. Расположившийся в головном учреждении программы - Институте молекулярной биологии им. В.А. Энгельгардта РАН, совет весьма быстро создал инфраструктуру, объединил исследования многих разрозненных групп, преодолевая ведомственные барьеры и географическую удаленность.

Важно подчеркнуть, что с самого начала работ по геномному проекту мир договорился об открытости, доступности всей получаемой информации для его участников независимо от их вклада и государственной принадлежности. Сейчас существуют десятки мощных баз данных, в которых аккумулирована гигантская информация о структуре не только генома человека, но и геномов многих других организмов.

Вклад России в международное сотрудничество признан в мире: 70 отечественных исследователей являются членами HUGO (избрание осуществляется тайным голосованием на основании международных публикаций кандидатов). В международной научной прессе за десятилетие функционирования российской национальной программы опубликовано свыше 400 работ, в банках данных зарегистрировано более миллиона нуклеотидных пар фрагментов ДНК человека, многие сотни маркеров, что имеет большое значение для детального анализа генома человека. Российская геномная программа финансируется Министерством науки и технологий РФ и поддерживается Президиумом РАН.

ГЕНОМИКА - КЛЮЧЕВОЕ СЛОВО НОВОЙ БИОЛОГИИ

В российской национальной программе важное место занимают, помимо структурного и функционального анализа генома, два направления исследований: компьютерный анализ генома и медицинские приложения - медицинская геномика.

Создано программное обеспечение, позволяющее опознавать кодирующие и некодирующие участки генома по анализу нуклеотидной последовательности, а затем это компьютерное предсказание проверять экспериментально; организованы базы данных в Москве, Новосибирске, Пущине, где систематизируются непрерывно пополняющиеся сведения о геномике человека.

Благодаря тому что в мире идентифицировано множество генов, ответственных за многие болезни человека, в том числе онкологические, наследственные, нейродегенеративные, возникли и бурно прогрессируют два направления медицинской геномики - геномная диагностика, а также поиск и идентификация не только "больных" генов, ответственных за те или иные патологии, но и генов, определяющих предрасположенность ко многим тяжелым болезням человека. Медико-генетические центры Москвы, Санкт-Петербурга, Томска, Новосибирска активно используют и развивают методы геномной диагностики, включая дородовую (пренатальную).

В 1999 г. в нашей стране можно было диагностировать не менее 30 различных заболеваний, главным образом наследственных: болезнь Альцгеймера, болезнь Гоше, атаксию, муковисцидоз, мышечную дистрофию Дюшенна, дистонию, гемофилию А и В, миотоническую дистрофию, нейрофиброматоз 1-го типа, фенилкетонурию, серповидно-клеточную анемию, талассемию, синдром хрупкости Х-хромосомы, хорею Хантингтона, наследуемый рак молочных желез и яичников и др.

В 1999 г. в рамках российской программы работали около 400 исследователей в составе примерно 100 групп из 30 научных учреждений РАН и РАМН, госцентров и университетов. За достижения в геномике 16 российских ученых удостоены премии имени А.А. Баева, учрежденной Научным советом по программе "Геном человека" в честь организатора и первого руководителя геномной программы России.

Как далеко продвинулись структурные исследования генома человека в мире? Приведу только две цифры. Пять лет назад за год в мире расшифровывали несколько миллионов нуклеотидных пар ДНК, и это воспринималось как замечательное достижение. На исходе 1999 г. американская фирма "Celera", возглавляемая выдающимся исследователем и организатором Г. Вентером, расшифровывает (секвенирует) не менее 10 млн. нуклеотидных пар в сутки. На фирме секвенирование ДНК осуществляют около 250 приборов, снабженных роботами, которые функционируют в автоматическом режиме и передают всю информацию непосредственно в банки данных, где она систематизируется, аннотируется и становится доступной ученым всего мира.

Вентер официально объявил, что "Celera" планирует завершить расшифровку генома человека к концу 2001 г. В свою очередь Консорциум европейских и японских центров расшифровки структуры ДНК сообщил, что ту же цель планирует достичь к 2003 г. Очевидно, что это соревнование (независимо от того, кто придет к финишу первым) в ближайшие два-три года завершится достижением эпохальной цели - познанием всего наследственного материала человека на уровне его точного химического строения. Вероятно, в истории человечества трудно найти что-либо сопоставимое с этим событием по его общетеоретическим последствиям и практическому значению. Может быть, оно сравнимо с открытием электричества или путей использования атомной энергии, может быть, с выходом человека в космос, но в любом случае знаменует окончание одной эры и начало новой, как минимум, в биологии и медицине, а скорее, во всем естествознании.

Таблица 1. Сравнение размеров геномов и числа генов

Организмы Размер генома,
млн. п.н.
Число генов,
тыс.
Плотность,
тыс. п.н./ген
Бактерии
Дрожжи
Нематода
Человек
0.5-5
12
97
3000
0.47-4.29
6
19
80-100
1-1.7
2
5
>30

Исследования генома человека с самого начала потянули за собой, как паровоз, исследования геномов огромного числа других организмов, гораздо более простых (табл. 1). Их расшифровка ведется во все возрастающем темпе и объеме параллельно с изучением человеческого генома. Что же сделано конкретно к концу 1999 г.?

Известна полная геномная структура свыше 100 микроорганизмов (табл. 2), среди которых как обычные бактерии, в том числе вызывающие многие тяжелые заболевания человека и животных, так и архебактерии - особое царство живой природы, находящееся как бы между клеточными организмами (эукариоты) и истинными бактериями (прокариоты).

Таблица2. Геномы некоторых микроорганизмов, расшифрованные в 1995-1998 годах

Название Размер генома,
млн. п.н.
Число генов Свойства
Mycoplasma genitalius
Mycoplasma pneumoniae
Ricketsia provazekii
Treponema pallidum
Helicohacter pylori
Haemophilus influenzae
Mycobacterium tuherculosus
Escherichia coli
К 12
Metanococcus jannaschii
Pyrococcus horikoshii
0.580
0.816
0.112
1.138
1.668
1.830
4.412
4.639
1.660
1.739
468
677
834
1041
1590
1073
3924
4288
1738
2061
Возбудитель урогенитального воспаления
Возбудитель пневмонии
Возбудитель сыпного тифа
Возбудитель сифилиса
Вызывает язву желудка
Возбудитель менингитов, отитов и др.
Возбудитель туберкулеза
Энтеробактерия Автотроф
Анаэроб Термофил Метаноген
Анаэроб Гипертермофил

Мы знаем полное строение генома пекарских дрожжей - первого одноклеточного эукариотического организма (гриб, согласно биологической классификации) и полную структуру генома первого многоклеточного организма - круглого червя (нематоды), завершена расшифровка ДНК первого насекомого - плодовой мушки дрозофилы и первого растения - арабидопсиса. Круг объектов непрерывно расширяется, в частности весьма активно расшифровывается геном риса - одной из основных продовольственных культур. У человека уже известно строение ДНК двух самых маленьких хромосом - 21-й и 22-й. Все это вместе создало основы сравнительной геномики.

Приведем только один пример того, что дает этот подход, из практики работы нашей лаборатории (рис. 1). Сравнение у разных видов фрагментов белков, выполняющих одну и ту же функцию в белковом синтезе, позволило выявить общий структурный мотив, а последующее изменение структуры этого мотива путем так называемого направленного мутагенеза - его функциональную важность. Из суммы данных структурной и сравнительной геномики можно делать далеко идущие выводы о молекулярной эволюции организмов, что составляет предмет еще одного раздела геномики - эволюционной.

Парадоксальность ситуации, складывающейся сейчас в геномике, состоит в том, что объем информации, которым располагают исследователи, намного больше того, что можно осмыслить, проанализировать и использовать в экспериментальной работе. Поэтому развитие новых математических методов, вычислительной техники, программного обеспечения, совершенствование способов описания и хранения геномной информации становятся чрезвычайно актуальными. Этими проблемами активно занимается биоинформатика, включающая в себя и геноинформатику.

Биоинформатика анализирует ситуацию как бы на четырех тесно связанных друг с другом уровнях (табл. 3). Первый - это генетический текст, то есть нуклеотидная последовательность ДНК; второй - тоже текст, но сначала в форме РНК, а затем в форме аминокислотной последовательности белка; следующий, третий уровень -пространственная структура белка. Как известно, она целиком определяется первичной структурой, а экспериментально устанавливается с помощью рентгеноструктурного анализа кристаллов белков или с помощью ядерного магнитного резонанса в растворе для белков небольшого размера.

Таблица 3. Некоторые банки данных (БД) по биоинформатике

Наименование БД Краткое описание
GenBank БД по нуклеотидным последовательностям
SwissProt Аннотированный БД по аминокислотным последовательностям белков
PIR Аннотированный БД по аминокислотным последовательностям белков, организованным в соответствии с гомологией и таксономией
PDB БД по трехмерной структуре биологических макромолекул
OWL Невырожденная комплексная БД по структурам белков из SwissProt, PIR (1-3), GenBank и NRL-3D
NDB БД по нуклеиновым кислотам, включает структуры ДНК и РНК вместе с их трехмерными изображениями
PROSITE БД паттернов функционально значимых участков белков 
ProDom БД по доменам белков
ProteinMotionsDatabase БД по динамике белков, включающая многоуровневую классификацию движения петель, доменов и субъединиц
PROMISE БД по простетическим группам и ионам металла в активных центрах белков 
RELIBASE  Полная БД по лиганд-рецепторным комплексам
OMIM Каталог генов человека и генетически обусловленных заболеваний
LIGAND БД по ферментативным реакциям
dbCFC БД по кодирующим ДНК цитокинов
ReLiBase БД по анализу лиганд-рецепторных комплексов в PDB

Хотя методы предсказания трехмерной структуры белка (вторичной и третичной структуры) по его аминокислотной последовательности все еще крайне неточны, тем не менее благодаря тому, что в банках данных уже есть информация о трехмерной структуре сотен белков, можно на ее основе, используя сведения о нуклеотидной и аминокислотной последовательностях неизвестного белка, предсказывать во многих случаях и трехмерную структуру с достаточной точностью. Наконец, последний, четвертый уровень - это предсказание функции белка на основании знания его первичной структуры и предсказанной трехмерной структуры. Таким образом, структурная и сравнительная геномика через биоинформатику как бы переходят в новый раздел геномики, который обычно называют функциональной геномикой (рис. 2).

Главная задача функциональной геномики - выяснение биологических функций генных продуктов. Основную их массу составляют белки, на долю РНК приходятся всего лишь десятки генов, хотя, разумеется, многие виды РНК играют ключевую роль в клетке при передаче и реализации генетической информации. Функциональная геномика стремится сначала предсказать функцию тех или иных белков с помощью "сухой" биохимии, то есть компьютерного анализа, и только затем переходит к "мокрой" биохимии, то есть к экспериментальной проверке в пробирке предсказанной функции.

Совершенно очевидно, что близящееся завершение эры структурной геномики человека и многих других организмов означает перенос фокуса внимания исследователей на биоинформатику и функциональную геномику. Ни у кого нет сомнений, что первое десятилетие XXI в. будет эрой функциональной геномики и биоинформатики. Если в геномную эру (1989-1999) ключевым словом было "ДНК", то скоро ключевым словом, безусловно, станет "белок". Такова диалектика новой биологии.

СТАРТОВАЯ ПЛОЩАДКА БИОЛОГИИ XXI ВЕКА

В журнале "Science" от 11 декабря 1998 г. опубликована серия статей, где рассказано о завершении восьмилетней работы по расшифровке строения генома многоклеточного животного - круглого червя, носящего латинское название Caenorhabditis elegans. Хотя это очень маленький червь, скорее червячок, с него без всякого преувеличения начинается новая эра в биологии. Геном червя состоит из 97 млн. пар нуклеотидов ДНК, округленно 0.1 млрд. пар; геном человека, согласно большинству оценок, - из 3 млрд. нуклеотидных пар. Разница в размере геномов примерно в 30 раз. Однако именно эта работа окончательно убедила даже самых закоренелых скептиков, что расшифровка строения всего генома человека не только возможна, но и достижима в ближайшие годы.

Секвенирование генома С. elegans осуществлено в рамках совместного проекта исследовательскими группами из Центра геномного секвениро-вания Вашингтонского университета (США) и Сенгеровского центра (Великобритания). Число авторов этой работы столь велико, что журнал не опубликовал их списка, отослав читателей в Internet, а авторов назвал просто "Консорциум секвенаторов С. elegans". Это, вероятно, первый случай в истории науки, когда открытие с самого начала и с согласия авторов становится как бы анонимным. На современном этапе огромные финансовые вложения, роботизация, автоматизация, менеджмент, дисциплина, координация играют в науке определяющую роль, оттесняя на второй план роль интеллекта и творческой изобретательности отдельных участников проекта. Секвенирование генома С. elegans можно с полным правом считать знаковой работой, символизирующей "индустриальную" науку. Два исследовательских центра, которые решили гигантскую по сложности задачу, приобрели уникальный опыт как при получении самих результатов, так и при их осмыслении, хранении и переработке. Поэтому неудивительно, что обе группы заявили о своей готовности раскрыть структуру половины генома человека, то есть выполнить работу, в 15 раз большую по объему, чем то, что было сделано на геноме червя.

Значение этого достижения, конечно, далеко выходит за рамки того, что можно назвать полигоном для расшифровки генома человека. Напомним, что два года назад был расшифрован первый геном эукариотического организма - дрожжей, то есть за два года пройден путь от генома одноклеточного до генома многоклеточного организма. Биологи знают, что это гигантская дистанция на лестнице эволюции и, следовательно, на пути усложнения геномов. Поразительно, как невероятно быстро она была пройдена.

Знание геномов бактерий, дрожжей и нематоды дает биологам-эволюционистам уникальную возможность сравнения не отдельных генов и даже не генных ансамблей, а целиком геномов - о такой возможности в биологии еще 10 лет назад лишь мечтали. В ближайшие месяцы, когда эти гигантские объемы информации начнут осваивать и осмысливать, можно ждать появления принципиально новых концепций в биологической эволюции. В частности, многие "личные" гены нематоды в отличие от генов дрожжей скорее всего связаны с межклеточными взаимодействиями, возникающими у многоклеточного организма.

Будет справедливым напомнить, что первым обратил внимание на С. elegans как на объект исследования в середине 60-х годов С. Бреннер, внесший огромный вклад в изучение генетического кода. Тогда он работал в знаменитой лаборатории молекулярной биологии в Кембридже в Англии (в свое время здесь работали нобелевские лауреаты Ф. Крик, Дж. Кендрю, М. Перутц, А. Клуг). Закончив исследование генетического кода, Бреннер решил посвятить себя изучению нервной системы, путей ее возникновения и формирования. Он обратил внимание на малюсенького червя, состоящего из 959 клеток и имеющего всего около 300 нервных клеток - нейронов. Замечательное свойство нематоды - ее прозрачность, позволяющая следить за поведением и судьбой каждой отдельной клетки. Бреннер привлек в свою "нематодную" лабораторию талантливых молодых исследователей, многие из них стали "мотором" проекта секвенирования, который был реализован в Сенгеровском центре.

Секвенирование генома таких гигантских размеров потребовало огромной подготовительной работы, завершенной к 1989 г., когда была построена "физическая карта" всего генома нематоды. Физическая карта представляет собой небольшие участки ДНК известной структуры (маркеры), расположенные на определенных расстояниях друг от друга вдоль молекулы ДНК. Если у дрожжей до начала секвенирования функция около половины генов была неизвестной, то у червя эта доля была больше - из 19 тыс. генов 12 тыс. оставались загадочными.

В 1990 г. началось секвенирование, темп которого составлял в 1992 г. 1 млн. пар нуклеотидов в год. Если бы этот темп сохранился, на расшифровку всего генома понадобилось бы почти 100(!) лет. Ускорение было достигнуто простейшим способом: число исследователей в каждом центре возросло примерно до 100, приборы-секвенаторы и роботы функционировали круглосуточно, производительность каждой машины была увеличена.

ПЕРСПЕКТИВЫ ГЕНОМИКИ

У человека только в четыре-пять раз больше генов, чем у нематоды. Следовательно, часть его генома должна иметь "родственников" среди известных теперь генов дрожжей и червя, что в громадной степени облегчает поиск новых генов человека. Функции неизвестных генов нематоды изучать несравненно легче, чем аналогичные гены у человека. Дело в том, что гены червя можно легко изменить (мутировать) или убить, одновременно следя за изменениями свойств организма. Таким путем можно выявить биологическую роль генных продуктов у червя, а затем эти данные экстраполировать на другие организмы, в первую очередь на человека. Помимо мутаций можно угнетать активность генов с помощью специальных ингибиторов (например, особых молекул специфических РНК) и следить за изменением в поведении организма. Этот путь тоже ведет к раскрытию функций неизвестных генов.

Биологов всегда интригует вопрос о том, как регулируется работа генов. Хотя мы знаем об этом очень много, наши знания в основном получены на отдельных генах, а потому не возникает цельной картины регуляции активности всего генома. Сейчас бурно развивается техника биочипов, или микрочипов, одним из создателей которой был академик А.Д. Мирзабеков. На маленьких пластинках с помощью прецизионных приборов наносятся в тысячи точек микроколичества коротких фрагментов ДНК на строго фиксированных расстояниях друг от друга. Такой микрочип может, например, содержать все 19 тыс. генов нематоды. Его можно использовать для того, чтобы определить, какие гены работают в данной клетке червя, а какие молчат. Разумеется, можно выбрать клетки на любой стадии развития и из любой части тела червя. В результате получают информацию о функциональном состоянии всех генов любой клетки на любой стадии развития. Опыты уже начаты, и, без сомнения, скоро мы узнаем о первых результатах. Помимо совершенной микротехники технология микрочипов требует и совершенных компьютерных программ, чтобы фактические данные можно было осмыслить и интерпретировать.

Одной из сложнейших в биологии остается проблема взаимосвязи сигнальных регуляторных путей. Дело в том, что взаимодействие белковых продуктов многих генов происходит одновременно, причем комбинации белков меняются не только во времени, но и в клеточном пространстве. В результате изучение отдельных генов и их продуктов (что в основном делалось до сих пор) нередко становится неэффективным. Набор генов в сочетании с техникой микрочипов фактически открывает новую стратегию решения этой старой проблемы.

Каково соотношение кодирующих и некодирующих областей в геноме С. elegans?

Компьютерный анализ показывает, что примерно равные доли - 27 и 26% соответственно - занимают в геноме экзоны (участки гена, в которых записана информация о структуре белка или РНК, они сохраняются в матричной РНК) и интроны (участки гена, удаляемые в процессе образования зрелой РНК).

Оставшиеся 47% генома приходятся на повторы, межгенные участки и т.д., то есть на ДНК с неизвестными функциями. Если сравнить эти данные с дрожжевым геномом и геномом человека (см. табл. 1), то очевидно, что доля кодирующих участков в расчете на весь геном в ходе эволюции резко уменьшается - у дрожжей она очень высока, у человека очень мала. Это известно сравнительно давно, но сейчас эти соотношения приобрели количественную меру и структурную основу.

Мы приходим на первый взгляд к достаточно парадоксальному выводу: эволюция эукариот от низших форм к высшим сопряжена с "разбавлением" генома - на единицу длины ДНК приходится все меньше информации о структуре белков и РНК и все больше информации "ни о чем", то есть для нас непонятной, непрочитанной. Это одна из больших загадок биологической эволюции.

По поводу "лишней" ДНК существуют самые разные предположения, зачастую прямо противоположные по смыслу. Много лет назад Ф. Крик, один из двух первооткрывателей двойной спирали ДНК, назвал ее "эгоистической", или "мусорной". Он считал ее издержкой эволюции, платой за совершенство остальной части генома. Возможно, что небольшая доля ДНК человека и других высших организмов действительно относится к такому типу, однако теперь ясно, что основная доля "эгоистической" ДНК сохраняется в эволюции и даже увеличивается в размерах потому, что дает ее обладателям эволюционные преимущества. Классическим примером "эгоистической" ДНК служат так называемые короткие повторы: Alu-элементы, альфа-сателлитные ДНК и др. Как выяснилось в последние годы, их структура консервативна, то есть мутации, нарушающие "правила", установленные природой для этих элементов, отбрасываются в ходе естественного отбора или компенсируются другими мутациями. Структурное постоянство - мощный аргумент в пользу идеи о том, что это отнюдь не "мусорная", а очень важная ДНК для жизни вида. Другое дело, что мы еще не знаем, в чем конкретно состоит ее биологическая роль.

Геном человека высококонсервативен. Происходящие в нем мутации могут либо его повредить, и тогда они ведут к тому или иному дефекту, а иногда к заболеванию, либо пройти для организма не замеченными. Если они не затрагивают структуру белков или затрагивают таким образом, что их биологическая активность не меняется, мутации называют нейтральными. Они фактически не подвергаются отбору, поскольку не имеют фенотипического проявления, то есть не влияют на признаки организма. Однако нейтральные мутации могут распространяться в различных группах организмов, и если их доля превысит 1%, тогда это явление называют полиморфизмом (многообразием). В геноме человека огромное количество участков, различающихся одним или двумя нуклеотидами, абсолютно безразличных для функций, но передающихся из поколения в поколение. Вероятно, полиморфизмов у человека более 100 тыс.

Вариабельность генома (конечно, она присуща не только человеку, но и любому другому организму), с одной стороны, как бы мешает исследователю, поскольку ему приходится разбираться, имеет ли он дело с истинным полиморфизмом или просто с ошибкой секвенирования и как этот полиморфизм наследуется, а с другой стороны, создает уникальную возможность для молекулярной идентификации каждого отдельного организма, позволяет отличить его от любого другого, в том числе близкородственного. В теоретическом аспекте вариабельность генома - это молекулярная основа генетики популяций, раньше базировавшейся только на чисто генетических данных, Но еще важнее практический аспект - возможность идентификации личности, если говорить о геномике человека.

В нашей повседневности часто возникают ситуации, когда идентификация личности абсолютно точными методами, которые не могут быть оспорены, представляет собой жизненно важную задачу, особенно в судебной медицине, криминалистике, наследовании собственности и т.д. Совершенство методов геномной дактилоскопии таково, что достаточно одной капли крови или слюны, одного волоса, чтобы с абсолютной надежностью установить родственные отношения между людьми. В Москве существует центр геномной дактилоскопии, где по поручению правоохранительных или судебных инстанций на высоком профессиональном уровне осуществляется соответствующая экспертиза, данные которой принимаются затем как доказательство вины или невиновности подсудимого в ходе судебного процесса.

В геномной дактилоскопии используют как ядерную, так и митохондриальную ДНК (последняя передается по материнской линии и содержится в органеллах клетки - митохондриях, снабжающих все клетки энергией). Пожалуй, наиболее известным примером, показавшим могущество новой техники идентификации личности, было доказательство принадлежности костных останков, обнаруженных под Екатеринбургом, членам царской семьи (подробнее см. ПЛ. Иванов. Идентификация останков царской семьи: вклад молекулярной генетики (Вестник РАН. 1996. № 4). - Прим. ред.). Следует напомнить, что ДНК - химически весьма стойкое соединение. В относительно благоприятных условиях оно может сохраняться не только десятки и сотни, но даже многие тысячи лет. В рамках российской геномной программы сейчас исследуют ДНК из останков, обнаруженных в захоронениях на севере России, которым как минимум 2000 лет. Удалось охарактеризовать ДНК, выделенную из останков мамонта, которые пробыли в слое вечной мерзлоты не менее десятка тысяч лет.

Вариабельность генома породила еще одно направление геномики, которое обычно называют этногеномикой. Речь идет о том, что этнические группы, населяющие Землю, помимо индивидуальной вариабельности имеют еще и некоторые групповые признаки, характерные для данного этноса. По этим признакам, например, можно надежно отличить европейские расы от монголоидной. Это направление исследований вызывает особенно большой интерес у этнографов, историков, археологов, лингвистов, поскольку получаемая информация в ряде случаев может подтвердить или опровергнуть те или иные гипотезы, циркулирующие в рамках этих дисциплин. На наших глазах возводится мост между сугубо естественно-научной областью - геномикой и гуманитарными дисциплинами. Можно предвидеть, что многие особенности человека как существа социального в той или иной степени имеют биологические (геномные) предпосылки. Сейчас преждевременно обсуждать конкретные аспекты этой проблемы, но в том, что геномика со временем внесет существенный вклад в понимание социальной природы человека, вряд ли следует сомневаться.

Кстати, недавно получен совершенно удивительный результат, касающийся происхождения человека. Мы давно привыкли к тому, что человек - близкий родственник обезьян, однако это заключение базировалось на уровне фенотипических признаков, в основном анатомических. Сравнение геномов шимпанзе, нашего ближайшего родственника, и человека показало, что они почти идентичны, конечно, в тех участках, которые сравнивались (сравнить оба генома целиком пока невозможно). По предварительным данным, человек отличается от шимпанзе лишь в три раза больше, чем различаются между собой люди из разных этнических групп. И хотя мы в своей гордыне полагаем, что ушли от шимпанзе очень далеко, геномика говорит об обратном. Разумного объяснения этому парадоксу еще не дано, но, возможно, ответ окажется совершенно неожиданным.

Дело в том, что в геноме человека и других организмов помимо собственного наследственного материала присутствуют и чужеродные геномы, например вирусов. В частности, в геноме человека обнаружены в большом количестве молекулярные "останки" вирусов (провирусы), которые когда-то давно попали в него и там остались.

Мы очень мало знаем об их биологической роли, но удивительно и крайне интересно то, что у обезьян эндогенных вирусов намного меньше или нет вообще. Получается, что по чужеродным элементам генома человек от обезьян отличается гораздо сильнее, чем по самим геномам. Это дало основание одному из известных исследователей генома, академику Е.Д. Свердлову, высказать мысль о том, что вирусы могли сыграть важную роль в "очеловечивании" обезьяны. Как видим, даже древняя и постоянно привлекающая внимание проблема происхождения человечества приобретает совершенно новое звучание благодаря открытиям геномики. Уместно здесь упомянуть о том, что, согласно данным молекулярной антропологии и антропогенетики, первые Homo sapiens (причем и Адам, и Ева) возникли в Африке, а уже затем распространились на другие континенты.

ПРОТЕОМИКА: ЧТО ЭТО ТАКОЕ?

Вернемся теперь к тому, что составит предмет исследований в биологии в ближайшие годы. Функциональная геномика тесно соприкасается и фактически перекрывается с суперновым направлением биологии, получившим название "протеомика" - наука о протеомах. Слово "протеом" образовано от слова "протеин" (белок) и окончания слова "геном", так что в самом названии как бы слиты воедино белок и геном (ДНК). Это подчеркивает их теснейшую взаимосвязь. Однако между геномикой и протеомикой, между геномом и протеомом есть одно фундаментальное различие, которое вызывает к жизни совершенно новые методы исследования, новые стратегии.

Протеом - понятие динамическое, тогда как геном стабилен и постоянен, иначе было бы невозможно передать наследственные свойства от поколения к поколению, обеспечить сохранение видов и т.д. Изменчивость генома всегда происходит на фоне его высокой стабильности и ни в коей мере ее не отменяет. Протеом - набор белков данной клетки в данной фазе ее развития в данный момент времени - меньше генома по общему объему информации. В любой клетке человеческого организма никогда не функционируют все 80 тыс. генов, работает лишь их часть - иногда меньшая, иногда большая. Хотя точные цифры привести пока трудно, но в обычной специализированной клетке, например клетке печени или легкого, одновременно присутствуют, вероятно, не более 10 тыс. белков, причем в резко различных количествах - от нескольких молекул на клетку до нескольких процентов общего клеточного белка.

Набор белков постоянно меняется в зависимости от фазы клеточного деления, тканевой специализации клетки, стадии ее дифференцировки, принадлежности к нормальным или злокачественным клеткам, состояния стресса или покоя, воздействия внеклеточных физиологически активных веществ и так до бесконечности. Поэтому белковый "портрет" клетки зависит от множества факторов и воздействий, подвержен практически непрерывным изменениям, что делает его изучение особенно трудным.

Существует букет протеомных технологий, каждая имеет свои достоинства и недостатки (рис. 3). Упомянем о двух, сегодня, пожалуй, наиболее эффективных. Сложную смесь белков, экстрагированных из клетки, можно подвергнуть разделению на носителе (обычно это полиакриламидный гель) в двух направлениях: в одном белки будут делиться по размерам (молекулярной массе), в другом - по электрическому заряду (изоэлектрической точке). В результате получается двумерная карта, содержащая многие сотни точек, каждая из которых соответствует одному или нескольким белкам. Если исследователя интересует какая-то группа белков, можно ее выделить на карте и подвергнуть повторному разделению в несколько измененных условиях с более высоким разрешением. Сейчас в банках данных хранится информация о множестве разных типов клеток, белки которых были подвергнуты электрофоретическому разделению в двух направлениях. Компьютер умеет сравнивать такие двумерные белковые карты и вычленять то, что у этих типов клеток одинаково, а по каким белкам они различаются.

Метод двумерных карт непрерывно совершенствуется, и большинство индивидуальных белковых точек, которые видны на этих картах, уже идентифицированы или находятся в процессе идентификации. Наиболее современный метод идентификации белков состоит в том, что исследуемый белок подвергают расщеплению на фрагменты (пептиды) с помощью того или иного фермента (протеазы). Затем полученные пептиды разделяют, обычно с помощью хроматографии под высоким давлением, а потом каждый из индивидуальных пептидов помещают в масс-спектрометр и узнают его массу. Сравнение полученных результатов с имеющимися в базах данных по белкам позволяет надежно опознать белок, если его структура известна. Для неизвестного белка этот метод помогает найти "родственников", а следовательно, сформулировать предварительное представление о его возможной функции.

Изменчивость протеома связана не только с тем, что в данный момент времени работает одна часть генов, а в другой момент - иная. Набор белков сильно зависит от процессов, протекающих на пути от ДНК к матричной РНК (мРНК). Здесь большая часть первичных генных продуктов (РНК) подвергается так называемому альтернативному сплайсингу, суть которого состоит в том, что до образования зрелой матричной РНК из нее удаляются разные части молекулы. В результате один ген может породить множество белков, различающихся первичной структурой. Таким образом, стало очевидно, что одна из старых догм биохимии и молекулярной биологии - "Один ген -один фермент" - нуждается в модернизации. Для очень многих случаев справедлива формула: "Один ген - много белков".

Однако и это еще не все. После синтеза белки претерпевают множество химических изменений (модификаций), которые создают их огромное разнообразие, хотя исходно они кодированы одним геном. К числу таких модификаций относятся реакции фосфорилирования, ацетилирования, метилирования, гликозилирования и многие другие. Если учесть, что на большом белке есть множество мест, где эти модификации могут происходить, то легко себе представить, какое практически бесконечное разнообразие форм одной и той же белковой молекулы может возникнуть. Подавляющее большинство модификаций существенно сказывается на биологической активности данной молекулы белка, а также на ее способности взаимодействовать с другими белковыми молекулами. В итоге мы приходим к заключению, что когда в клетке работает, скажем 10% всех генов, допустим 8 тыс., то количество разных белков может превысить эту величину в 10 раз. Исследователи и раньше догадывались, что такая ситуация возможна, однако только теперь реально представляют ее истинные масштабы.

Крайне важным разделом протеомики, безусловно, следует считать изучение белок-белковых и белок-нуклеиновых взаимодействий. В течение жизни клетки практически каждый белок при своем функционировании взаимодействует с множеством макромолекул, а также низкомолекулярных лигандов. Один из примеров важных для клетки белок-белковых контактов показан на рис. 4.

Для изучения белок-белковых взаимодействии in vivo в последние годы получил широчайшее распространение метод так называемых дрожжевых двойных гибридов (рис. 5). С помощью генной инженерии создается конструкция, которая состоит из участка ДНК, взаимодействующего с фактором транскрипции, и участка ДНК, кодирующего ген-репортер, который в свою очередь кодирует белок-фермент, активность которого легко измерить. Фактор транскрипции состоит из двух доменов и работает только в том случае, когда домены взаимодействуют друг с другом. Если вы хотите узнать, взаимодействуют ли два исследуемых белка друг с другом, вы разрезаете фактор транскрипции и к каждому из доменов присоединяете по интересующему вас белку. При их взаимодействии фактор транскрипции восстановит свою активность, что позволит работать гену-репортеру, и тогда вы обнаружите активность репортерного белка. Если исследуемые белки не взаимодействуют, белок-фермент не образуется.

Применение двугибридной системы к белкам человека и других организмов позволило доказать, что существует огромное число белок-белковых контактов самого разного типа, и, кроме того, обнаружить множество ранее неизвестных белок-белковых взаимодействий. Эта информация исключительно важна для идентификации компонентов сигнальных путей в клетке, один из которых приведен на рис. 6. Как правило, в передаче сигналов от поверхности клетки к ядру участвуют белки-посредники, часто находящиеся в клетке в ничтожных концентрациях, поэтому анализ сигнальных путей для экспериментаторов сильно затруднен. Выявление белок-белковых взаимодействий резко изменило ситуацию.

При анализе белок-нуклеиновых взаимодействий широко используют методы химической сшивки этих компонентов (например, сотрудниками академика А.А. Богданова выявлены многие важные взаимодействия внутри рибосомных частиц, где осуществляется биосинтез белков в клетке). Другой удобный метод - изменение электрофоретической подвижности при комплексообразовании (задержка в геле), с помощью которого проанализировано множество ДНК-белковых и РНК-белковых контактов. Оригинальный вариант этого метода в сочетании с химической сшивкой разработан академиком А.Д. Мирзабековым и применен для раскрытия структуры нуклеосомы - элементарной структурной единицы, состоящей из ДНК и белков-гистонов, из которых построены все хромосомы.

ИДЕИ И МЕТОДЫ ГЕНОМИКИ НУЖНЫ ВСЕЙ БИОЛОГИИ

Почти каждый день пресса США и западноевропейских стран сообщает о новых генах человека и их функциях или связи с теми или иными заболеваниями. В 1998 г. правительство США затратило на проект по изучению генома человека 300 млн. долларов, а частные компании, прежде всего биотехнологические, - даже больше. По крайней мере 20 развитых стран мира имеют свои национальные программы по изучению генома человека.

Истекшие 10 лет показали, что новый уровень понимания биологических проблем, сложившийся к настоящему времени благодаря геномным исследованиям, с лихвой оправдал все организационные усилия и финансовые вложения. Более того, стало ясно, что добытая информация не могла быть получена путем поддержки сотен отдельных исследовательских групп, даже высококвалифицированных и хорошо оснащенных.

Один из сильных аргументов против геномной программы, когда она только создавалась, состоял в следующем: "индустриализация" биологии приведет к утрате ее творческого потенциала, исчезновению "малой" биологии - небольших исследовательских групп, возглавляемых талантливыми, оригинально мыслящими исследователями, которые не захотят работать на "фабрике секвенирования ДНК". Среди ученых, придерживавшихся таких взглядов, был, например, Б. Олбертс, нынешний президент Национальной академии наук США. Безусловно, справедливо, что основным звеном геномной программы было секвенирование, которое в столь гигантском масштабе достижимо только индустриальными методами, однако само решение этой задачи потребовало развития новой приборной базы, новых методов, новых инструментов исследования, что, в свою очередь, потребовало именно творческих усилии отдельных ученых, а не массовых действий. Вот это творческое начало как необходимый компонент индустриализации был недооценен скептиками.

Между тем разработанные в геномике человека идеи и методы имеют универсальное значение и применимы для решения огромного круга биологических задач, далеко отстоящих от проблемы генома человека. Напомним о некоторых из них.

Пожалуй, от развития геномики человека в настоящее время выиграла больше всего микробиология, поскольку уже расшифрованы полные геномы возбудителей многих опасных болезней -туберкулеза, сыпного тифа, язвы желудка и др. Можно с уверенностью утверждать, что без геномного проекта эти данные были бы получены гораздо позже и, вероятно, в гораздо меньшем объеме. Знание геномной структуры патогенных бактерий очень важно для создания рационально сконструированных вакцин, для диагностики и других медицинских целей. Столь же велико влияние геномики на медицинскую генетику, которая занимается генодиагностикой наследственных болезней, а также генетическими основами предрасположенности ко многим распространенным болезням.

В успехе мировой геномной программы огромную роль сыграло развитие информатики. Доступность через Internet информации, полученной в разных странах мира, и быстрота ее поступления в мировые банки данных имели неоценимое значение, причем не только сугубо научное, но и социальное, так как стало ясно, что достижения геномики служат не только национальным интересам, а превратились в общечеловеческий символ прогресса науки.

В первоначальной геномной программе основная ставка делалась на государственное централизованное финансирование, однако с 1994 г. в США финансовые вложения частных фирм превзошли вложения государства. Бизнес очень быстро понял, какие огромные практические следствия проистекают из геномики, и предпринял гигантские усилия по внедрению в эту область, предвидя в дальнейшем большую прибыль от использования достижений геномики для целей диагностики, прогностики и лечения болезней человека.

Социальные последствия возникновения новой биологии явственно проявятся в ближайшем десятилетии. Прежде всего, будут созданы лекарства, гораздо более избирательные и эффективные, чем ныне существующие. Это связано с множеством новых мишеней, которые стали известны благодаря открытию огромного числа новых генов и их белковых продуктов. Кроме того, сравнительная геномика и биоинформатика предложили фармакологам новое обширное поле деятельности.

Наступающий фармакологический взрыв означает для цивилизованных стран значительное удлинение средней продолжительности жизни, здоровую старость. Никогда раньше в истории человечества биология не влияла так сильно на здравоохранение и медицину, как в наступающую эру биомедицины - неразделимого гибрида новой биологии и новой медицины.

Второй, не менее важный путь влияния биологии на жизнь людей идет через обновление продовольственной базы человечества. Трансгенные растения и животные, рациональные основы генетики и селекции сельскохозяйственных растений и животных, основанные на геномике, позволят не только увеличить урожайность и продуктивность сортов и пород, но и в огромной степени уменьшить потери от сорняков, вредителей и болезней. Ассортимент биотехнологической промышленности не будет ограничен только лекарствами и пищевыми добавками, появится много новых продуктов, о существовании которых мы сегодня не догадываемся.

К сожалению, в России по давно сложившейся традиции биология в ряду естественно-научных дисциплин недооценивается. Финансирование биологии не только ничтожно, оно еще и не доходит до активно работающих ученых, застревая в промежуточных инстанциях, которые по абсолютно необъяснимой причине решают за ученых, как и куда им тратить деньги (даже те крохи, которые попадают с бюджетного стола). Таможня по-прежнему успешно борется с российской наукой, препятствуя ввозу оборудования и реактивов или требуя плату и бесконечные бумаги.

В нашей стране век биологии еще не наступил. общество не готово к его приходу. Воцарившееся в обществе откровенное пренебрежение наукой, культ невежества, пропаганда средневековых взглядов, отсутствие информации о реальных достижениях реальной науки - вот та обстановка, в которой существует современная российская наука. Отток талантливой молодежи в биологии принял угрожающие масштабы, и нет никакой надежды, что его удастся остановить в ближайшие годы.

И все-таки вопреки крайне неблагоприятным окружающим обстоятельствам российская геномика существует, и я твердо верю, будет существовать. Российская биология перестрадала и пережила Лысенко, перетерпит и нынешние времена близорукости и невежества.



VIVOS VOCO
Май 2000