Но это все-таки исключение из правила. В целом уже первые исследования показали, что наши геномы построены, по крайней мере на первый взгляд, чрезвычайно неэкономично. Как говорят, у них низкая плотность кодирования генетической информации. Образно выражаясь, геном вируса — речь спешащего спартанца, геном человека — речь заикающегося зануды.
Доказать это очень просто. Сколько белков может синтезировать организм человека? Около 50 тыс. (конечно, в самом грубом приближении). Нуклеотидов в геноме человека 3,2 млрд. Зная молекулярную массу «среднего» белка, нетрудно прикинуть, из скольких аминокислотных остатков он состоит, сколькими кодонами кодируется. Помножив на 50 тыс., мы придем к выводу, что не меньше 95% ДНК в геноме лишние. Более того, теперь мы уже точно знаем, что большая часть ДНК в наших геномах никаких белков не кодирует, с нее не считывается в обычных условиях информационная РНК, а если и считывается, то не находит отражения в аминокислотных последовательностях. Что же делает эта ДНК, какова ее функция?
Самый неожиданный ответ на этот вопрос рискнули дать одновременно и независимо друг от друга У. Ф. Дулиттл со своей сотрудницей К. Сапиенса и классик молекулярной биологии Ф. Крик с Л. Орджелом в 1980 году.
Эпоха бранных слов. Какую же гипотезу они предложили? Теперь за ней устоялось название «гипотезы эгоистичной (selfish) ДНК». Суть ее заключается в том, что или вся ДНК, не перекодирующаяся в белок, или ее значительная часть не имеет смысла. Изменения в ней не затрагивают строение организма (фенетические признаки). Она размножается при каждом делении клеток, не принося организму пользы, но и не причиняя существенного вреда, существуя сама для себя. В геноме это нахлебник или паразит, умеющий довольствоваться малым.
Откуда же среди генов берутся такие эгоисты? Авторы этой концепции исходят из простых предпосылок. Уже давно известны способы, с помощью которых нуклеотидная последовательность, ранее существовавшая в единичном экземпляре, может размножиться, образовав десятки, сотни, тысячи и миллионы копий. Этот процесс назвали амплификацией (размножением).
Существует и обратный процесс — выпадение из генома последовательностей, в том числе и лишних, амплифицированных. Его назвали делецией. Нетрудно сообразить, что, если скорость амплификации последовательностей хоть немного превысит скорость делеции, геном быстро переполнится копиями генов, которые для существования организма попросту не нужны. Разумеется, это не может длиться бесконечно. Как только геном клетки переполнится паразитами, начнет действовать отбор. Медленно растущие носители паразитарных последовательностей будут им отсеиваться. Но сторонники эгоистичной ДНК полагают, что энергетические расходы клетки на содержание ненужной ДНК не столь значительны.
В этом я сомневаюсь. Энергии на синтез уходит, действительно, не так уж много. Но нужен и строительный материал для нуклеотидов. Для чего же мы удобряем растения азотом и фосфором? Уже давно известны не очень хорошо вписывающиеся в классическую генетику факты, что некоторые растения, например махорка, в условиях азотного и фосфорного голодания резко снижают количество ДНК на ядро.
Тут вполне уместна такая аналогия: хотя качество работы нашей полиграфической промышленности оставляет желать лучшего, мощность ее вполне достаточна, чтобы наделить каждую семью в Союзе не только последними детективами, но и полным собранием сочинений Достоевского. Только где бумагу взять? Впрочем, подобные соображения не смущали изобретателей «эгоистичной» ДНК. Статьи по теоретической генетике зарябили формулами, описывающими ее поведение в геноме. Эти дифференциальные уравнения были вполне правильными, да и не столь уж новыми. Схожими уравнениями популяционные генетики описывали изменения частоты генов в популяциях. Еще раньше были известны близкие уравнения Лотка-Вольтерра, описывающие колебания численности хищников и жертв.
Но если уравнения правильные, из этого отнюдь не вытекает верность исходных предпосылок. Ведь математика, подобно жернову, перемалывает все, что в нее засыплют. Но теоретики не дремали: появились расчеты, доказывающие, что «эгоистичные» последовательности, раз возникнув, могут закрепляться в геноме, «даже если их влияние на приспособленность особей в значительной степени отрицательно».
Термин «эгоистичная» ДНК в общем-то не нов, раньше была в ходу ДНК «избыточная» и «ненужная». Теперь ее называли «паразитической» и «мусорной» (junk). Чуть ли не комплиментом звучал термин «несведущая» ДНК (она же «невежественная»). Так называли последовательности, которые в принципе могли выполнять какую-либо деятельность независимо от состава.
Увлекшиеся теоретики не замечали, что грешат против логики. Они требуют доказательств функционального значения ДНК, не кодирующей белок, принимая ее бесполезность как нуль-гипотезу. А на деле обе концепции, пока не получено экспериментальных данных в пользу той или иной, вполне равноправны.
Мне это напомнило давний мой спор с одним коллегой — антидарвинистом, к сожалению, ныне покойным. Он отрицал полезность окраски белого медведя. С его точки зрения, чтобы доказать это, нужно достаточно представительную выборку, скажем 100 или 200 медведей выкрасить в красный или зеленый цвет, а затем выпустить в природу и проследить, снизилась ли у них вероятность выжить и оставить потомство. Он тоже принимал бесполезность, нейтральность структуры за нуль-гипотезу. Я в свою очередь постулировал «презумпцию приспособительности» — пока не будет доказано обратное. Так мы и не смогли убедить друг друга ни в чем.
Здесь ситуация та же, только речь идет о признаках не фенотипа, а генотипа.
В результате у многих молекулярных генетиков сложилось представление о геноме высших, ядерных организмов — эукариот, на мой взгляд, довольно дикое. В их представлении геном, например, человека — куча мусора, в которой ползают паразиты. Это так называемые «прыгающие гены» — мобильные, подвижные последовательности ДНК — потомки вирусов. В эту же массу, как жемчужные зерна в кучу навоза, вкраплены «настоящие» гены, т. е. кодирующие белки и РНК.
Как говаривал друг Винни-Пуха ослик Иа-Иа — «душераздирающее зрелище»! Геном бактерии построен куда рациональнее. Тогда что же такое прогресс?
Моя точка зрения на эту проблему проста: с получением новых экспериментальных данных термин «мусорная» будет применяться не к ДНК, а к той литературе, где он всерьез употребляется. Это я говорил еще в 1980 году, прочитав знаменитый номер «Nature», говорю и сейчас — с гораздо большим основанием. А тогда единственным моим доводом была аналогия с передачей лингвистической информации, и ссылаться приходилось только на самые общие положения теории Шеннона.
Дело в том, что в любом канале передачи информации существуют помехи. Канал без помех — такая же невозможная абстракция, как и двигатель со 100% КПД. Поэтому сигнал на пути от передатчика к приемнику искажается — порой настолько, что не может быть использован в практической деятельности. Информация, в общем, просто теряется, обращаясь в шум. Один из законов Шеннона это постулирует: в процессе передачи информация может только теряться, но не увеличиваться. Этот закон — точный аналог второго начала термодинамики, согласно которому энтропия замкнутой системы может только возрастать.
И в нашем случае возрастает энтропия передаваемого текста и энтропия на символ. Например, энтропия на символ в диктанте второгодника существенно выше соответствующей величины для орфографического словаря. Чтобы сохранить информацию в сигнале, необходимо построить его таким образом, чтобы он был помехоустойчивым.
И теория связи, придуманная людьми, и те закономерности, по которым формирует свои сигналы живая природа, предусматривают немало способов повышения помехоустойчивости информационных каналов. Все их нельзя рассмотреть в общедоступной книге. Но важно подчеркнуть одно — все они в той или иной мере сводятся к удлинению сигнала, увеличению времени его передачи — короче, к понижению плотности кодирования генетической информации. К чему это сводится на практике?