Сегодня мы обсудим, пожалуй, самую холиварную тему в биологии: есть ли у нас мусор в ДНК? Зачем этот мусор нужен, если он там есть? И как вообще это природа допустила? Мне кажется, истоки холиварности этой темы в том, что люди привыкли думать, что мы венец творения, венец эволюции, что мы самые умные, самые прекрасные и самые красивые. Наш мир он такой гомоцентричный. Но теория эволюции делает нам постоянные подножки: то выясняется, что генов у нас примерно как у мухи, то выясняется, что мы лишь одна из многочисленных веток на эволюционном дереве и ничем принципиально не отличаемся от других видов, которые к тому же еще и наши родственники, что некоторых людей особенно задевает и обижает. "Да какие мы там родственники обезьян?" - скажет какой-нибудь креационист. Все это, может быть, очень обидно, но, тем не менее, мы действительно достаточно сложно устроеный организм. Геном человека - это текст объемом примерно в 3 миллиарда букв, что в тысячу раз больше, чем четырехтомник "Войны и мира". Именно поэтому были очень большие надежды на проект "Геном человека", который мог бы показать, ага, вот в чем секрет нашей сложности, нашей разумности, нашей креативности: у нас очень сложно устроенный геном, очень отлаженный, и это делает нас homo sapiens. Но можно ли судить о крутости организма по объему его генома? Вот вам интересный пример. Две рыбы. Одна называется протоптер, другая называется рыба фугу. У рыбы фугу размер генома в восемь раз меньше, чем у нас. Замечательно. А у рыбы протоптер геном в 44 раза больше, чем у нас. Если же сравнивать эти две рыбы между собой, то у фугу геном получается в 330 раз меньше, чем у рыбы протоптер. Получается такой парадокс: вроде бы и то, и то - рыба, вроде бы морфологически они похожи и примерно одинаково сложно устроены, но если так смотреть непредвзято. Но при этом на молекулярном уровне разница в объеме генома совершенно невероятная. И опять же возникает такой еще один плевок в нашу сторону, в сторону нашей эгоцентричности: как так получается, что у какой-то жалкой рыбы геном в 40 раз больше, чем у нас? Это же как-то даже обидно звучит. "Мне просто очень обидно было". Особенно обидно это слышать всяким креационистам, потому что, по их мнению, наш геном проектировал разумный дизайнер, который вкладывал туда душу и вообще пытался сделать это очень хорошо, идеально, если угодно. Ну, как мы знаем, не идеально, потому что бывают всякие генетические заболевания, которые приводят к детской смертности. Но, тем не менее, геном должен быть очень хорошо спроектирован, и все должно быть на своем месте. Но получается, что либо у нас есть какие-то проблемы, либо есть какие-то проблемы с любовью бога к рыбам. И не только к рыбам, потому что есть и растения, у которых геном намного больше, чем у человека. Но и с нашим трехмиллиардным геномом возникает очень много споров и нюансов. Потому что вообще-то некоторые ученые позволяют себе очень нелестные высказывания о его содержимом. Позвольте я процитирую биолога Дэвида Пенни: "Я был бы весьма горд служить в комитете, который разработал геном кишечной палочки. Однако я бы никогда не признался, что служил в комитете, который спроектировал геном человека. Даже университетский комитет не смог бы выполнить что-то так плохо". Тут он намекает на английское выражение "design by committee". Почему геном кишечной палочки вызывает восхищение у биологов? Потому что он действительно выглядит хорошо спроектированным: каждый ген на своем месте, никакого лишнего объема ДНК, все, что есть, все, казалось бы, очень нужно. И поэтому вот такой замечательный компактный геном объемом примерно, в случае кишечной палочки, в 5 миллионов нуклеотидов. 5 миллионов нуклеотидов - вполне достаточно, чтобы получить хорошо работающую, функциональную клетку, которая очень активно делится и может колонизировать существенную часть, скажем так, потенциальных сред обитаний. Хотя существуют работы, где ученые удаляли те или иные гены у бактерий и даже сокращали их геномы еще больше, чем те самые 5 миллионов нуклеотидов. Тем не менее, достаточно сложно найти вещи в геноме бактерии кишечной палочки, которые прямо совсем не нужны, которые не имеют никакой функции, не несут никакой пользы. Допустим, может быть, какой-нибудь ген, кодирующих устойчивость к антибиотику, если вы от него избавитесь, то в отсутствии антибиотика ничего плохого с бактерией не случится, такие примеры можно привести. Но даже в этом случае мы понимаем, что ген устойчивости к антибиотикам, тем не менее, важен, тем не менее полезен в тех реальных условиях, в которых бактерия живет, а не в каких-то лабораторных условиях, где ей подобрали благоприятные условия. Этому есть вполне понятное эволюционное объяснение. Дело в том, что бактерии тратят существенную часть своей энергии на воспроизводство своего генома. Если у бактерии слишком большой, не компактный геном, то тогда она будет просто медленней размножаться, медленнее делиться, тратить на это больше ресурсов и поэтому будет не так успешна в передаче своих генов в следующие поколения. Если же взять многоклеточных организмов, например, человека, то выяснится, что у нас, в общем-то, делятся не все клетки, у нас есть специализированные стволовые клетки, которые делятся, которые восполняют те клетки, которые у нас погибают в процессе нашей жизнедеятельности. И да, им нужно удваивать свой генетический материал перед тем, как они поделятся. Но большая часть наших энергетических затрат уходит не на это, и поэтому можно в принципе позволить себе более крупный геном. И в том числе можно себе позволить более несовершенный геном, геном, в котором может быть что-то, что не очень то уж и нужно. С этим можно жить, с этим можно размножаться, и это не несет таких последствий, как это бы несло для быстро делящихся бактерий. В общем, существование огромных геномов, а также огромной разницы в размерах геномов наборов молекул ДНК у разных организмов, которые при этом друг на друга похожи, вроде примера с рыбой протоптером и рыбой фугу, приводят ученых к гипотезе о том, что, в общем-то, можно себе представить, что в геноме не все так идеально, что там могут быть какие-то участки ДНК, которые особой функции не играют, ни на что не влияют. И геном у некоторых организмов просто раздут без какой-то необходимости, ну, раз то же самое можно сделать более простым набором генетических последовательностей. Но эта тема вызывает, как я уже сказал, огромные споры и дискуссии. Причем тут возникает очень интересный момент, что, с одной стороны, эта идея мусора в ДНК очень не нравится креационистам, потому что для них ДНК - это такой храм божий, что все создано по разумному замыслу, и каждая буковка должна быть на своем месте. Но, с другой стороны, эта идея не нравится некоторым радикальным эволюционистам, которые скажут, что эволюция мудра, она должна была все сделать правильно. От вредных, ненужных мутаций должно было все избавиться, остаться должно было только хорошее, полезное и функциональное. Получается даже немножко, как с теорией подковы, когда два радикальных фланга, по какому-то вопросу они начинают сходиться между собой. Тема сегодняшнего выпуска - мусор в ДНК. Изучением мусора в ДНК, помимо прочего, занимается наука биоинформатика, математическая биология. Это моя специальность. Как можно догадаться из названия, не только биология и биологи кроются в этой области. Биоинформатики образуются в результате скрещивания биологов и программистов, так что навыки программирования оказываются важны не только для того, чтобы создавать сайты и приложения для широкого круга пользователей: чрезвычайно полезны такие скиллы и в науке. Один из языков программирования, которые сейчас наиболее активно используются научным сообществом, это Python. Если вы хотите быть ученым или вы уже занимаетесь наукой, такой навык явно будет не лишним и поможет повысить ваш шанс на работу в хороших университетах и институтах. Я чуть-чуть программировать на Python умею, не сказать, что крутой программист, но, тем не менее, это входит в набор навыков, которые я применяю достаточно регулярно. Но, может, вы не хотите заниматься наукой? Может, вы новичок в IT и программировании или студент, который хочет расширить свои карьерные перспективы? В любом случае, если вы решите освоить Python, сделать это можно в онлайн-школе Skillfactory на курсе "Профессия Python-разработчик". Курс длится 9 месяцев и идеально подходит для новичков. Обучение начинается с азов, а на выходе вы крепкий специалист с опытом проектной работы над реальными задачами и необходимыми навыками для дальнейшего развития из бонусного блока. Например, асинхронное программирование. Авторы курса - профессионалы, практикующие разработчики крупных IT-компаний, а искать работу вы сможете уже с 3 месяца обучения, ведь к этому моменту изучите необходимую базу. А по итогам программы вы соберете портфолио из 6 проектов. Кстати, средняя зарплата разработчика 180 тыс. рублей. И важное: на всем пути обучения и даже после с вами будет работать центр карьеры, на каждом этапе: от создания резюме до подготовки к собеседованию. Поэтому у вас будет плавное и безболезненное вхождение в индустрию IT, ведь Skillfactory учат тех, кого берут на работу. И спасибо Skillfactory за поддержку выхода научно-популярного контента. Сначала нам потребуется небольшой ликбез: что вообще такое геном, что такое ДНК? В наших клетках, в существенной части наших клеток, присутствует молекула ДНК, которая нам изначально вообще досталась от родителей. У нас есть эта ДНК, которая упакована в 23 пары хромосом. Половину мы получили от мамы, половину - от папы, от мамы и от папы мы получили, собственно, по 3 миллиарда букв, которые вместе собираются. Если взять всю молекулу ДНК из одной клетки и вытянуть ее в одну ниточку, получится молекула длиной примерно в два метра. Но она очень компактно упакована в эти самые хромосомы, и она должна удваиваться перед тем, как клетка поделится. Можно сказать, что геном - это такой огромный текст, но в этом тексте есть некоторые осмысленные предложения, мы их называем генами. Это такая последовательность вот этих самых нуклеотидов, буковками мы их обозначаем А, Т, Г и Ц. И гены несут вполне определенные функции. Одна из наиболее известных функций генов - это кодировать белки. Белки выполняют самые разные функции в нашем организме, и какие-то из них выполняют структурные функции, какие-то являются ферментами, ускоряют какие-то химические реакции. Ну, например, алкогольдегидрогеназа, понятно, для чего нужна, чтобы метаболизировать этиловый спирт, очень важный белок. "Нормально все?" "А?" "Нормально, говорю, все?" "Нормально". Ну, вот таких вот белков у нас более 20 тыс., скажем так. Тут зависит от того, как именно мы будем определять разные изоформы тех или иных белков. Но будем считать, что порядка 20 тыс. разных белков. Правда, антитела - это тоже белки, и их у нас больше миллиона разных штук, но это отдельная история, там свои хитрые генетические махинации замешаны. Но в целом 20 тыс. разных белков, окей. Гены же выступают такой вот инструкцией для синтеза белков. Наиболее популярная метафора звучит примерно так, что у нас есть такая кулинарная книга, это наш геном, в ней много рецептов. Отдельные рецепты копируются на бумажке с помощью принтера, это будут молекулы РНК. Эти молекулы РНК попадают в цитоплазму, где эти рецепты отдельные берутся поварами. Эти повара - это рибосомы, такие фабрики для синтеза белков, и рибосомы дальше по инструкциям вот в этих молекул РНК создают, собственно, большое разнообразие белков. В каждой инструкции будет какой-то один белок синтезироваться. Здесь хочется сделать такую словесную оговорку. Очень часто в фантастике, всяких фильмах, книгах можно услышать такую фразу: генетический код мутировал. Может быть, генетический код человека мутировал или еще какой-нибудь организм мутировал. Мутировать может ваш геном, может мутировать ваша ДНК, какой-то нуклеотид, буковка может поменяться на другой нуклеотид, на другую букву Г на Ц, А на Т, и это может произойти в каком-то важном участке ДНК, например, в каком-нибудь гене, из-за этого может измениться какой-то один конкретный белок, он может стать другим, может измениться его функция, может ничего не измениться. Мутации в ДНК существуют, они могут быть нейтральными, они могут быть полезными, они могут быть вредными, они могут быть полезными в зависимости от какого-то контекста. И это можно сравнить с заменой какой- то одной буквы в каком-нибудь тексте. Например, была фраза: "Маша ехала на мотоцикле", поменяли одну букву в начале, М на С, и получилось: "Саша ехала на мотоцикле". Хорошо ли это изменение? Ну, может быть, вообще теперь это предложение лучше отражает реальность, может быть, действительно изначально была ошибка: ехала на мотоцикле девушка по имени Саша, но ее почему-то назвали Машей. И вот мутация теперь исправила эту ошибку. То есть, в принципе, одиночная мутация может привести как к какому-то положительному, так и к какому-то нежелательным исходу. Но теперь представим себе, что у нас изменилась не одна буква, а сам принцип, скажем так, озвучивания букв, при том, что язык остался на месте, но вот азбука у вас поменялась. Например, теперь внезапно всякая буква М читается как буква К. Что у вас произошло? У вас была "Маша ехала на мотоцикле", а теперь "Каша ехала на котоцикле". И более того, это сейчас у нас проблема возникла в одном предложении, но если у вас текст большой, таких проблем возникнет много. Практически в каждом предложении теперь появится какая-то несуразица, появятся, в том числе какие-то слова, которые вообще не существуют в словаре, которые не существует в лексиконе, и получится какая-то полная каша, полная бессмыслица. Вот это можно сравнить с изменением генетического кода, с изменением принципа, по которому кодируются белки. Собственно, генетический код - это принцип, набор правил, по которому нуклеотиды, из которых состоит ДНК, а также РНК, трансформируются в последовательности аминокислот, из которых состоят белки. И вот генетический код - это, пожалуй, одна из самых древних информационных систем, которая существует на нашей планете. Он сохранялся неизменным на протяжении более миллиарда лет с появления одноклеточных форм жизни, которые были общим предком всех ныне существующих форм жизни. Да, есть примеры исключений. Есть организмы, у которых генетический код чуть-чуть изменился. Там есть некоторые инфузории, есть, например, в наших клетках органеллы, которые называются митохондрии, которые являются потомками других одноклеточных форм жизни, существовавших давно, у них тоже немножко другой генетический код. Кстати, у митохондрий есть своя ДНК, есть свои белки, которые кодируются этой ДНК. В общем, мораль в том, что генетический код очень сложно изменить, потому что вы меняете код, и изменится, в общем-то, все, что вы делаете, изменятся все ваши белки, и это, скорее всего, будет несовместимо с жизнью. Благодаря такому единству генетического кода нам очень удобно в итоге сравнивать в том числе и гены разных организмов. Можно взять человека, какую-нибудь водоросль, огурец, я не знаю, и посмотреть на ДНК, найти там участки ДНК, которые кодируют похожие белки, понять, что эти гены имеют какое-то общее происхождение. Можно вообще так идентифицировать в том числе некоторые гены по тому, какая у них последовательность нуклеотидов, какие белки они кодируют. В общем, знания о генетическом коде очень помогают нам определять заранее даже, какие вообще бывают белки у того или иного организма. И тут и возникает та проблема, собственно, из-за которой ведутся холивары. Если взять геном человека, наши 3 млрд. букв, и поискать, какие там есть гены, гены, которые кодируют белки, и посмотреть, какую долю от генома они составляют, то выяснится, что они составляют примерно 1%. 99% нашей ДНК вообще не кодируют белки. Вроде бы ДНК нужна для того, чтобы кодировать белки, но вот существенная часть этой ДНК этим не занимается. Это так называемая некодирующая ДНК. Здесь же и выяснилось, что по количеству генов человек, в общем-то, совсем не какой-нибудь там царь природы, не какой-то исключительный организм. Я сказал, что у человека генов примерно как у мухи, чуть больше, чем у мухи, но как у круглого червяка, как у нематоды. Маленький такой червячок, ползает в себе, и генов у него столько же, сколько у нас. Очень обидно для царя природы. А тут еще и приплывает рыба, у которой геном в 40 раз больше, а потом еще выясняется, что у риса, у чертового риса генов больше, чем у нас. У риса порядка 30-50 тыс. генов в зависимости от сорта риса и от того, как мы будем это считать. Но рис, получается, в каком-то смысле устроен сложнее, чем человек. Ну и представьте себе, как на фоне всей этой информации воспринимается это знание о том, что лишь 1% генома человека кодирует. То есть мало того, что у нас маленький геном, вот такусенький по сравнению с некоторыми организмами, мало того, что там мало генов, так еще и вокруг этих генов куча какого-то непонятного хлама. Но на самом деле то, что какой-то участок ДНК не кодирует белки, вовсе не значит, что он бесполезный, что это мусор, что это хлам. У нас есть много примеров полезных, некодирующих участков ДНК, но, например, есть регуляторные участки ДНК, такие последовательности, на которые садится какой-нибудь белок и может включить или выключить тот или иной ген в зависимости от условий, в зависимости от того, что за тип клетки у нас. В общем, регуляторные участки в ДНК существуют, и они очень важны. Кроме того, существуют участки ДНК, которые кодируют функциональные, некодирующие РНК. Оказывается, что некоторые РНК, они сами по себе могут обладать некоторыми полезными функциями, например, в состав рибосом, тех самых фабрик, которые синтезируют белки, существенную их функциональную часть выполняет молекула РНК, которая обвешана разными белками, но сам синтез белков происходит с участием молекул РНК. Есть еще транспортные РНК, это такие молекулы РНК, которые доставляют в рибосому аминокислоты, из которых белки синтезируются. И есть еще микро-РНК, которые могут регулировать работу тех или иных генов. В общем, можно привести довольно много примеров РНК, которые сами по себе функциональны, безотносительно того, синтезируются с них какие-то белки или нет. Тут, кстати, тоже очень интересная есть ремарка, что считается, что изначально, когда только жизнь зарождалась, скорее всего, первой молекулой такой жизни была не ДНК, а, скорее всего, РНК именно потому, что ДНК, она довольно химически инертная, это хорошая молекула, чтобы хранить информацию, но не очень хорошая для того, чтобы организовать жизнь, организовать какую-то химическую систему, которая могла бы себя воспроизводить. А молекулы РНК, они обладают свойствами таких хороших катализаторов, которые могут ускорять некоторые химические реакции, в том числе и синтез молекул, подобных себе. Существуют так называемые рибозимы, это ферменты, которые умеют осуществлять химический синтез. В общем, молекулы РНК, они очень многофункциональны, очень интересны, и поэтому считается, что, скорее всего, в начале зарождения жизни существовал мир РНК, мир молекул РНК, которые могли сами себя воспроизводить, что для этого не нужны даже полноценные клетки, для того, чтобы молекулы РНК себя копировали. Но это такое лирическое отступление. Ну и еще один пример функциональной молекулы ДНК, которая не кодирует белки, это теломеры. На кончиках хромосом у нас есть такие буферные участки из повторяющихся фрагментов ДНК, функция которых заключается в том, чтобы а) когда у нас клетка делится, ДНК должна удвоиться, но при этом она немножко укорачивается с концов, теломеры защищают всю остальную ДНК от такого укорачивания, это первое. И второе это то, что теломеры помогают молекуле ДНК, хромосоме одной, не слипнуться с другой хромосомой. Так что у ДНК могут быть функции помимо того, чтобы кодировать белки. И все же, несмотря на то, что мы знаем, что не всякая ДНК должна быть кодирующей, чтобы быть функциональной, если мы внимательно посмотрим на наш геном, мы обнаружим, что он чем-то напоминает такую огромную пустыню. Мы можем увидеть там следы каких-то поломанных генов. То есть какой-то ген существовал, в нем произошли мутации, которые несовместимы с тем, чтобы он кодировал белок, например, он становится не функциональным. Называется такой ген псевдогеном. Похож на ген по своей последовательности, но, очевидно, не работает. Дальше мы можем обнаружить следы каких-то древних вирусов, которые сами себя куда-то встроили и куда-то себя копировали, возможно, даже теперь и утратили все эти способности и функции, даже вирусами они больше не являются, но следы их существования в геноме остались. Есть огромное количество реально активных, а также подавленных или поломанных остатков переработанных мобильных элементов, то есть участков ДНК, которые сами себя умеют копировать, их еще называют эгоистичными последовательностями ДНК, потому что они как бы заинтересованы, видимо, исключительно в собственном размножении, хотя иногда и это у них уже больше не работает, они уже окончательно поломались. Но есть мобильные элементы ДНК, которые умеют себя копировать, они себя копируют, возникает их много копий, и вот такой вот лес, такая пустыня, я не знаю, как это назвать, остатки вот этих вот древних мобильных элементов в огромном количестве, их очень много в геноме, они составляют существенную часть и явным образом ничего полезного не делают. В общем, на кладбище генома можно обнаружить достаточно большое количество призраков. "Призраки! Везде тут призраки!" И мы знаем это не только как-то теоретически, были в том числе экспериментальные работы, где части вот такого не функционального генома вырезались с помощью методов генной инженерии и так далее, и смотрели, к чему это приведет. Ну, например, были работы на мышах, где вырезали последовательности ДНК объемом в 1,5 млн., 800 тыс. нуклеотидов удаляли полностью и смотрели, что с мышами произойдет. И ответ - ничего, ничего с ними не произошло. Это были, по-видимому, действительно не очень нужные участки ДНК. Тут можно, конечно, сказать, что на самом деле и кодирующие участки не все всегда являются строго обязательными для выживания. Ну, например, была очень известная работа на бактериях. Помните, мы обсуждали, какие у них компактные геномы. Есть такая бактерия, которая даже по меркам бактерий очень компактна, называется она микоплазмой, ну, один из видов микоплазмы. Есть вид микоплазмы, у которой чуть больше 900 генов, казалось бы, куда уж меньше. Но вот ученые по имени Крейг Вентер, а также некоторые его коллеги, они сделали работу, где они взяли геном такой супер компактной микоплазмы, использовали методы эволюционной биологии для того, чтобы прикинуть, какие гены являются самыми важными, какие - не очень важными. Ну, грубо говоря, если ген встречается у всех бактерий, то, наверное, это очень важный ген, а если он встречается только у малой части бактерий, то, наверное, он не супер важный. И они, в общем, используя это, а также некоторый метод проб и ошибок, в общем, смогли сделать микоплазму, которой в два раза сократили количество генов. Нельзя сказать, что, как в опыте с мышами, это ни к чему не привело. Измененная микоплазма, она медленнее размножалась, в общем, она хуже себя чувствовала. Но, тем не менее, эта измененная микоплазма оказалась способной к жизни, могла делиться, могла размножаться, в нее можно было встраивать какие-то новые гены, наоборот, для того, чтобы она производила какие-нибудь полезные вещества, в том числе и для человека, она могла эволюционировать. Недавно вышла работа, где показали, что такие минималистичные организмы могут адаптироваться, могут эволюционировать дальше. Все это очень увлекательно, но факт остается фактом: у нас все равно есть эксперименты на мышах, что мы можем удалить очень большой размер генома, это ни к чему не приводит. Ну и опять же, для людей, которые скептически относятся к самой концепции, что может быть какой-то мусор, ДНК, что может быть что-то ненужное в ДНК, всегда можно напомнить тот пример про рыбу, у которой геном в 40 раз больше, чем у человека. Зачем ей столько этой ДНК? Или, например, можно напомнить про то, что у лука, у обычного лука, в пять раз больше геном, чем у человека. Что там такого накодировано в этом луке, и почему ему так много ДНК потребовалось? "Откушу головку лука, чтобы не выть, как зверь в лесу". Надо сказать, что вообще термин мусорная ДНК был введен в оборот задолго до того, как был прочитан геном человека. Придумал этот термин, по-английски он звучал junk DNA, ученый, эволюционный биолог по имени Сусуму Оно. Это очень известный специалист, который занимался в том числе теоретической биологией. Но мало того, что ввел этот термин, но вообще-то он был одним из, скажем так, немногих известных людей, кто правильно предсказал количество генов, которое будет в геноме человека. Когда еще геном человека не был прочитан, ученые даже устраивали всякие тотализаторы, сколько будет генов в геноме. Ну, помните, этот гомоцентризм, мы должны быть самыми крутыми, у нас должно быть больше всех генов. Некоторые ученые говорили, что у человека будет 100 тыс. генов, у нас будет очень много генов. А Сусуму Оно предсказал более-менее правильно. На чем он базировал свои представления о сложности генома человека, о количестве генов, о том, сколько там должно быть мусора? Ну, на самом деле идея была достаточно простая. Можно прикинуть, как много вообще происходит мутаций в нашей ДНК, как часто какие-то участки ДНК меняются, как часто в них появляются какие-то лишние буквы, одни буквы меняются на другие и так далее, и так далее. Представим себе на секундочку, что каждая буква в геноме стоит ровно на своем месте, каждая буква важна. И если эту букву поменять на другую, то тогда получится что-то плохое, получится какое-то генетическое заболевание. В этом случае мы бы ожидали, что если мутаций очень много, то количество генетических заболеваний будет тоже очень большим. С каким-то количеством вредных мутаций может справиться естественный отбор. Возникает у вас мутант с каким-то нехорошим генетическим вариантом, он не оставляет потомства, этот генетический вариант не передается в следующие поколения. Естественный отбор выполнил свою задачу. Но есть лимит того, с каким количеством таких повреждений может справляться естественный отбор. Если, грубо говоря, у вас есть организм, который оставляет 10 потомков, но при этом у вас количество вредных мутаций на одного потомка 50, то тогда все эти 10 потомков, скорее всего, будут больными с вредными мутациями. Как бы естественный отбор ни старался, все равно вредные мутации будут передаваться в следующее поколение, ну или просто вид вымрет и не сможет вообще существовать. Поэтому должен быть какой-то предел на количество функциональной ДНК, который есть у организма, с учетом темпов, с которыми мутирует этот организм, с которыми могут накапливаться вот эти вредные мутации. Вот у нашего вида как раз так получилось, что количество новых мутаций в каждом поколении порядка 50-70 штук на одного ребенка. Точно эту цифру мы посчитали относительно недавно, потому что были прочитаны тройки геномов, мама, папа, ребенок, можно просто посчитать, сколько новых мутаций возникает в каждом поколении. Но и до этого были приблизительные оценки того, как быстро меняются те или иные участки ДНК. И, в общем, представим себе, 50-70 мутаций. И допустим, что весь геном полезный, весь геном функциональный, значит, 50-70, скорее всего, вредных мутаций. С этим очень тяжело бороться. Если же мы скажем, что функционален только 1% генома, например, то тогда на самом деле подавляющая часть этих мутаций вообще ни к чему не приводит, 50-70 мутаций, ха, полная ерунда, чтобы хотя бы одна мутация затронула функциональную часть генома, надо, чтобы было их 100. На 100 мутаций в среднем будет одна мутация вредная, и тогда с этим можно жить, с этим можно как-то бороться, естественный отбор потом эти вредные мутации устранит. Исходя из примерно таких соображений и некоторых других теоретических выкладок, Сусуму Оно пришел к следующему выводу. Во-первых, он предположил, что генов у человека порядка 30 тыс., по современным оценкам 20-25 тыс., но он был близок, не 100 тыс., как называли некоторые его коллеги. И второе, он предположил, что примерно 6% нашего генома функционально, а 94% - это тот самый junk DNA. Насколько он был прав или ошибся в этой оценке в 6%? На самом деле, по данным многих современных исследований, был достаточно близок. Сейчас считается, что мусором является порядка 85-90% нашей ДНК. Опять же, сейчас я сделаю оговорку, что слово "мусор" здесь не очень корректно. И еще одна оговорка, что есть споры вокруг этих цифр, и, собственно, мы про них сейчас и поговорим. Существует такая поговорка, что то, что для одного человека мусор, для другого сокровище. В общем, с идеей о том, что наша ДНК - это такая пустыня, согласились далеко не все ученые. И некоторые отнеслись к этой идее скептично. В частности, был такой проект, который называется Encode. Encode - это энциклопедия элементов ДНК. Авторы этого проекта занимались тем, что они пытались понять, а вообще, что делает тот или иной участок ДНК. На это можно посмотреть разными способами. Например, можно посмотреть, где с какой ДНК синтезируется РНК, можно посмотреть, какие химические метки приделываются к тому или иному участку ДНК, можно посмотреть на то, как одни гены взаимодействуют с другими генами. Можно, в общем, изучить много чего интересного про то, как работает геном на таком функциональном уровне. И вот авторы проекта Encode обратили внимание, точнее, обнаружили, если угодно, что 80% нашего генома участвует в тех или иных биохимических функциях и поэтому, по их мнению, должна считаться функциональной. С момента публикации результатов Encode и начались вот эти наиболее громкие холивары, о которых я рассказыва в том числе в начале этого видео, со всякими страшными цитатами, почти переходящими на личности. И, в частности, вышла статья одного очень известного биолога по имени Дэн Грор, статья эта называлась "О бессмертии телевизоров: "функция" в геноме человека, согласно безэволюционному учению проекта Encode". По словам Дэна Грора, даже сами члены этого консорциума Encode, в общем-то, не могли сойтись на том, какую часть генома следует называть функциональной. В одних своих выступлениях они могли назвать цифру в 80%, где-то они говорили уже 40%, где-то, ну, как минимум 20% функционально. В общем, они колебались в своих оценках, и это действительно так. И Дэн Грор при этом шутил на тему того, что, несмотря на то, что они так активно переобуваются, они тем не менее настоятельно требуют, чтобы слово "мусорная ДНК" пропало из лексикона биологов. Но основная претензия Дэна Грора была к тому, как вольно интерпретируется термин "функция" в рамках проекта Encode. Ну, например, у вас есть какой-то белок, который связывается с каким-то участком ДНК. Функцией этого белка можно объявить связывание с конкретно этим участком ДНК в конкретном месте генома. Ну, это примерно как сказать, что функцией Белого дома является находиться по адресу 1600, Пенсильвания авеню, Вашингтон, округ Колумбия. Не всякое связывание белка с каким-то участком ДНК вообще обязательно является функциональным. Ну, например, предположим, что у нас есть последовательность нуклеотидов Т-А-Т-А-А-А, допустим, такая последовательность нуклеотидов нужна для того, чтобы с ней в каком-то месте связался белок. Если белок с ней связывается, то дальше, допустим, чуть дальше, рядышком с этой последовательностью, находится какой-то ген, этот ген активируется. Белок связался с Т-А-Т-А-А-А, ген заработал, у этого участка ДНК есть определенная функция - класс. Но последовательность ДНК вот эта Т-А-Т-А-А-А, она не очень длинная, и, скорее всего, такие последовательности ДНК будут и в других участках генома, и где-то, может быть, они тоже будут участвовать в регуляции, в работе каких-то генов, а где-то они будут просто случайно там находиться. И там тоже свяжется этот белок, потому что он свяжется с этой конкретной последовательностью ДНК, но это ни к чему не приведет. Может быть, потому что там даже нет никакого гена рядом, который мог бы работать. И что же получается, что и там, и там есть какая-то функция? Нет, функция в первом случае есть, во втором случае функции очевидным образом нет. Но по методологии, которая была в Encode, получалось бы, что все эти последовательности Т-А-Т-А-А-А, раз они с каким-то белком связываются, значит, они все функциональны. Можно привести такую еще метафору, что вот у вас есть жвачка, можно ее жевать, можно ее выплюнуть и можно случайно наступить на нее ботинком. И раз жвачка к ботинку прилипла, значит, ее функция в том, чтобы прилипать к ботинкам. Ну, хотя очевидно, что производители жвачки, скорее всего, не для этого ее создавали. Или если бы жвачка к ботинку не прилипала, то, возможно, такая жвачка была бы даже лучше, чем та, которую мы привыкли жевать, меньше бы загрязняла улицы, и ботинки, и все остальное. То есть, грубо говоря, для того, чтобы объявить, что весь геном функциональный, авторам проекта Encode пришлось достаточно широко трактовать термин функция, то есть функцией могло быть что-то, что организму и не нужно, и даже бесполезно, а может быть, даже вредно. Особенно были забавные такие дискуссии на тему одной из функций, которая приписывалась молекуле ДНК, это то, что с ДНК может синтезироваться РНК. Ну, в частности, было заявлено, что 75% генома транскрибируется, то есть с 75% ДНК может считываться какая-нибудь молекула РНК, пусть и, может быть, иногда в малом количестве, пусть иногда эта РНК ничего не делает, но может синтезироваться. На это, мне кажется, очень остроумно ответил, собственно, сам Дэн Грор, который отметил, что окей, тогда нужно сказать, что вообще 100% генома функционально, потому что 100% генома участвует в очень важном биохимическом процессе - это копирование ДНК, 100% ДНК копируется. Важный биохимический процесс, она в нем участвует, значит, вся ДНК функциональная. И вообще действительно нужно избавиться от термина мусорная ДНК. Очевидно, что все это не очень хорошие критерии, если мы хотим понять, действительно ли какой-то участок ДНК для чего-то нужен, что он важен. В лучшем случае, в идеале, конечно, было бы провести эксперимент. Давайте удалим какой-то участок ДНК и посмотрим, что получится, как это делалось в тех работах на мышах. Но, во-первых, такие опыт достаточно сложны, экспериментальным путем поудалять миллиарды букв из генома - это, в общем-то, задача очень нетривиальная. Поэтому можно обратиться к более косвенным подходам - поиску функциональных участков ДНК и их отличению от нефункциональных. Тут на помощь приходит наука, которой, собственно, я занимаюсь, биоинформатика, математическая биология. Использование мат. методов к биологическим данным, применение алгоритмов для сравнения разных генетических последовательностей между собой. И с помощью биоинформатики мы можем на самом деле выявлять более и менее функциональные участки ДНК. Один из подходов, которые здесь очень сильно помогает, это поиск таких участков ДНК, которые очень похожи даже у достаточно далеких друг от друга видов. Грубо говоря, представьте себе, что мы нашли такую последовательность ДНК, которая почти совпадает и у человека, и у мышки, несмотря на то, что у эволюции были миллионы лет на то, чтобы эти последовательности ДНК изменить. Не существует участков ДНК, которые абсолютно неуязвимы к мутациям. Мутации возникают более-менее везде, потому что основной источник мутаций - это ошибки при копировании ДНК, вся ДНК копируется, как мы уже выяснили, где угодно может возникнуть мутация. Но вот мы видим участок ДНК, где мутации практически не возникают. Почему они там не возникают? Не потому, что они там в принципе не возникают, а потому что если там мутация возникает из-за того, что участок функциональный, ген или функция, которая там была нарушается, и такая мутация устраняется естественным отбором, потому что это вредная мутация, и в итоге мы там мутации не видим. Здесь можно провести аналогию с историей про математика Авраама Вальда, которому поручили наблюдать за самолетами, которые возвращались с боевых действий и смотреть на распределение дырок от пуль в этих самолетах, чтобы понять, куда нужно вешать броню дополнительную. Много брони не повесишь, потому что самолет должен быть не слишком тяжелым, но нужно избирательно бронировать его там, где самые важные его части. Авраам Вальд наблюдал, что вот много дырок от пуль, допустим, в крыльях самолетов, в фюзеляже. Кто-то мог бы сказать, ну вот, туда летят пули, значит, там нужно броню класть. Но на самом деле все ровно наоборот. Собственно, Вальд говорил: смотрите, мы видим только те самолеты, которые успешно вернулись, то есть с ними все в порядке, а пули, скорее всего, ложатся более-менее равномерно по этим самым самолетам. Значит, если мы где-то не видим дырок от пуль, значит, это место особенно важно. Самолеты с пулей в этом месте не возвращаются обратно, поэтому их нужно бронировать: двигатель, кабину пилота и так далее, и так далее. Ну и, собственно, в этом и были его рекомендации. Но то же самое мы можем сказать и про гены, и про ДНК. Потому что если мы видим участок ДНК, в котором очень много мутаций, очень много таких дырок от пуль, значит, скорее всего, этот участок не так уж и важен, он может мутировать, ничего страшного из этого не возникает. Если же мы видим участок ДНК, где мутаций нет, то это, скорее всего, означает, что организмы, у которых мутация возникла, они не выжили, они не передали свои гены в следующее поколение, то есть этот участок ДНК, видимо, для чего-то нужен, даже если мы не знаем, для чего. Про такие участки ДНК, в которых мы не видим мутаций, мы можем говорить, что это консервативные участки ДНК, которые подвержены отрицательному естественному отбору, то есть, естественный отбор направлен на устранение вредных мутаций в этом участке ДНК. И теперь, если подойти к геному человека с таким критерием, то есть посмотреть, какая часть генома человека функциональна вот по этому критерию, что это участки ДНК, в которых мы наблюдаем признаки того, что естественный отбор устраняет какие-то мутации, то мы можем сказать, что порядка 10% плюс-минус функционально, а все остальное - это участки ДНК, в которых можно как угодно колбасить последовательности нуклеотидов, можно что-то менять, добавлять, удалять, и ничего страшного не произойдет. Обратите внимание, что вот эта вот цифра, полученная эмпирическим путем на основе анализа человеческого генома десятки лет спустя после того, как Сусуму Оно сделал свое предсказание, цифра получается очень близка. У него было 6%, у нас, может быть, чуть-чуть больше, но на самом деле то же, это плюс минус несколько процентов в зависимости от того, как строго мы эти функциональные участки ДНК идентифицируем. Так что же, получается, что 90% нашего генома - это какой-то мусор, который вредный, от которого надо бы избавиться? Срочно дайте нам генетический скальпель, будем вырезать из себя этот мусор, потому что мы же не хотим быть ходячей кучей мусора. С такой логикой на самом деле тоже, конечно же, есть куча проблем. Дело в том, что вообще действительно термин мусорная ДНК мне кажется не очень удачным. Есть гораздо более правильный, наверное, термин - это барахло. Ну, смотрите, что такое мусор? Он воняет, его должны выкидывать, а иначе он накопится, и это приведет к каким-то нежелательным последствиям. Барахло - это что-то более нейтральное. У вас, может быть, в гараже стоит старый велосипед, которым вы не пользуетесь. Стоит и стоит. Он вам не мешает. Может быть, когда-нибудь у вас появятся дети, лучше, конечно, купить новый велосипед, но и старый, если у вас нет денег, может в принципе сойти. Это не что-то полезное, но и не что-то непременно вредное. Но на самом деле кое-что полезное может быть даже в такой, нефункциональной ДНК. Начнем с того, что у нас есть эти самые мобильные элементы, которые скачут, или есть какие-то вирусы, которые умеют встраиваться в ДНК. Если мобильный элемент или вирус встраиваются в этот функциональный участок ДНК, внутрь какого-нибудь гена, то этот ген может поломаться. Если этот ген, например, является онкогеном или каким-то геном, который имеет отношение к развитию, допустим, какого-то заболевания, то тогда вы получите это заболевание, что может быть неприятно. Если у вас есть такой буфер, большое количество ненужной ДНК, то какой-то вирус или какая-то мусорная копирующаяся последовательность ДНК встроится вот туда с высокой вероятностью, с гораздо меньшими последствиями. Вторая вещь заключается в том, что иногда просто нужно, чтобы два каких-нибудь гена находились друг от друга на большом расстоянии. Мало ли почему так нужно, но можно между ними воткнуть какой-то фрагмент ДНК, сам он по себе не важен, то есть какая там последовательность - не принципиально, мутировать может это как угодно, но вот наши гены разнесены в пространстве. В каких-то ситуациях можно себе представить, что это для чего-то может быть нужно. Третья потенциальная польза такого барахла в том, что вообще-то это может способствовать генетическому разнообразию. То есть иногда из вот этих вот ненужных участков ДНК из-за того, что они так свободно могут мутировать, могут накапливать какие-то изменения, там может появиться что-то функциональное, там может родиться какой-то новый ген, какой-то новый генетический элемент, который потом куда-то скопируется и начнет что-то делать. Грубо говоря, то, что является барахлом сегодня может не быть барахлом в каком-то далеком будущем. На самом деле мы знаем примеры, когда какие-то особенности функционирования биологического организма служат ровно тому, чтобы ускорять эволюцию. Ну, например, для этого существует секс. Секс, что это такое? По сути, секс - это ускоритель эволюции. У вас есть два организма, самец и самка, они как бы накапливают какие-то свои мутации, а потом они обмениваются своим генетическим материалом, и какие-то мутации образуют между собой новые комбинации. И за счет этого увеличивается генетическое разнообразие потомства, повышается вероятность того, что получится какой-то интересный мутант, у которого, возможно, будут адаптации к каким-то новым меняющимся условиям жизни. Наличие какого-то багажа в виде этих нефункциональных участков ДНК тоже может вносить некоторый вклад в ускорение эволюционного процесса. Особенно важно для многоклеточного организма, который не так быстро размножается. То есть бактерия, да, у нее быстро меняется смена поколений, для нее действительно желательно избавиться от всякого мусора, потому что этот мусор мешает ей быстро размножаться. В отличие от бактерии, мы, многоклеточные организмы, не можем так быстро менять свои поколения, и поэтому нам желательно иметь какие-то другие способы ускорения своей эволюции, чтобы за единицу времени мы могли адаптироваться в более приемлемых, похожих темпах. В общем, такая вот "мусорная", "барахляная" ДНК может выступать таким своеобразным полигоном для генетической изменчивости. Ну и еще раз нужно подчеркнуть, что некодирующая ДНК и мусорная ДНК - это не одно и то же. Очень часто возникают такие сенсационные заголовки, на которые приходится реагировать, типа "Ученые обнаружили функцию у мусорной ДНК, а значит, мусорной ДНК не существует", в таком духе. Обычно здесь обнаружили функции у некодирующей ДНК. Помните, я упоминал, что есть участки ДНК, которые белки не кодируют, но у них, тем не менее, функция есть, и иногда мы эту функцию не знаем, а потом обнаруживаем. Это нормально, это происходило раньше и будет происходить и дальше. Но то, что существуют участки ДНК, в которых любые мутации дозволены и ни к чему это не приводит, тоже является фактом. В общем, нужно не путать термины некодирующая ДНК и мусорная ДНК, не выдавать одно за другое. При этом также очень важно не умалять значимость проекта, вроде того же Encode. То есть при том, что они действительно странным образом хайпанули на теме мусорной ДНК и вызвали очень странные холивары в научной среде, тем не менее, действительно очень важно изучать функции некодирующих участков ДНК, изучать, какие белки где с чем связываются, какие участки ДНК превращаются в молекулы РНК. Все это очень интересно, из этого в итоге получилось очень много интересных открытий. Просто не нужно опять же противопоставлять одно другому. В заключение можно сказать, что, по-видимому, все-таки есть у нас более и менее функциональные участки ДНК. В каких-то участках ДНК мутации приводят к каким-то нежелательным, иногда даже смертельным последствиям. В других участках ДНК мутации не приводят ни к чему, это эмпирический факт. Такую ДНК можно назвать мусорной, можно называть ее барахлом, в общем-то, это не очень принципиально, если мы понимаем, что скрывается за этим термином. Но бороться с этой мусорной ДНК, как бы мы ее ни называли, особого смысла тоже нет. Не то чтобы это на самом деле какая-то вредная ДНК, а то, что это, ну, такой вот интересный балласт, который может быть иногда даже полезен в плане эволюции и развития нашего вида. Опять же, в наших масштабах, человеческих, это незаметно, но в масштабе миллионов лет, когда-нибудь в далеком будущем, может быть, что-то из этого превратится во что то интересное, функционально и полезное. Но у меня есть еще одна история напоследок. А может ли быть что-то обратное мусорной ДНК? Сверхфункциональная ДНК, ДНК, которая настолько не подвержена изменениям, что обычным генам даже и не снилось? Так получилось, что эта тема одной из научных публикаций, соавтором которой я являюсь. Мы вместе с коллегами изучали митохондриальный геном таких паразитов, которые называются волосатики. Волосатики интересны тем, что они умеют заставлять кузнечиков или сверчков топиться в воде, потому что в воде они потом выползают, находят там самцы самок, самки - самцов и вступают в приятный процесс полового размножения. А своих хозяев они при этом топят, это такой вот нежелательный побочный продукт. Но история не про это, история про то, что, как я говорил, у нас есть митохондрии, в которых есть своя собственная ДНК. Это нормально, это замечательно. Но у волосатиков митохондрии в этом смысле очень, радикально отличаются от митохондрий любых других животных, которых можно найти в современных базах данных животных, для которых изучены генетические последовательности их митохондрий. Что есть у волосатиков? Дайте приведу такую метафору. Представьте себе, что вы читаете текст произведения Пушкина "Евгений Онегин". Это классное, длинное стихотворение, в котором каждое слово стоит на своем месте, образуя осмысленные предложения. Дочитали до конца и вы говорите: "Ай да Пушкин! Ай да молодец!" И тут вы обнаруживаете, что если взять "Евгения Онегина" и прочитать задом наперед, то получается "Евгений Онегин". Насколько вы в этот момент офигеете. То есть и так было офигенно, а тут еще и задом наперед получается то же самое, причем непонятно, нафига это нужно. Но так вот, есть участки ДНК, которые кодируют белки, поэтому там должны быть определенные нуклеотиды на своих местах, чтобы получилась правильная аминокислотная последовательность, чтобы получился правильный белок, который будет выполнять правильную функцию. В случае с митохондриями там есть гены, кодирующие белки, участвующие в дыхании. А теперь выясняется, что у волосатиков есть куча генов в митохондриях, у которых так устроены их последовательности ДНК, что, если читать задом наперед, получается почти то же самое, получается полиндром. Ну, тут надо сделать оговорку, что в случае с текстом, который читается одинаково задом наперед, это называется полиндром в русском языке, и там должна быть, допустим, "А роза упала на лапу Азора", и там, "а" в начале, "а" - в конце, "р" - вторая буква, "р" - вторая с конца. Вот это получается полиндром. В случае с ДНК полиндромом называют нечто иное. У нас в ДНК буква A всегда стоит напротив Т в двойной спирали, буква Г напротив Ц. Это называется принцип комплиментарности, и ДНК-полиндром - это такая однацепочечная молекула ДНК, которая может сама на себя замкнуться в качестве двойной спирали. То есть если здесь А, то здесь должно быть Т, если здесь Г, здесь должно быть Ц, если здесь Ц, здесь должно быть Г. То есть тоже каждая буква в ДНК четко указывает, какая буква должна быть напротив нее, одна конкретная буква, но не А напротив А, а А напротив Т, Т напротив А, Г напротив Ц, Ц напротив Г, в общем, так получается, ДНК-полиндром. Так вот, у волосатиков есть куча генов, которые по этому принципу организованы. Большая последовательность ДНК, до 260 букв, которая мало того, что кодирует функциональный белок, который занимается важным делом, но еще и соответствует вот этому очень странному, произвольному, казалось бы, правилу: а напротив T, Г напротив Ц. Можно взять одну цепочку ДНК, свернуть ее и получить двойную спираль. Для чего это нужно - мы не знаем. Как это получилось - тоже не знаем. Но, по-моему, это очень интересный, удивительный феномен, что в данном случае каждый нуклеотид как бы удовлетворяет сразу двум правилам. Первое правило - ты участвуешь в кодировании правильной аминокислоты, второе - ты соответствует какому-то другому нуклеотиду в генетической последовательности этого гена. Не весь ген целиком обычно организован по этому принципу, но вот мы находили участки до 260 нуклеотидов длиной, которые удовлетворяли этому правилу. Так что иногда эволюция порождает удивительно сложные последовательности ДНК. И будет продолжать производить их и дальше. Если вы хотите, чтобы видео про науку получили эволюционные преимущества в гонке за выживание среди алгоритмов YouTube, то, пожалуйста, поставьте этому ролику лайк, подписывайтесь на канал, так мы получим адаптивные преимущества и роликов про науку будет становиться больше, они будут вытеснять всякое мракобесие. И, в общем, эволюция видеоконтента, на YouTube в том числе, будет идти в сторону прогресса.