Издательство «БИНОМ. Лаборатория знаний» выпускает книгу воспоминаний ученого-генетика Крейга Вентера «Расшифрованная жизнь». Крейг Вентер известен работами по прочтению и расшифровке генома человека. В 1992 году он основал Институт исследований генома (TIGR). В 2010 году Вентер создал первый в мире искусственный организм – синтетическую бактерию Mycoplasma laboratorium. Мы предлагаем вам ознакомиться с одной из глав книги, в которой Крейг Вентер рассказывает о работе 1999–2000 годов по секвенированию генома мухи дрозофилы.
Вперед, и только вперед
Фундаментальные аспекты наследственности оказались, к нашему удивлению, довольно просты, а потому появилась надежда, что, возможно, природа не так уж непознаваема, а ее не раз провозглашаемая самыми разными людьми непостижимость — просто еще одна иллюзия, плод нашего невежества. Это вселяет в нас оптимизм, поскольку, если бы мир был настолько сложным, как уверяют некоторые наши друзья, у биологии не было бы никакого шанса стать точной наукой.
Томас Хант Морган. Физические основы наследственности
Многие спрашивали меня, почему из всех живых существ на нашей планете я выбрал дрозофилу; других интересовало, почему я сразу не перешел к расшифровке генома человека. Дело в том, что нам нужна была основа для будущих экспериментов, мы хотели быть уверенными в правильности нашего метода, прежде чем потратить почти 100 миллионов долларов на секвенирование генома человека.
Маленькая дрозофила сыграла огромную роль в развитии биологии, особенно генетики. Род дрозофилы включает разных мушек — уксусных, винных, яблочных, виноградных, а также фруктовых, — всего около 26 сотен видов. Но стоит произнести слово «дрозофила», и любой ученый сразу подумает об одном определенном виде — Drosophilamelanogaster. Из-за того, что она быстро и легко размножается, эта крошечная мушка служит для биологов-эволюционистов модельным организмом. Они используют ее, чтобы пролить свет на чудо творения — от момента оплодотворения до становления взрослого организма. Благодаря дрозофилам было сделано немало открытий, в том числе обнаружены гомеобокссодержащие гены, регулирующие общее строение всех живых организмов.
Каждый, изучающий генетику, знаком с опытами на дрозофиле, выполненными Томасом Хантом Морганом, отцом американской генетики. В 1910 году он заметил среди обычных красноглазых мушек мутантов мужского пола с белыми глазами. Он скрестил белоглазую мужскую особь с красноглазой женской особью и обнаружил, что их потомство получилось красноглазым: белоглазость оказалась рецессивным признаком, и теперь мы знаем: чтобы у мушек были белые глаза, нужны две копии гена белоглазости, по одному от каждого родителя. Продолжая скрещивать мутантов, Морган обнаружил, что только у мужских особей проявляется признак белых глаз, и сделал вывод, что этот признак связан с половой хромосомой (Y-хромосомой). Морган и его ученики изучали наследуемые признаки у тысяч плодовых мушек. Сегодня эксперименты с дрозофилой ведутся в лабораториях молекулярной биологии всего мира, где это маленькое насекомое изучают более пяти тысяч человек.
Я на собственном опыте понял всю важность дрозофилы, когда использовал библиотеки ее кДНК генов при исследовании адреналиновых рецепторов и обнаружил у мушки их эквивалент — октопаминовые рецепторы. Это открытие указывало на общность эволюционной наследственности нервной системы мушки и человека. Пытаясь разобраться в библиотеках кДНК мозга человека, я путем компьютерного сопоставления генов человека с генами дрозофилы нашел гены со сходными функциями.
Проект секвенирования гена дрозофилы был запущен в 1991 году, когда Джерри Рубин из Калифорнийского университета в Беркли и Аллен Спредлинг из института Карнеги решили, что настало время приняться за эту задачу. В мае 1998 года 25% секвенирования было уже завершено, и я внес предложение, которое, по словам Рубина, было «слишком хорошим, чтобы от него отказаться». Моя идея была довольно рискованной: тысячам исследователей плодовой мушки из разных стран предстояло пристально изучить каждую букву полученного нами кода, сравнивая ее с высококачественными, эталонными данными самого Джерри, а затем сделать заключение о пригодности моего метода.
Исходный план предполагал завершение секвенирования генома мушки в течение шести месяцев — к апрелю 1999 года, чтобы затем начать атаку на геном человека. Мне казалось, это самый эффектный и всем понятный способ продемонстрировать, что наш новый метод работает. А если у нас ничего не получится, полагал я, то лучше в этом быстро убедиться на примере дрозофилы, чем работая над геномом человека. Но, по правде говоря, полная неудача была бы самым впечатляющим провалом в истории биологии. Джерри тоже рисковал своей репутацией, поэтому все в Celera были полны решимости поддержать его. Я попросил Марка Адамса возглавить нашу часть проекта, и так как у Джерри в Беркли тоже была первоклассная команда, наше сотрудничество шло как по маслу.
Прежде всего встал вопрос о чистоте ДНК, которую нам предстояло секвенировать. Как и люди, мушки различаются на генетическом уровне. Если генетических вариаций в популяции более 2%, и мы имеем 50 различающихся индивидуумов в выбранной группе, то расшифровка оказывается весьма сложной. В первую очередь Джерри пришлось провести инбридинг мушек в максимально возможной степени, чтобы предоставить нам однородный вариант ДНК. Но для обеспечения генной чистоты инбридинга было недостаточно: при извлечении ДНК мушки существовала опасность загрязнения генетическим материалом из клеток бактерий, находящихся в пище мушки или в ее кишечнике. Чтобы избежать этих проблем, Джерри предпочитал извлекать ДНК из мушиных эмбрионов. Но и из клеток эмбрионов приходилось сначала выделять ядра с нужной нам ДНК, чтобы не загрязнять ее внеядерной ДНК митохондрий — «силовых установок» клетки. В результате мы получили пробирку с мутноватым раствором чистой дрозофильной ДНК.
Летом 1998 года команда Хэма, имея такую чистую ДНК мушки, приступила к созданию библиотек ее фрагментов. Сам Хэм больше всего любил разрезать ДНК и соединять внахлест полученные фрагменты, понизив чувствительность своего слухового аппарата, чтобы никакие посторонние звуки не отвлекали его от работы. Создание библиотек должно было положить начало масштабному секвенированию, но пока повсюду раздавались одни только звуки дрели, стук молотков и визжание пил. Рядом постоянно мозолила глаза целая армия строителей, а мы продолжали решать важнейшие проблемы — устранение неполадок в работе секвенаторов, роботов и другого оборудования, пытаясь не за годы, а за считанные месяцы создать с нуля настоящую «фабрику» секвенирования.
Первый секвенатор ДНК модели 3700 был доставлен в Celera 8 декабря 1998 года и встречен c большим восторгом и всеобщим вздохом облегчения. Устройство извлекли из деревянного ящика, поместили в комнату без окон в подвале — его временное пристанище, и сразу приступили к пробным испытаниям. Когда он заработал, мы получили очень качественные результаты. Но эти первые экземпляры секвенаторов работали весьма нестабильно, а некоторые были неисправны с самого начала. С работающими тоже постоянно возникали проблемы, порой чуть ли не ежедневно. Например, в программе управления роботом-манипулятором появилась серьезная ошибка — иногда механическая рука робота на большой скорости выдвигалась над устройством и с размаху врезалась в стену. В результате секвенатор останавливался, и для его починки приходилось вызывать ремонтную бригаду. Некоторые секвенаторы выходили из строя из-за блуждающих лазерных лучей. Для защиты от перегрева использовались ленты из фольги и скотча, поскольку при высокой температуре из последовательностей испарялись окрашенные в желтый цвет фрагменты Gs.
Хотя устройства теперь поставлялись регулярно, около 90% из них с самого начала были неисправны. В некоторые дни секвенаторы вообще не работали. Я твердо верил в Майка Ханкапиллера, однако моя вера сильно поколебалась, когда он стал винить в неудачах наших сотрудников, строительную пыль, малейшие колебания температуры, фазы Луны и так далее. Некоторые из нас от стресса даже поседели.
Не подающие признаков жизни 3700-е, ожидающие отправки обратно в ABI, стояли в кафетерии, и, в конце концов, дошло до того, что нам приходилось обедать практически в «морге» секвенаторов. Я был в отчаянии — ведь мне ежедневно нужно было определенное количество работающих устройств, а именно 230! За примерно 70 миллионов долларов компания ABI обещала предоставить нам или 230 абсолютно исправных устройств, работающих без перебоев целый день, или 460, которые работали хотя бы полдня. Кроме того, Майку следовало удвоить количество квалифицированного технического персонала для незамедлительного ремонта секвенаторов после поломки.
Однако какой интерес заниматься всем этим за те же деньги! К тому же у Майка появился еще один клиент — государственный геномный проект, руководители которого уже начали закупать сотни устройств безо всякого тестирования. Будущее Celera зависело от этих секвенаторов, но Майк, по-видимому, не понимал, что и будущее ABI от них зависело. Конфликт был неизбежен, что и проявилось на важном совещании инженеров ABI и моей команды, состоявшемся в Celera.
После того, как мы сообщили об огромном количестве дефектных приборов и о том, как много времени требуется на исправление поломок секвенаторов, Майк снова попытался свалить всю вину на моих сотрудников, но даже его собственные инженеры с ним не согласились. В конце концов вмешался Тони Уайт. «Мне все равно, сколько это стоит и кого нужно прибить за это», — сказал он. Тогда он в первый и последний раз действительно встал на мою сторону. Он приказал Майку как можно скорее обеспечить поставку новых секвенаторов, даже в ущерб другим клиентам и даже если пока неизвестно, во сколько это обойдется.
Тони также распорядился, чтобы Майк нанял еще двадцать специалистов для оперативного ремонта и определения причин всех проблем. На деле это было легче сказать, чем сделать, потому что опытных работников не хватало. Начать с того, что Эрик Ландер переманил двоих из самых квалифицированных инженеров, и по мнению Майка, тут тоже были виноваты мы. Повернувшись к Марку Адамсу, Майк сказал: «Вы должны были нанять их раньше, чем это сделал кто-то другой». После такого заявления я окончательно потерял к нему всякое уважение. Ведь согласно нашему договору, я не мог нанимать сотрудников ABI, в то время как Ландер и другие руководители государственного проекта генома имели на это право, поэтому очень скоро лучшие инженеры ABI начали работать на наших конкурентов. К концу совещания я понял — проблемы остались, но луч надежды на улучшение все-таки забрезжил.
Так и произошло, хотя и не сразу. Наш арсенал секвенаторов увеличился с 230 до 300 устройств, и если 20–25% из них отказывали, мы все-таки имели около 200 работающих секвенаторов и кое-как справлялись с поставленными задачами. Технические сотрудники работали героически и неуклонно увеличивали темп ремонтных работ, сокращая простои. Все это время я думал об одном: то, что мы делаем, — выполнимо. Неудачи возникали по тысяче причин, но провал не входил в мои планы.
Мы всерьез взялись за секвенирование генома дрозофилы 8 апреля, примерно тогда, когда уже должны были завершить эту работу. Я, конечно, понимал, что Уайт хочет от меня избавиться, но делал все от меня зависящее ради выполнения главной задачи. Напряжение и беспокойство преследовали меня и дома, но с самым своим «доверенным лицом» я эти проблемы обсуждать не мог. Клэр откровенно демонстрировала свое презрение, видя, насколько я поглощен делами Celera. Ей казалось, что я повторяю те же ошибки, которые делал, работая в TIGR/HGS. К 1 июля я чувствовал себя глубоко подавленным, как это уже было во Вьетнаме.
Поскольку конвейерный метод пока у нас не работал, нам предстоял тяжелый изнурительный труд — заново «склеивать» фрагменты генома. Чтобы обнаруживать совпадения и не отвлекаться на повторы, Джин Майерс предложил алгоритм на основе ключевого принципа моего варианта метода дробовика: секвенировать оба конца всех полученных клонов. Поскольку Хэм получал клоны трех точно известных размеров, мы знали, что две концевые последовательности находятся на строго определенном расстоянии друг от друга. Как и прежде, этот способ «нахождения пары» даст нам прекрасную возможность снова собрать геном.
Но поскольку каждый конец последовательности секвенировался отдельно, для обеспечения четкой работы этого метода сборки нужно было вести тщательный учет — для абсолютной уверенности, что мы смогли правильно соединить все пары концевых последовательностей: ведь если хотя бы одна из ста попыток приведет к ошибке и не найдется соответствующая пара для последовательности, все пойдет насмарку и метод не сработает. Один из способов избежать этого — использование штрих-кода и датчиков для отслеживания каждого этапа процесса. Но в начале работы у лаборантов не было необходимого программного обеспечения и оборудования для секвенирования, поэтому приходилось делать все вручную. В Celera небольшая команда, менее двадцати человек, каждый день обрабатывала рекордное количество клонов — 200 тысяч. Мы могли предвидеть некоторые ошибки, например неправильное прочтение данных из 384 лунок, а затем использовать компьютер для нахождения явно ошибочной операции и исправить положение. Конечно, еще оставались отдельные недочеты, но это только подтверждало мастерство команды и уверенность, что мы можем устранять ошибки.
Несмотря на все сложности, мы сумели за четыре месяца прочесть 3156 миллионов последовательностей, всего около 1,76 миллиарда нуклеотидных пар, содержащихся между концами 1,51 миллиона клонов ДНК. Теперь настала очередь Джина Майерса, его команды и нашего компьютера — нужно было сложить все участки вместе в хромосомы дрозофилы. Чем длиннее становились участки, тем менее точным оказывалось секвенирование. В случае дрозофилы последовательности насчитывали в среднем 551 нуклеотидную пару, и средняя точность была 99,5%. Если иметь 500-буквенные последовательности, почти любой может определить места совпадений, передвигая одну последовательность вдоль другой до тех пор, пока не обнаружатся совпадения.
Для секвенирования Haemophilus influenzae у нас было 26 тысяч последовательностей. Для сравнения каждой из них со всеми остальными потребовалось бы проделать 26 тысяч сравнений в квадрате, или 676 миллионов. Геном дрозофилы, с его 3,156 миллиона прочтений потребовал бы около 9,9 триллиона сравнений. В случае человека и мыши, где мы произвели 26 миллионов прочтений последовательности, требовалось около 680 триллионов сравнения. Поэтому не вызывает удивления, что большинство ученых весьма скептически относились к возможному успеху этого метода.
Хотя Майерc и обещал все наладить, у него постоянно возникали сомнения. Теперь он работал дни и ночи напролет, выглядел измученным и как-то посерел. К тому же у него были проблемы в семье, и он стал большую часть свободного времени проводить с журналистом Джеймсом Шривом, который писал о нашем проекте и как тень следил за ходом исследований. Пытаясь как-то отвлечь Джина, я взял его с собой на Карибы — расслабиться и походить под парусом на моей яхте. Но и там он часами сидел, скрючившись над ноутбуком, нахмурив черные брови и щуря свои черные глаза от яркого солнца. И, несмотря на невероятные трудности, Джин и его команда сумели за полгода сгенерировать более полумиллиона строк компьютерного кода для нового ассемблера.
Если бы результаты секвенирования были стопроцентно точными, без повторяющихся ДНК, сборка генома была бы относительно несложной задачей. Но в реальности геномы содержат большое количество повторяющихся ДНК разного типа, разной длины и частоты. С короткими повторами, состоящими из менее пяти сотен пар нуклеотидов, справиться относительно легко, с более длинными повторами — сложнее. Для решения этой проблемы мы использовали метод «нахождения пары», то есть секвенировали оба конца каждого клона и получали клоны разной длины для обеспечения максимального количества совпадений.
Алгоритмы, закодированные в полумиллионе строк компьютерного кода команды Джина, предполагали поэтапный сценарий — от самых «безвредных» действий, например простого перекрывания двух последовательностей, до более сложных, например использования обнаруженных пар для слияния островков перекрывшихся последовательностей. Это было похоже на сложение головоломки, когда небольшие островки собранных участков составляются вместе и образуют большие острова, а затем весь процесс повторяется снова. Только вот в нашей головоломке было 27 миллионов фрагментов. И было очень важно, чтобы участки брались из последовательности высокого качества сборки: представьте себе, что будет, если вы собираете пазл, а цвета или изображения его элементов нечеткие и размытые. Для дальнего порядка последовательности генома значительная доля прочтений должна быть в виде совпадающих пар. Учитывая, что результаты все еще отслеживались вручную, мы с облегчением обнаружили, что 70% имевшихся у нас последовательностей именно такие. Специалисты по компьютерному моделированию объяснили, что при меньшем проценте собрать нашего «шалтая-болтая» было бы невозможно.
И теперь мы смогли использовать ассемблер Celera для секвенирования последовательности: на первом этапе результаты корректировались для достижения самой высокой точности; на втором этапе программа Screener удаляла загрязняющие последовательности из ДНК плазмиды или E. coli. Процесс сборки может быть нарушен всего-навсего какими-то 10 парами оснований «чужой» последовательности. На третьем этапе программа Screener проверяла каждый фрагмент на соответствие известным повторяющимся последовательностям в геноме плодовой мушки — данным Джерри Рубина, который их «любезно» нам предоставил. Местоположение повторов с частично перекрывающимися участками записывалось. На четвертом этапе другая программа (Overlapper) обнаруживала перекрывающиеся участки, сравнивая каждый фрагмент со всеми остальными, — колоссальный эксперимент по обработке огромного объема числовых данных. Ежесекундно мы сравнивали 32 миллиона фрагментов с целью обнаружить по крайней мере 40 перекрывающихся пар оснований с менее 6% различий. При обнаружении двух перекрывающихся участков мы объединяли их в больший фрагмент, так называемый «контиг» — набор перекрывающихся фрагментов.
В идеальном случае этого бы вполне хватило для сборки генома. Но нам приходилось бороться со статтерами и повторами в коде ДНК, а это означало, что один фрагмент ДНК может перекрываться с несколькими различными участками, создавая ложные соединения. Чтобы упростить задачу, мы оставляли только однозначно соединенные фрагменты, так называемые «унитиги». Программа, с помощью которой мы выполняли эту операцию (Unitigger), по существу удаляла всю последовательность ДНК, которую мы не могли с уверенностью определить, оставляя лишь эти унитиги. Этот шаг не только дал нам возможность рассмотреть другие варианты сборки фрагментов, но и существенно упростил задачу. После редукции количество перекрывающихся фрагментов сократилось с 212 миллионов до 3,1 миллиона, и проблема упростилась в 68 раз. Детали головоломки постепенно, но неуклонно вставали на свои места.
А затем мы могли использовать информацию о способе спаривания последовательностей одного и того же клона, используя «каркасный» алгоритм. Все возможные унитиги со взаимно перекрывающимися парами оснований объединялись в специальные каркасы. Для описания этого этапа в своих лекциях я провожу аналогию с детским игрушечным конструктором Tinkertoys. Он состоит из палочек разной длины, которые можно вставлять в отверстия, расположенные на деревянных узловых деталях (шариках и дисках), и составить так объемную конструкцию. В нашем случае узловые детали — это унитиги. Зная, что парные последовательности располагаются на концах клонов длиной в 2 тысячи, 10 тысяч или 50 тысяч пар оснований — то есть как бы находятся на расстоянии определенного количества отверстий друг от друга, — их можно выстроить в одну линию.
В результате тестирования этой методики на последовательности Джерри Рубина, составлявшей примерно одну пятую генома плодовой мушки, мы получили всего лишь 500 пробелов. Проведя в августе испытания на наших собственных данных, мы получили в результате более 800 тысяч небольших фрагментов. Существенно большее количество данных для обработки показало, что методика работала плохо — результат оказался противоположным ожидаемому. В течение нескольких следующих дней паника нарастала, а список возможных ошибок удлинялся. С верхнего этажа корпуса № 2 адреналиновый раж просачивался в комнату, шутливо называемую «Безмятежными покоями». Однако никакого покоя и безмятежности там не ощущалось, особенно в течение по крайней мере пары недель, когда сотрудники буквально кругами слонялись в поисках выхода из создавшегося положения.
В конце концов проблему решил Артур Делчер, работавший с программой Overlapper. Он заметил нечто странное в 678-й строке кода из 150 тысяч строк, в том месте, где пустяковая неточность означала, что важная часть совпадений не записана. Ошибка была исправлена, и 7 сентября у нас было 134 клеточных каркаса, покрывавших действующий (эухроматический) геном плодовой мушки. Мы были в восторге и с облегчением выдохнули. Пришла пора объявить всему миру о нашем успехе.
Конференция по секвенированию генома, которую я начал проводить несколько лет назад, предоставляла для этого прекрасную возможность. Я был уверен, что найдется большое количество жаждущих удостовериться, сдержали ли мы свое обещание. Я решил, что рассказывать о наших достижениях, и прежде всего о процессе секвенирования, сборке генома и значении этого для науки, должны Марк Адамс, Джин Майерс и Джерри Рубин. Из-за наплыва желающих приехать на конференцию мне пришлось перенести ее из Хилтон-Хеда в более вместительный отель «Фонтенбло» в Майами. На конференции присутствовали представители крупных фармацевтических и биотехнических компаний, специалисты по геномным исследованиям со всего мира, довольно много обозревателей, репортеров и представителей инвестиционных компаний — все были в сборе. Наши конкуренты из компании Incyte потратили немалые средства на организацию приема после окончания конференции, корпоративную видеосъемку и прочее — делали все, дабы убедить публику, что именно они предлагают «самую подробную информацию о геноме человека».
Мы собрались в большом конференц-зале. Выдержанный в нейтральных тонах, украшенный настенными светильниками, он был рассчитан на две тысячи человек, но народ все прибывал, и вскоре зал заполнился до отказа. Открытие конференции состоялось 17 сентября 1999 года, и на первом заседании с сообщениями выступили Джерри, Марк и Джин. После небольшого вступления Джерри Рубин объявил, что собравшимся предстоит услышать о лучшем совместном проекте известных компаний, в котором ему когда-либо довелось участвовать. Атмосфера накалялась. Аудитория поняла, что он не стал бы говорить так высокопарно, если бы у нас не было заготовлено что-то действительно сенсационное.
В воцарившейся тишине Марк Адамс начал подробно описывать работу нашего «производственного цеха» в Celera и наши новые методы секвенирования генома. Однако при этом он ни слова не сказал о собранном геноме, словно поддразнивая публику. Затем вышел Джин, поведавший о принципах метода дробовика, о секвенировании Haemophilus, об основных стадиях работы ассемблера. С помощью компьютерной анимации он продемонстрировал весь процесс обратной сборки генома. Отведенное на выступления время заканчивалось, и многие было уже решили, что все ограничится элементарной презентацией с использованием программы PowerPoint, без предъявления конкретных результатов. Но тут Джин c ехидной улыбкой заметил, что аудитория, наверное, захочет все-таки увидеть реальные результаты и не удовольствуется имитацией.
Невозможно было представить наши результаты яснее и выразительнее, чем это сделал Джин Майерс. Он понял, что сами по себе результаты секвенирования не произведут должного впечатления, поэтому для большей убедительности сравнил их с результатами кропотливого исследования Джерри традиционным методом. Они оказались идентичными! Таким образом, Джин сравнил результаты нашей сборки генома со всеми известными маркерами, картированными на геноме плодовой мушки десятки лет назад. Из тысяч маркеров только шесть не совпадали с результатами нашей сборки. Тщательно исследовав все шесть, мы убедились, что секвенирование в Celera было верным и что ошибки содержались в работах, выполненных в других лабораториях старыми методами. Под конец Джин сообщил, что мы только что приступили к секвенированию ДНК человека, и с повторами здесь наверняка будет меньше проблем, чем в случае дрозофилы.
Последовали громкие и продолжительные аплодисменты. Не прекращавшийся и во время перерыва гул означал, что мы своего добились. Кто-то из журналистов заметил участника государственного проекта генома, сокрушенно качающего головой: «Похоже, эти мерзавцы действительно собираются все сделать»1. Мы покинули конференцию с новым зарядом энергии.
Оставалось решить две важные проблемы, и обе были нам хорошо знакомы. Первая — как публиковать результаты. Несмотря на подписанный с Джерри Рубином меморандум о взаимопонимании, сотрудники нашего бизнес-отдела не одобряли идею передачи ценных результатов секвенирования дрозофилы в GenBank. Они предлагали разместить результаты секвенирования плодовой мушки в отдельной базе данных в Национальном центре биотехнологической информации, где ими сможет пользоваться каждый при одном условии — не в коммерческих целях. Вспыльчивый, постоянно курящий Майкл Эшбернер из Европейского института биоинформатики был крайне этим недоволен. Он считал, что компания Celera «всех надула»2. (Он писал Рубину: «Что, черт подери, происходит в Celera?»3) Коллинз тоже был недоволен, но что гораздо важнее, недоволен был и Джерри Рубин. В конце концов я все-таки отослал наши результаты в GenBank.
Вторая проблема касалась дрозофилы — у нас были результаты секвенирования ее генома, но мы совершенно не понимали, что они означают. Нужно было проанализировать их, если мы хотели написать статью, — так же, как четыре года назад в случае с Haemophilus. Анализ и описание генома мушки могли занять более года — а у меня такого времени не было, потому что теперь следовало сосредоточиться на геноме человека. Обсудив это с Джерри и Марком, мы решили вовлечь в работу над Drosophila научное сообщество, превратив это в увлекательную научную задачу, и таким образом быстро продвинуть дело, устроить из скучного процесса описания генома веселый праздник — наподобие международного скаутского слета. Мы назвали его «Геномное Джамбори» и пригласили ведущих ученых со всего мира приехать в Роквилл примерно на неделю или дней на десять — проанализировать геном мушки. На основе полученных результатов мы планировали написать серию статей.
Идея всем понравилась. Джерри начал рассылать приглашения на наше мероприятие группам ведущих исследователей, а специалисты по биоинформатике Celera решали, какие компьютеры и программы понадобятся, чтоб сделать работу ученых максимально эффективной. Мы договорились, что Celera оплатит им расходы на проезд и проживание. Среди приглашенных были и самые мои суровые критики, но мы надеялись, что их политические амбиции не повлияют на успех нашей затеи.
В ноябре к нам прибыло около 40 специалистов по дрозофиле, и даже для наших недругов предложение оказалось слишком привлекательным, чтобы от него отказаться. Вначале, когда участники поняли, что им предстоит проанализировать более ста миллионов пар оснований генетического кода в течение нескольких дней, ситуация была довольно напряженной. Пока вновь прибывшие ученые спали, мои сотрудники круглые сутки трудились, разрабатывая программы решения непредвиденных проблем. К концу третьего дня, когда оказалось, что новые программные средства позволяют ученым, как сказал один из наших гостей, «за несколько часов делать потрясающие открытия, на которые раньше уходила чуть ли не вся жизнь», обстановка разрядилась. Ежедневно в середине дня, по сигналу китайского гонга все собирались вместе — обсудить последние результаты, решить текущие проблемы и составить план работы на следующий раунд.
С каждым днем дискуссии становились все увлекательнее. Благодаря Celera, у наших гостей появилась возможность первыми заглянуть в новый мир, и то, что открывалось взору, превосходило ожидания. Скоро оказалось, что нам не хватает времени обсудить все, что хочется, и понять, что все это значит. Марк устроил праздничный ужин, который продолжался очень недолго, так как все быстро устремились обратно в лаборатории. Скоро обеды и ужины поглощались прямо перед экранами компьютеров с выведенными на них данными о геноме дрозофилы. Впервые были обнаружены долгожданные семейства рецепторных генов и одновременно удивительное количество генов плодовой мушки, аналогичных генам болезней человека. Каждое открытие сопровождалось радостными воплями, свистом и дружескими похлопываниями по плечу. Как это ни удивительно, но среди нашего научного пиршества одна пара нашла время для помолвки.
Было, правда, некое опасение: в ходе работы ученые обнаружили всего около 13 тысяч генов вместо ожидаемых 20 тысяч. Поскольку в «непритязательном» черве C. elegans порядка 20 тысяч генов, многие полагали, что у плодовой мушки их должно быть больше, так как у нее в 10 раз больше клеток и даже есть нервная система. Существовал один простой способ удостовериться, что в расчетах нет ошибки: взять 2500 известных генов мушки и посмотреть, сколько их удалось найти в нашей последовательности. После тщательного анализа Майкл Черри из Стэнфордского университета сообщил, что он обнаружил все гены, кроме шести. После обсуждения эти шесть генов были отнесены к артефактам. То, что гены были выявлены без ошибок, воодушевило нас и придало уверенности. Сообщество тысяч ученых, посвятивших себя исследованию дрозофилы, потратили десятки лет, отслеживая эти 2500 генов, а теперь целых 13 600 были перед ними на экране компьютера.
Во время неизбежной фотосессии в конце работы наступил незабываемый момент: после традиционного похлопывания по плечу и дружеских рукопожатий Майк Эшбернер встал на четвереньки, чтобы я увековечил себя на фотографии, поставив ногу на его спине. Так он хотел — несмотря на все свои сомнения и скептицизм — отдать должное нашим достижениям. Известный генетик, исследователь дрозофилы, он даже придумал соответствующую подпись под фотографией: «Стоя на плечах гиганта». (Он отличался довольно тщедушной фигурой.) «Отдадим должное тому, кто этого заслуживает», — написал он позже4. Оппоненты наши пытались представить накладки в передаче результатов секвенирования в общедоступную базу данных как отступление от наших обещаний, но и они вынуждены были признать, что слет внес «чрезвычайно ценный вклад в общемировые исследования плодовой мушки»5. Испытав, что такое подлинная «научная нирвана», все расстались друзьями.
Мы решили опубликовать три большие статьи: одну по секвенированию всего генома, где Майк будет первым автором, другую — по сборке генома, где первым автором будет Джин, и третью — по сравнительной геномике червя, дрожжей и генома человека с Джерри в качестве первого автора. Статьи были сданы в редакцию Science в феврале 2000 года и опубликованы в специальном выпуске от 24 марта 2000 года, — меньше чем через год после моей беседы с Джерри Рубином в Колд-Спринг-Харборе.6 Перед публикацией Джерри организовал для меня выступление на ежегодной конференции по исследованиям дрозофилы в Питтсбурге, на которой присутствовали сотни самых видных специалистов в этой области. На каждое кресло в зале мои сотрудники положили компакт-диск, содержащий весь геном дрозофилы, а также оттиски наших статей, опубликованных в Science. Джерри очень тепло представил меня, уверив собравшихся, что я выполнил все взятые на себя обязательства и что мы прекрасно работали вместе. Мое выступление заканчивалось сообщением о некоторых исследованиях, сделанных во время слета, и краткими комментариями к данным на компакт-диске. Аплодисменты после моего выступления вызвали у меня такое же удивление и были так же приятны, как пять лет назад, когда мы с Хэмом впервые представили геном Haemоphilus на съезде микробиологов. Впоследствии статьи по геному дрозофилы стали наиболее часто цитируемыми статьями в истории науки.
Несмотря на то, что тысячи исследователей плодовой мушки всего мира были в восторге от результатов, мои критики быстро перешли в наступление. Джон Салстон назвал попытку секвенирования генома мушки неудачей, хотя полученная нами последовательность была более полной и более точной, чем результат его кропотливой десятилетней работы по секвенированию генома червя, завершение которой потребовало еще четырех лет после публикации чернового варианта в Science. Коллега Салстона Мейнард Олсон назвал последовательность генома дрозофилы «безобразием», в котором «по милости» Celera придется разбираться участникам государственного проекта генома человека. В действительности же команда Джерри Рубина сумела быстро закрыть оставшиеся пробелы в последовательности путем публикации и сравнительного анализа уже расшифрованного генома менее чем через два года. Эти данные подтвердили, что мы допустили 1–2 ошибки на 10 тысяч пар оснований во всем геноме и менее 1 ошибки на 50 тысяч пар оснований работающего (эухроматического) генома.
Однако, несмотря на всеобщее признание проекта Drosophila, летом 1999 года напряженность в наших отношениях с Тони Уайтом достигла апогея. Уайт никак не мог смириться с вниманием, которое пресса уделяла моей персоне. Каждый раз, приезжая в Celera, он проходил мимо развешанных на стенах в коридоре, рядом с моим кабинетом, копий статей о наших достижениях. А тут мы увеличили одну из них — обложку воскресного приложения газеты USA Today. На ней, под заголовком «Удастся ли этому АВАНТЮРИСТУ совершить величайшее научное открытие нашего времени?»7 был изображен я, в синей клетчатой рубашке, закинув ногу на ногу, а вокруг меня парили в воздухе Коперник, Галилей, Ньютон и Эйнштейн — и никаких признаков Уайта.
Каждый день его пресс-секретарь звонила узнать, нельзя ли Тони принять участие в кажущемся бесконечным потоке интервью, проходящих в Celera. Он немного успокоился — да и то ненадолго, когда на следующий год ей удалось добиться, чтобы его фотографию поместили на обложке журнала Forbes как человека, который смог увеличить капитализацию компании PerkinElmer от 1,5 миллиарда долларов до 24 миллиардов долларов8. («Тони Уайт превратил бедолагу PerkinElmer в высокотехнологичного ловца генов».) Тони не давала покоя и моя общественная активность.
Примерно раз в неделю я выступал c докладом, соглашаясь на малую толику из огромного количества приглашений, которые постоянно получал, потому что мир хотел знать о нашей работе. Тони даже жаловался в совет директоров PerkinElmer, переименованную к тому времени в PE Corporation, что мои поездки и выступления нарушают корпоративные правила. Во время двухнедельного отпуска (за свой счет), который я провел в своем доме на Кейп-Код, Тони вместе с финансовым директором Деннисом Уингером и главным юрисконсультом Applera Уильямом Соучем полетел в Celera, чтобы опросить моих ведущих сотрудников насчет «эффективности руководства Вентера». Они надеялись собрать достаточно грязи, чтобы обосновать мое увольнение. Уайт был поражен, когда все сказали, что если я уйду, они тоже уволятся. Это вызвало огромную напряженность в нашей команде, но и одновременно сплотило нас теснее, чем когда-либо. Мы готовы были праздновать каждую победу как последнюю.
После публикации последовательности генома мушки — к тому времени это была самая большая расшифрованная последовательность в истории — Джин, Хэм, Марк и я подняли тост за то, что выдержали Тони Уайта достаточно долго и добились признания наших успехов. Мы доказали, что наш метод будет работать и при секвенировании генома человека. Даже если бы на следующий день Тони Уайт прекратил финансирование, мы знали — наше главное достижение останется с нами. Больше всего на свете я хотел уйти из Celera и не общаться с Тони Уайтом, но поскольку еще больше я хотел секвенировать геном Homo sapiens, мне приходилось идти на компромисс. Я старался, как мог, ублажить Уайта, только бы продолжить работу и завершить задуманное.
Примечания
1. Shreeve J. The Genome War: How Craig Venter Tried to Capture the Code of Life and Save the World (New York: Ballantine, 2005), p. 285.
2. Ashburner M. Won for All: How the Drosophila Genome Was Sequenced (Cold Spring Harbor Laboratory Press, 2006), p. 45.
3. Shreeve J. The Genome War, p. 300.
4. Ashburner M. Won for All, p. 55.
5. Sulston J., Ferry G. The Common Thread (London: Corgi, 2003), p. 232.
6. Adams M. D., Celniker S. E. et al. «The Genome Sequence of Drosophila Melanogaster», Science, № 287, 2185–95, March 24, 2000.
7. Gillis J. «Will this MAVERICK Unlock the Greatest Scientific Discovery of His Age? Copernicus, Newton, Einstein and VENTER?», USA Weekend, January 29–31, 1999.
8. Ross P. E. «Gene Machine», Forbes, February 21, 2000.