Когда я занялся работой, один пример из которой был приведен выше, мои первые результаты шли вразрез с выводами Крика. Это было очень заманчиво - опровергнуть самого Крика, столь прославленного своими работами по коду.
У меня получались интересные вещи. Когда расчеты были доведены до конца, оказалось, что генетический код допускает неожиданно мало замещений - меньше, чем этого следовало бы ожидать для триплетного кода. Неужели код вовсе не триплетный, как все думали, а диплетный? А почему бы и нет? Ведь вывод о триплетности следует только из одной серии опытов Крика с бактериофагами, причем к своему заключению авторы пришли окольным путем. Нельзя ли как-нибудь совершенно независимо проверить степень "плетности" кода?
Оказывается, можно. Вспомним задачу о превращении кошки в мышку. Пусть мы не знаем, как называются хищник, насекомое и грызун, даже не знаем, из каких букв составлены их имена, более того - не знаем, сколько букв в словах. Но если известно, что с помощью двух "ходов" грызун превращается в хищника, значит в их именах две отличающиеся буквы, а следовательно, и сами слова состоят не менее чем из двух букв.
А если мы знаем, что "грызун" (мышка, чего нам, однако, неизвестно) превращается в "часть корабля" (корма) в четыре хода (мышка - мошка - кошка - корка - корма), то мы можем утверждать: каждое слово состоит не менее чем из четырех букв, хотя мы не знаем ни одного слова и ни одной буквы. На самом деле эти слова, состоят из пяти букв, но ведь мы не утверждаем, что из четырех, мы говорим - не меньше, чем из четырех. А если мы соберем большой материал по таким переходам, то сможем говорить, что наибольшее число переходов соответствует длине слова.
Точно так же можно подсчитать для всех аминокислот число "ходов", необходимое для превращения одной в другую с помощью последовательных мутаций. Данных было достаточно. Я проделал эту довольно кропотливую работу и был потрясен: анализ приводил к тому же выводу о диплетности кода! Выходит, Крик ошибся. Что же, он не бог, с "кодом без запятых" он ведь попал впросак, почему бы ему не ошибиться и с триплетностью?
Но злорадство мое было преждевременным. Другие методы говорили, что код триплетный, хотя и в пользу диплетности свидетельствовали кое-какие данные. В чем же дело? В конце концов удалось все "привести к одному знаменателю". Оказалось, что код триплетный, но построен не случайным образом, а по определенному закону. Все триплеты, кодирующие одну и ту же аминокислоту ("синонимы"), построены сходным образом. Две буквы из трех у них совпадают и расположены одинаково, а третья варьирует. Такой код должен во многом вести себя подобно диплетному. Таким образом, удалось выяснить новое, ранее неизвестное свойство генетического кода.
Так, шаг за шагом, я исследовал одно свойство кода за другим, "выплавляя серебро" с помощью математики там, где биохимики не сумели или поленились это сделать.
А тем временем экспериментаторы продолжали наступление на проблему генетического кода. Испытывали все новые и новые искусственные РНК, готовили бесклеточные системы из клеток разных организмов, проводили опыты в разных условиях, исследовали тончайшие детали взаимодействия участников синтеза белка.
Проблема с одной стороны прояснялась, а с другой - запутывалась. Легко подсчитать, что может существовать всего 64 триплета. Но в один прекрасный день я собрал работы по коду и решил подсчитать, сколько триплетов расшифровано. И насчитал их около 90 штук! Это можно было объяснить только тем, что многие из опубликованных расшифровок сделаны неправильно.
Особенно интересные (и обескураживающие) результаты были получены в опытах по синтезу белка в бесклеточной системе в разных условиях. Например, Дэвис, Джильберт и Горини попробовали обработать рибосомы, участвующие в построении белка, стрептомицином. Начали с самого простого опыта: в качестве затравки поместили в пробирку полиуридиловую кислоту (УУУУУУУ...). Мы хорошо помним, что в этих условиях белок синтезируется только из одной аминокислоты - фенилаланина. А здесь, кроме фенилаланина, стали включаться также изолейцин, серии и лейцин. Порой изолейцина включалось даже больше, чем фенилаланина.
Стрептомицин - известный антибиотик, вещество, препятствующее размножению бактерий. Существуют разновидности микробов, нечувствительных к стрептомицину. Ученые попробовали поставить такой же опыт с рибосомами, полученными из микробов, нечувствительных к стрептомицину. В этом случае никаких ошибок не происходило: включался только фенилаланин.
Интересно, не правда ли? Ведь, может быть, именно на этом и основано лечебное действие стрептомицина? Может быть... Но от этого не легче. Раз в определенных условиях считывание информации происходит по-разному - какая может быть гарантия, что в пробирочных опытах созданы действительно условия, которые имеют место внутри живой клетки? И хорошо еще, если бы подобные результаты получались только с таким сильно действующим средством, как стрептомицин. Новые опыты показали, что на смысл триплетов влияют и такие обычнейшие факторы, как примеси некоторых солей, изменения кислотности среды, температуры и так далее. А ведь вполне можно было думать, что условия в бесклеточной системе отличаются от естественных сильнее, чем разные варианты этих новых опытов. Тут было отчего прийти в уныние...
Итак, на результаты опытов с бесклеточной системой полагаться было нельзя. Нужно найти способ расшифровки кода, используя только результаты опытов с живыми организмами. Ведь все, что было до сих пор сделано по расшифровке кода, так или иначе связано с результатами опытов с бесклеточной системой. Даже та частичная расшифровка кода, которую дал Виттман, исходя из данных своих опытов с вирусом табачной мозаики, в качестве исходной точки использовала данные Ниренберга и Очоа.
Между тем необходимые данные были. Но и здесь, чтобы это сделать, нужно было немножко математики. Самую малость. Решите для примера такую задачку. Как звать моего знакомого? Он живет в общежитии в комнате, где живут Иван, Петр и Алексей. Работает он в комнате, где работают Григорий, Семен и Иван. Ясно: его зовут Иван, потому что только одно это имя встречается в обеих группах.
Один из возможных способов расшифровки кода вполне подобен моей задаче об Иване. Мы уже знакомились с опытами по вызыванию мутаций азотистой кислотой, которая вызывает превращение "Ц" в "У", а "А" в "Г". Благодаря этому свойству азотистой кислоты можно, исходя из того, какие замены аминокислот в белках она вызывает, расклассифицировать аминокислоты на три группы.
Для этого как раз и понадобилось то, что мне удалось узнать о законе, по которому построен код. Раз для кодирования аминокислоты, как правило, необходимы лишь две "буквы" (я назвал их облигатными), а третья (ее я назвал факультативной) обычно не имеет значения, то замещения аминокислот должны быть связаны в основном с изменениями в облигатной паре. Поэтому удалось все аминокислоты разделить на три группы. В одну попали те, облигатные пары которых составлены из букв "Ц" и "А", в другую - состоящие из "У" и "Г", в третью - все остальные.
Но для расшифровки кода нужно было иметь две независимые классификации по аналогии с задачей об Иване - знать не только, кто где живет, но и кто где работает. Покопавшись в литературе и подумав, я нашел еще одну возможность. Нобуру Суеока, умный и трудолюбивый японец, живущий в США, исследовал, как состав белков разных бактерий зависит от содержания "Г" и "Ц" в их ДНК. Используя представление об облигатных и факультативных буквах, можно было и эти данные применить для решения задачи. Здесь тоже получились три группы.
Остальное было просто. Одна из групп первой классификации выглядела, например, так:
Какая пара к какой аминокислоте относится, было неизвестно, но можно утверждать, что эти четыре облигатные пары соответствуют четырем перечисленным аминокислотам. Одна из групп второй классификации выглядела следующим образом:
Эти данные тоже не дают возможности для однозначных выводов. Но сравните обе группы данных, и вам бросится в глаза, что в обеих имеется аминокислота пролин и облигатная пара ЦЦ, а все остальное не совпадает. Следовательно, пролин кодируется облигатной парой ЦЦ.
Сравнив таким же образом каждую группу первой классификации с каждой группой второй, я смог расшифровать большое число облигатных пар. Но это не единственный способ расшифровки кода без использования данных с бесклеточной системой. Другие методы подтверждали результаты, полученные в "задаче об Иване", и приносили все новые и новые расшифровки.
Вряд ли стоит рассказывать о том, что я делал дальше. Неспециалисту читать об этом было бы скучно, а специалисту нужны гораздо большие подробности. Кроме того, для специалистов я написал о результатах своей работы целую книгу примерно такого же объема, как эта. Она была издана в 1963 году. В ней кратко и сухо говорится обо всем со всеми необходимыми подробностями.
Скажу только, что в конечном счете получилось. Я заново, с помощью новых методов, более солидных с математической точки зрения, исследовал всю проблему генетического кода. При этом удалось подтвердить (совершенно другими путями) выводы, которые ранее сделал Крик об общих свойствах кода, и добавить к ним некоторые новые. Подтверждение тоже необходимо, так как полной уверенности в выводах, основанных лишь на одной группе фактов, быть не может. Что же касается расшифровки кода, то ее удалось довести почти до конца. Надежность и полнота этой расшифровки превосходили все, что было сделано другими авторами.
Вам может показаться, что я сделал "выдающийся вклад" в проблему генетического кода. Но это не так. Проблема кода развивалась слишком быстро. И не успел я получить свои результаты, как то же самое нашли и другие авторы, причем в более прямых биохимических опытах. Кое-что было сделано уже в то время, пока моя книга писалась и печаталась, кое-что вскоре после ее выхода. Некоторые из моих выводов до сих пор не "сдублированы" биохимиками, но совершено ясно, что это дело самого ближайшего будущего. Если бы разгадка кода двигалась медленнее, моя работа смогла бы оказать существенное слияние на ее ход, но этого не произошло.
Разочарован ли я? Не очень. Ведь моя работа не сводится к чисто фактическим выводам о генетической "грамматике" и "словаре". Проблема кода далеко еще не закрыта. Вполне достоверного и полного "словаря" нет. Какие из методов расшифровки кода с помощью биохимических опытов вне клетки дают верные результаты - неясно. А методов расшифровки кода с помощью данных на живом материале, кроме меня, пока никто не предложил. И при окончательной постановке точек над "и" без них не обойтись.
У моей работы есть еще одна сторона. В ней использованы статистические методы для последовательного исследования целой большой области, где они до этого в такой форме не применялись. Я думаю, что предложенные мною методы пригодятся и при дальнейших работах по коду (они могут быть очень полезны при сравнении кода у разных организмов, такая работа еще предстоит) и в других областях.
Насколько то, что я сделал, окажется существенным - покажет будущее. Ясно одно: работа не была лишней. А давать окончательную оценку своим собственным работам - дело невозможное и ненужное.