Существуют понятия, против которых разум обывателя восстает с особенной силой. К их числу относятся статистические представления. Нередко мне приходилось наблюдать, с каким смаком иные остряки "расправлялись" со статистикой.
- Средняя глубина пруда полметра, а корова в нем утонула! Вот вам и "в среднем"! Ха-ха-ха!
- Давай, я съем два обеда, а ты ни одного - в среднем мы оба будем сыты! Гы-ы-ы!
В общем шутки как шутки. Не ниже среднего уровня. Но не советую вам так шутить, ибо это демонстрация невежества, полного непонимания статистики. Уже одни слова "в среднем" говорят о том, что величина подвержена каким-то колебаниям. Вот если бы корова утонула в пруду, глубина которого не в среднем, а повсюду полметра, это было бы, конечно, парадоксом. А что касается "средних", то потому и существует статистика, что одной средней для характеристики изменчивой величины совершенно недостаточно. Чтобы с такой величиной можно было что-то делать, нужно знать, как именно она варьирует вокруг этой самой пресловутой средней.
Игра в кости
Ничего не поделаешь: противно статистическое мышление человеческому разуму. Статистика учит, что в лотерее "счастливых билетов" нет. И это абсолютно точно, это закон математики. Однако почти каждый человек, покупающий билеты, выбирает их: либо так, чтобы номера не шли подряд, либо еще по какому-нибудь принципу. А ведь для любой комбинации билетов математическое ожидание выигрыша одинаково. Но под самым строгим секретом, сознаюсь: я знаю статистику настолько, что читал лекции в университете, однако когда покупаю билеты, то хотя я их и не выбираю, но рука немного дрожит: а какой все-таки взять? А ведь я знаю, что это совершенно безразлично.
Одна из причин того, что законы Менделя долгое время не были признаны, а после признания многие им сопротивлялись, кроется вне всякого сомнения в том, что они носят статистический характер. Увы, немало было работ, авторы которых ставили опыты, получали расщепление, отличающееся от 3:1, и утверждали, что они опровергли законы Менделя. И добавляли еще, что даже у самого Менделя никогда не наблюдалось расщепления ровно 3:1.
Все науки возникли как результат обобщения человеческого опыта, развились для удовлетворения тех или иных практических запросов. Теория вероятностей не составляет исключения. Но в отличие от других наук она, видимо, стыдится своего "происхождения". Ведь эта отрасль математики возникла в результате попыток создать теорию азартных игр, из попыток найти способ беспроигрышной игры. Сейчас теория вероятностей занимается самыми серьезными делами, но в XVI-XVII веках с ее помощью пытались предсказать результаты игры в кости, в "орлянку" и тому подобное.
Придется и нам заняться этим малопочтенным делом, потому что на примерах из подобных игр легче всего пояснить основные идеи теории вероятностей, а без нее нам дальше обходиться нельзя.
Рассмотрим самую простую из азартных игр - игру в "орлянку". В ней подбрасывают монету, и в зависимости от того, упадет ли она вверх гербом или цифрой, выигрыш достается тому или другому из партнеров. Если речь идет о нормальной (а, например, не погнутой) монете и участники играют честно, то герб и цифра должны выпадать одинаково часто. Как говорят математики: вероятность их выпадения одинакова. Значит ли это, однако, что в случае двух бросаний монеты обязательно один раз выпадет герб и один - цифра? Конечно, нет. Здравый смысл подсказывает нам, что результат может быть каким угодно, но наиболее вероятно выпадение одного герба и одной цифры. А теория вероятностей учит, что такого результата следует ожидать в 50 процентах случаев; в 25 процентах следует ожидать выпадения двух гербов и в 25 - двух цифр. Таким образом, хотя наиболее вероятный результат - один герб и одна цифра, не будет ничего удивительного, если мы бросим два раза монету, и оба раза выпадет герб.
Таким образом, для случайных событий (каким является бросание монеты) мы не можем точно предсказать определенный результат. Мы можем только предсказать вероятность того или иного результата. Характер наших предсказаний сильно зависит от числа испытаний. При однократном бросании предсказание совершенно неопределенно, вероятность обоих результатов одинакова. При двух бросаниях она тоже недалека от неопределенности. Если же мы наберемся терпения и бросим монету тысячу раз, можно ожидать, что число выпадений герба будет близким к 50 процентам. И, сделав такое предсказание, мы ошибемся несильно.
Особенно важно понять следующее обстоятельство. Теоретически при тысячекратном бросании монеты может быть 1001 разный результат. Вероятность этих результатов далеко не одинакова. Так вероятность того, что все 1000 раз выпадет герб, практически равна нулю (теоретически она равна 1:21000, то есть ничтожно малой величине). Наиболее вероятно, что выпадет 500 раз герб и 500 раз цифра. Но и эта вероятность тоже очень мала, потому что это одна из очень большого числа возможностей, хотя и самая вероятная. Если мы добьемся в опыте такого точного результата, это будет удивительным. Однако получим ли мы ровно 500 выпадений герба или 512 - все равно результат будет очень мало отличаться от ожидаемых 50 процентов.
Итак, выпадение герба в 50 процентах случаев - наиболее вероятный результат. Но при одном-двух бросаниях мы вполне можем не получить его ни разу. При сотне бросаний мы уже должны быть близки к нему, при тысяче - еще ближе. Все это точно доказывается теоремами теории вероятностей. Но на столь простом примере, как бросание монеты, наши выводы и так довольно очевидны.
Сказанное - основные идеи теории вероятностей, науки, лежащей в основе вариационной статистики, дающей способы изучения изменчивых величин. А биология на каждом шагу имеет дело с изменчивыми величинами. Например, вопрос, родится мальчик или девочка. Известно, что вероятность их рождения почти одинакова. И никто не может предсказать, родится ли в данной семье мальчик или девочка. Но ничего не стоит предсказать, сколько мальчиков и девочек появится на свет в большом городе в течение года. Если мы скажем, что на каждую тысячу окажется в среднем около 510 мальчиков, то будем недалеки от истины.
А теперь вернемся к законам Менделя. Мы говорили о том, что некоторые люди, не знающие и не понимающие статистики, пытались опровергать эти законы, утверждая, что почти никогда не наблюдается расщепления ровно 3:1. Но это как раз и следует из законов статистики. Она утверждает, что при большом числе опытов результат будет близок к ожидаемому, но она же говорит и о том, что получить точно ожидаемый результат - вещь крайне маловероятная.
В этой связи мне хочется рассказать занятный случай. Ученый (хотя дело было давно, да к тому же за границей, мне все равно не хочется называть его имени; почему - увидите) изучал наследование признаков у одной из одноклеточных водорослей. Он поставил большое число опытов и напечатал статью. А потом другой ученый обратил внимание на то, что уж больно близки результаты к ожидаемому соотношению 3:1. Он взял бумагу и карандаш (а этот второй генетик хорошо знал математику) и подсчитал, с какой вероятностью можно получить столь "хорошие" цифры. Результат оказался близким к нулю. Слишком большое расхождение с ожидаемыми результатами говорило бы о противоречии с законами Менделя, а слишком хорошее следовало истолковать как искусственную подгонку результатов под ожидаемый результат. Что именно было в этом случае - сознательная ли фальсификация или, что более вероятно, наивное отбрасывание "неудачных" результатов (это, к сожалению, бывает не так уж редко), не знаю. Да и не в этом дело. Я хотел лишь сказать, что слишком хорошее соответствие в статистике хуже, чем плохое.
Самое удивительное в работе Иоганна Грегора Менделя было то, что он сумел при тогдашнем уровне науки совершенно правильно объяснить открытые им законы. Раздумывая над полученными результатами, Мендель пришел к выводу, что наследственность прерывиста, что наследуется не большая совокупность свойства а отдельные признаки. Далее Мендель связал отдельные признаки с отдельными "наследственными задатками", или "факторами", находящимися в половых клетках. К этим представлениям он пришел потому, что иначе объяснить полученные им результаты было невозможно.
В своей статье Мендель пользовался далеко не всегда теми же словами и обозначениями, что и современные ученые. Например, то, что сам Мендель называл "задатками", в XX веке стали называть "генами". Повторяя рассуждения Менделя, мы не будем пользоваться его терминологией (в последующих главах нам все равно пришлось бы от нее отказаться), а в случаях, когда она расходится с современной, будем переводить ее на язык сегодняшней науки.