III.1.2. Анализ расщеплений на малых выборках. Определение вероятностей. Определение минимального объема выборки
Часто приходится скрещивать мало плодовитых животных, не зная точно их генотипа, и проводить анализ расщеплений (в F2 или Fa) по результатам нескольких малочисленных семей. При этом возникает опасность недоучета части доминантных гетерозиготных исходных форм, в потомстве которых по случайным причинам не появилось ни одного рецессивного потомка. Недоучет гетерозигот может привести к неправильному выводу относительно генотипов родителей и к неправильному истолкованию результатов расщепления. Поскольку расщепления носят статистический характер, ясно, что при немногочисленном потомстве появление подряд двух, трех и четырех потомков с доминантным признаком еще не дает основания утверждать, что генотип исходных форм гомозиготный. По теории вероятностей можно вычислить вероятность появления двух, трех и четырех потомков подряд от гетерозиготных родителей исходя из того, что рождение каждого нового потомка не зависит от рождения предыдущего.
В анализирующем скрещивании при моногенном расщеплении вероятность появления одного потомка с доминантным признаком равна 1/2, рождение подряд двух доминантных особей возможно с вероятностью 1/4-(1/2×1/2), т. е. 25%. Рождение подряд трех доминантных особей ожидается с вероятностью (1/2)3 - 12,5%, четырех (1/2)4 - 6,2% и т. д. Следовательно, есть большой риск ошибиться в определении гомозиготности генотипа доминантной родительской особи на основании рождения подряд трех доминантных потомков в Fa. Вероятность ошибочного определения генотипа исходных форм на основании появления нескольких (2-4) доминантных потомков возрастает при скрещивании доминантных форм. В этом случае вероятность появления одного доминантного потомка равна 3/4, трех - (3/4)3 - 42,18%, четырех - (3/4)4 - 31,6%. Лишь при рождении хотя бы одного рецессивного потомка от двух доминантных особей или в анализирующем скрещивании можно с уверенностью говорить о гетерозиготности доминантного родителя в этом скрещивании. Понятно, что соотношение доминантных и рецессивных потомков в семьях из четырех особей может оказаться разным - 4:0, 3:1, 2:2, 1:3, 0:4. Путем разложения бинома (а+b)n, где а - вероятность появления доминантного, b - вероятность появления рецессивного потомка, а n - число особей в потомстве, можно определить вероятность любой из этих возможностей. Для потомства из четырех особей получаем (a+b)4 = a4+4a3b+6a2b2+4ab3+b4. Подставив в формулу вместо а и b вероятные частоты появления доминантного (3/4) и рецессивного (1/4) фенотипов, можно определить, например, как часто будут встречаться семьи с одним доминантным и тремя рецессивными потомками при скрещивании доминантных форм: 4×(3/4)×(1/4)3 = 12/256 = 0,46 - примерно в четырех случаях из ста (4,6%).
Разработаны формулы, с помощью которых можно рассчитать ожидаемое число рецессивных потомков в семье с определенным количеством детей (S), а также ожидаемое соотношение доминантных и рецессивных потомков при суммировании нескольких малочисленных семей с одинаковым числом потомков в каждой из них. Если родители гетерозиготны, то число рецессивных потомков в семье определяют по формуле: a1 = 1/4S/1-(3/4)S, где S - число потомков в семье. Например, если в семье четыре потомка, то a1 = 1/4×4/1-(3/4)4 = 1,463. По другой формуле рассчитывают ожидаемое количество рецессивов в нескольких семьях (например, в шести), в каждой из которых среди четырех потомков есть хотя бы один рецессив: ∑a1 = 1/4S×nS/1-(3/4)S, где nS - число таких семей. Для шести семей это будет 8,77 потомков из 24 - 1/4×4×6/1-(3/4)4. То же можно определить для других семей с иным количеством потомков.
Вероятность выщепления рецессивов на одну семью в анализирующем скрещивании определяется по формуле: a2 = 1/2S/1-(1/2)S (Рокицкий, 1978).
Для оценки соответствия результатов, полученных в опыте по сумме данных нескольких семей, с теоретически ожидаемыми находят ошибку фактически полученных величин по формуле: S = √(p(n-p)/n), где n - численность рецессивных потомков в опыте, р - теоретически рассчитанная численность. Достоверность различий определяют по критерию Стьюдента (Плохинский, 1964).
Таким образом, используя приемы биометрии и теории вероятностей, можно проводить генетический анализ и на малочисленных семьях.
При составлении плана эксперимента исследователь должен заранее оценить объем выборки, необходимой для анализа. Ориентиром при этом может служить рассчитанная величина выборки, которая определяется по вероятности выщепления наиболее редкого фенотипа следующим образом. Если принять вероятность выщепления редкого фенотипа, например полного рецессива, за q, а вероятность выщепления всех остальных фенотипов за p (p = 1 - q), то, используя уравнение pk = 1 - 0,95 = 0,05, можно определить расчетную минимальную величину выборки (&), необходимой для анализа, в случаях, когда вероятность выщепления такого рецессива равна 0,95. (Она может быть больше 0,99, тогда pk = 1-0,99 = 0,01.)
Например, ожидаемая частота выщепления двойных гомозиготных рецессивов при скрещивании двух дигетерозигот равна 1/16 = 0,0625, вероятность появления других фенотипов равна p = 1-0,0625 = 0,9375. Тогда pk = (0,9375)k. После логарифмирования pk = klg 0,9375 = lg 0,05, отсюда k = lg 0,05/lg 0,9375 = 47. Такой минимальный объем выборки обеспечивает проявление в расщеплении хотя бы одной особи каждого фенотипа. Учитывая возможность гибели части гамет или зигот определенного генотипа и другие причины, которые могут влиять на расщепление, эту величину следует по возможности увеличить. Очевидно, что с увеличением размера выборки возрастает точность анализа (Янушкевич, 1985).