我的世界林业(Forestry)杂交基因分析与子代性状简述
现在的情况是,本百科上只有详细介绍物种杂交产生新品种(即基因突变)的情况,没有详细介绍物种遗传趋势的。
就算有也只是在养蜂-入门篇里提了一嘴,而且不易懂。
因此,为了各位同好们的游戏体验,我来将这篇教程补上。
而且本篇教程是刻意不考虑突变的,所以在某些表述上莫要较真
敝人第一次写教程,如有表述不当或与事实不符请务必指出。
若想了解林业的物种进化(或基因突变),请阅读如下几篇文章:
另外,由于本教程涉及生物学与部分数学知识,具有部分专业词汇,请先学习(复习)相关内容,或是当个乐子看过去。
那么我们开始!
遗传概述与理论基础
我们先来回顾遗传与变异的定义:
子代与亲代间或子代个体间性状存在相似的现象,在生物学上称为遗传。
子代与亲代间或子代个体间性状存在差异的现象,在生物学上称为变异。
相信各位同好都绘制过遗传图解,如图:
这是豌豆茎的直生弯生的不同基因型杂交遗传图解,霉好的回忆。
遗传图解是本教程的主要研究工具,它能为我们反映遗传过程。
我们现在来推导理论:
首先,大量的实验表明,林业作者们图省事并没有把杂交原理写进代码,取而代之的是数学上的组合排列方式。
排列(arrangement),是指从n个元素中取出m个元素,并按一定顺序排成的一列。
也就是说,从甲、乙、丙三个人取出两个,则有甲乙、甲丙、乙甲、乙丙、丙甲、丙乙六个排列。
由此可见,排列这一方式(或名词?)是考虑顺序的。
上面这个例子中,将全部的3个人中抽出了2个,写出它们所有的排列,共6种。
事实上,我们定义从n个元素中取出m个元素所构成的排列数量为其排列数(number of arrangement),记为
计算公式为:
这个叹号的意思是阶乘(n!=1×2×3×….×n,同时定义0!=1),不是用来增强感叹语气的。
与排列相对的是组合(combination),它是不考虑顺序的。
同样,组合也有组合数(number of combination),从n个元素中取出m个元素的组合数记为
计算公式为:
一般地说,正常杂交应考虑组合而非排列,而我们要用到排列,虽然那个“组合”已经在我的教程里挂了一个月,还没有高中的大佬指出。
这也就是说,本模组的杂交时的基因遗传是考虑顺序的。
正常杂交时因为等位基因中每两个不同型必有一个是显性,所以任意两异基因同对时,顺序均已确定,故不考虑顺序,是组合。
算了,多说无益,直接上图。
(别喷了,自己画的)
由此可见,哪个基因在前面,哪个就是显性基因。
这也解释了某个基因时而是显性时而是隐性的现象。
但请注意:此处讨论的性状不包括性别,在林业原版及部分附属模组中,植物无性别区分,蜜蜂与蝴蝶子代雌性数量固定(子代雌性蜜蜂数为1,蝴蝶尚待考证)。
在上图中,两个不同基因相结合可形成两组基因型,由此,我们继续推导出一切有可能的情况。
顺带一提,笔者将这种神奇的基因组合称为反孟德尔式杂交(Anti-Mendelian Hybridization),村规私设,请勿模仿。
下面,定义基因N代表的性状为N,P(N)为子代显性状N的概率。
并且仅针对于一种性状而言,其它性状不会造成干扰,各自独立。
同时,笔者会利用排列数公式计算各情况的可能性
一、纯种杂交
设亲代双方基因型均为AA,令其杂交
实质:两同基因结合
结论:子代基因必为AA,即P(A)=1
二、二基因同异杂交
先解读一下类型名称,“二基因”指在同一性状基因中,亲代双方间仅存在两种基因,“同异”指亲代中一方为纯种,另一方为混血(基因)的情况
设亲代基因型分别为A1A1,A1A2
实质:杂交过程如图
此时,亲代共四种生殖细胞(A1,A1,A1,A2),子代任取两种进行排列,排列数为
其中含A1且在前的排列共9种,含A2的且在前的排列共3种,所以显A1的概率为9/12=0.75,A2的概率为3/12=0.25
A1A1结合概率为0.5,A1A2结合概率为0.5,在后者情况下,显A1与显A2概率各占0.5,与计算结果相符
结论:子代基因型有三种,且A1A1:A1A2:A2A1=2:1:1
即P(A1)=0.75,P(A2)=0.25
三、二基因异异杂交
“异异”指亲代双方基因型在同一性状中,均为混血
设亲代基因型均为A1A2
实质:杂交过程如图
其中含A1且在前的排列共6种,含A2的且在前的排列共6种,由排列数公式计算得显A1的概率为6/12=0.5,显A2的概率为6/12=0.5
结论:子代基因型有四种,且A1A1:A1A2:A2A1:A2A2=1:1:1:1
即P(A1)=0.5,P(A2)=0.5
四、二基因同同杂交
“同同”指亲代在同一性状中,双方均为纯种的情况
设亲代基因型分别为A1A1,A2A2
实质:还是看图
这是二基因情况下最简单的图谱,其中含A1且在前的排列共6种,含A2的且在前的排列共6种,由排列数公式计算得显A1的概率为6/12=0.5,显A2的概率为6/12=0.5
结论:子代基因型有两种,且A1A2:A2A1=1:1
即P(A1)=0.5,P(A2)=0.5
五、三基因单同混交
“三基因”指亲代中同种性状仅有三种基因的情况,“单同”指亲代仅有一方为纯种,“混交”是杂交的特殊形式,一般指不同种(一般为同界)生物相杂交,在本文中用于描述多种基因结合的情况
设亲代基因型分别为A1A1,A2A3
实质:三种不同基因混交,属于本模组中的常见现象,过程如图所示
排列数仍是12,此时其中含A1且在前的排列共6种,含A2的且在前的排列共3种,含A3的且在前的排列共3种,故显A1的概率为6/12=0.5,A2的概率为3/12=0.25,A3的概率为3/12=0.25
结论:子代基因型有四种,且A1A2:A1A3:A2A1:A3A1=1:1:1:1
即P(A1)=0.5,P(A2)=0.25,P(A3)=0.25
六、三基因对同混交
“对同”指在同种性状中,亲代双方基因型间有一个相同基因(即两个均为混血)的情况
设亲代基因型分别为A1A2,A2A3
注意:此处重复的基因为A2,而前面均为A1,在计算时请先分辨重复基因,再套入公式进行计算
实质:如遗传图谱
此时其中含A1且在前的排列共3种,含A2的且在前的排列共6种,含A3的且在前的排列共3种,故显A1的概率为3/12=0.25,A2的概率为6/12=0.5,A3的概率为3/12=0.25
结论:子代基因型共七种,且A1A2:A2A1:A2A2:A1A3:A3A1:A2A3:A3A2=1:1:2:1:1:1:1
即P(A1)=0.25,P(A2)=0.5,P(A3)=0.25
七、四基因混交
“四基因”指在同一性状中,亲代基因型具有四种基因的情况,即双方均为混血,且基因型中基因各不相同的情况
设亲代基因型分别为A1A2,A3A4
实质:该情况最为常见,也不必绘制图谱,通过枚举即可
此时其中含A1且在前的排列共3种,含A2的且在前的排列共3种,含A3的且在前的排列共3种,含A4的且在前的排列共3种,故显A1的概率为3/12=0.25,A2的概率为3/12=0.25,A3的概率为3/12=0.25,A4的概率为3/12=0.25
结论:子代基因型共八种,任意两基因均能组成两组基因型,每组基因型概率均等
即P(A1)=0.25,P(A2)=0.25,P(A3)=0.25,P(A4)=0.25
以上即所有情况,列举完毕。
结论:
在林业(Forestry)中,两同一物种生物杂交时,同一性状基因:
-
纯种杂交时,子代均为纯种
-
二基因杂交时,若亲代两基因数目均等,则子代分别显两性状,概率均等,若两基因数目不等,则子代显两性状概率比为3:1,其中基因数目多者概率大
-
三基因混交时,子代显三种性状概率比始终为2:1:1,基因数目多者,概率较大
-
四基因混交时,子代显四种性状机会均等
计算必要注意事项
我,作为本教程的作者,在此斗胆直言:
但凡逐字看过上面内容,都能大致清楚林业杂交遗传机理。
所以,看不懂的暂且莫喷,重新读几遍即可,比你学线代微积分容易的多。
但是有很多玩家在实际应用的过程中不会算数,这可了得?
所以,敝人列举几个常用的公式,以便各位同好进行预期计算。
-
若想求子代中显某性状(或含某基因组)的大致数量,公式为:
c(数量)≈a(总数)×p(单次概率,见上表)
-
若想求子代中至少n个个体显某性状(或含某基因组)的概率,公式如下:
其中,中下标i=n意指i最小值取n,中上标a意指i最大值取a,横过来的“M”读作“sigma”,功能为将右侧i取上下界内(含上下界)所有整数值时的所有代数式作连加运算。
看不懂?它其实等价于右式,只是更严谨的表述(毕竟a=n+1时右式就不正确了)。
-
若想求子代中同时显n种非相对性状概率,公式如下:
其中多数符号和上式意义一致,其中的希腊字母是pi,即π的大写形式,功能相似,只是连加变为连乘,p与下标意为某种性状(或基因)的单次遗传概率,共n种。
-
若想求同时显n种非相对性状的子代大致数量,则须将三式与一式进行复合求解,即将三式结果代入一式计算。
-
若想求子代中至少p个个体显q类某性状(或含q类某基因组)的概率,则须将三式与二式进行复合求解,即将三式结果代入二式计算。
什么?还要更高阶的复合公式?
我认为,以子代如此少的数量,不足以支撑这样高阶的复合公式,而且诸君应该用不到,即使用到了也可以自行推导,毕竟基础公式都已写出。
什么?还要子n代的计算公式?
在林业中,只有亲代和子一代的研究是最有价值的,因为子n代的性状取决于子(n-1)代,所以诸君完全能按照首两代的结果进行递推,仅是计算量大了点,同学们加油(毕导音)。
什么?还要考虑突变的计算公式?
我只能说两句:
-
我确信它有一种美妙的模型,但是这里空白太小,写不下。
-
但凡会点偷代码的手艺(不特指某国产沙盒游戏)就不会问这个问题,请自己去林业模组的两千多个文件夹,上万条代码里寻找秘密。
如果还有某些计算上的问题,欢迎到下方评论区文明交流,或是对照教科书和上面公式看看自己算错了些什么。
最后,非常重要的一件事,如果上文表述或公式出现错误,请在下方评论区反馈,敝人将不胜感激。
实践测试与应用
(我是占位符)
结语
全文总结
本文主要探讨了,在林业(Forestry)模组中,物种的遗传趋势,与不同情况下,子代的性状与基因分布。通过比对探究,我们了解到在正常杂交中,物种基因遵照组合的方式进行分布,而在本模组中,物种基因遵照排列的方式进行分布,并使用排列数公式,与绘制非孟德尔式遗传图谱,计算子代各性状与基因型的获得概率,给出了一定的计算方式,使玩家能够进行粗略的预期计算。最后,我们针对上述模型和公式,进入游戏做了实验,进行验证,在(占位)次实验中。对于模型,在(占位)次采样中,多数试验结果与模型相似,但还有(占位)的误差,多次试验后,我们发现试验次数越多,结果越趋近于模型,这证明了本模型的正确性。对于公式,我们针对代码,绘制了(占位)的遗传流程图,共计(占位)张,通过分析流程图,我们确定了公式的准确性。此外,我们还针对(占位)的实际场景与问题,为玩家提供了应用的实例,供玩家对照应用。
教程之外的话
注:本段与教程无任何关系,可直接跳过至下方评论区,但是我希望各位能看完
经过两个月的艰苦奋斗,我终于写完了这篇教程的大致框架。
下面这段话是会考前的珍贵资料:
Emmmm…..
诚如各位所见,这里什么也没有。
敝人此时正值地生会考前夕,没有过多的精力进入游戏进行实验验证。
而且启动器也出了故障…..
…..好罢,等放假有时间了,我会回来把这几句话划掉的。
还请期待。
我还是那句话,当个乐子看过去即可。
这篇教程是我在精神与肉体处于极点的情况下写出的,这段时间里,胃痛与腹泻已是家常便饭,往往只是熬两个小时的夜,第二天起床,便会头痛不已。
我曾不止一度以为我早已罹患抑郁,每天夜深人静,我便会不由自主地对空说话——对某个幻想出的人说话、对某个仅有一面之缘的人说话、对不知多少年后的我说话。
在这样的情况下,坚持写教程完全出于热爱。
热爱理科,热爱研究,热爱这个和谐的社区。
我曾在冬至时,在户外站上三个小时,验证太阳高度角模型,曾为了计算风阻下的抛体运动轨迹,从零开始学微积分,直到凌晨三点不合眼,曾为了一段教程,从名词连语法到标点,到处翻书,反复修改二十余次。数理化真的有种神奇的魔力,它能使一些人永远厌烦理科,也能使一些人永远热爱理科。
我曾听好友推窗兄说,他所处的班级,终日只有谎言与暴戾,优者无可优,劣者犹劣,无法与任何人交谈,但身处社区,人都是友善的,环境总是守序的,他为百科撰文,完全自发。这也是我决定写教程的理由。
其实每个教程作者,都可算作一个科研工作者,而科研工作,最为重要的是实事求是。
实事求是,便是说实话了。只是四个字,许多人却为此丢过性命。一个揭发欺凌者的同学,最终被欺凌致死;一个披露企业丑闻的记者,最后被抛尸荒野;一个坚持立场的公职人员,却因压力自缢而亡。
如此多的例子,我们是数不过来的,容我简短地讲述一番,舍命求真理的故事。
很久以前,地中海沿岸是学术圣地,但是一个叫希帕索斯的,勇于追求真理的人,却被毕达哥拉斯的学生扔进了大海。他发现了无理数,发现了违背他们老师提出真理的反例,于是他便不能继续活着,众学徒将其谋杀,再伪装成捍卫真理的勇士,不知各位读者如何想。
往后推数百年,又有哥白尼,他确是凭着严密的推导,提出“日心说”,无疑,这又是一个忤逆宗教与旧知识的理论。就在教廷提出逮捕哥白尼后不久,他死于贫病交加。这教廷未害成哥白尼,却杀死了布鲁诺,又加害于伽利略,两个敢于抵抗旧势力的人。
一九四六年,伟大的民主战士李公朴、闻一多,为了争取民主和平,争取政协会议的重开,相继倒在特务的枪口下。“而他只不过用口说说话,用笔写写字,而所写的,所说的,无非是一个没有失掉良心的中国人的话”。他们虽不是科学家,但都是为了真理而献身的人。
综上所述,我认为,每个为人们写作的人,每个实事求是的人,都是值得敬佩的。
为众人抱薪者,不可使其冻毙于风雪!
为众人引路者,不可使其困厄于荆棘!
我相信,正义是杀不完的,因为真理永远存在!
人最宝贵的是生命。每个人的生命只有一次。人的一生应该这样度过:当回首往事的时候,他不会因虚度年华而悔恨,也不会因为碌碌无为而羞愧。在临终的时候,他能够说:“我把所有的生命和精力,都献给了世界上最壮丽的事业——为人类的解放而斗争。”
——奥斯特洛夫斯基《钢铁是怎样炼成的》
感谢各位能看到这里,我明白这种东西放在教程里很水,也很无用,但这可以说我六分之一多的人生中的力量之源,相信这种力量能够推动更多人心存希望,心向光明。毕竟希望在任何时代,都是和钻石一样珍贵的东西。
又及:希望各位不要按动推荐按钮,教程是写给需要的人看的,如果有人真的需要,他必然会自己来找。在此化身姜太公,线放长,愿者都来上钩(笑)。
鸣谢
猝不及防突然收尾,第一时间却不知要感谢谁。
那就————
感谢站长重生,非常及时地给我答疑解惑,本篇的公式与杂交遗传图解都是靠站长的提示贴上去的。
感谢推窗兄,在本篇的写作过程中,给予我技术上的支持与写作范例,本篇的开头参考了推窗兄的直线交点方程找要塞与原始人发家史。
感谢泽瑞兄,在写作过程中给予我理论支持,本篇中“等位基因”与“自由组合定律”“分离定律”就是泽瑞兄告诉我的。
感谢加一姐,在理论研究中充当敝人的出气筒,一位文科女几乎每天中午都要听我讲高等数学知识,苦了加一姐。
感谢夏漱姐,作为敝人文章的首位评论员,在模型构建初期,给予我持续试错并不断修改直至成型的动力。
感谢坩埚(通流琥珀金制),为我提供线性代数的实践应用模型,为我下一项研究提供方向及思路。
感谢鸭梨不酸,在拍视频闲暇之余为我提供几分欢乐,使我不至于过度封闭而抑郁不已。
感谢模组百科,打发了我近五年的无聊时光,使得我结识了一大堆同好们(敝人2018年入站)。
感谢B站,给我推荐了许多高等数学、大学物理、流体力学的优质课程以及扒代码、写模组的教程。
感谢人教社,提供了从小学到高中—大学衔接的所有数理化电子课本。
感谢公式编辑器,没有它就不会有连加与连乘符,以及同列上下标与多级下标。
最后感谢我自己,这不得每个细胞都感谢一遍?
差点忘了最重要的事——
特别感谢:所有看完教程的读者,愿你们明天会更好。
参考资料
第四单元 物种的延续
第四章 生物的遗传与变异
第一节 遗传的物质基础
第二节 性状的遗传
第四节 生物的变异
第一章 遗传因子的发现
第十章 概率
10.1 随机事件与概率
10.2 事件的相互独立性
第六章 计数原理
6.2 排列与组合
第七章 随机变量及其分布
7.2 离散型随机变量及其分布列