G开始,TAA、TGA、TAG结束。通过寻找起始密码子和终止密码子的ORF序列是寻找基因的一种重要的方法寻找ORF的成功的关键在于终止码在DNA序列中出现的频率*CG含量<50%=50%>50%终止子出现的频率<64bp即可出现一次64bp出现一次>64bp才可能出现一次*终止码出现的频率与CG含量之间的关系高等真核生物DNA的ORF的阅读障碍:基因间存在大量非编码序列(人类基因组占70%)很多基因含有内含子由于多数外显子长度<100个密码子,当读码进入到内含子时很快就遇到终止密码,从而难以判断读码的准确性*根据开放读码框(ORF)预测基因A、起始密码子ATG第一个ATG的确定(依据Kozak规则)Kozak规则是基于已知数据的统计结果所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律*Kozak规则:若将第一个ATG中的碱基A,T,G分别标为1,2,3位,侧翼碱基序列具有以下特征:第4位的偏好碱基为GATG的5’端约15bp范围的侧翼序列内不含碱基T在-3,-6和-9位置,G是偏好碱基除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基*gene1..1033?/gene="FSHB"?/gene_synonym="FSH-beta"?/note="folliclestimulatinghormone,betapolypeptide"?/db_xref="GeneID:396895"?CDS72..461?/gene="FSHB"?/gene_synonym="FSH-beta"?/note="folliclestimulatinghormonebeta-subunit;FSH-B;?follitropinbetachain;follicle-stimulatinghormonebeta?subunit;follitropinsubunitbeta;a*