全文预览

基于动态贝叶斯模型基因调控网络构建方法的研究

上传者:随心@流浪 |  格式:pdf  |  页数:48 |  大小:0KB

文档介绍
据主要是从基因芯片中提取出的微阵列数据。首先,通常基因芯片的规模是在103到104之间,而样本的规模仅仅在101到102之间,也就是说样本的规模远远小于基因芯片上基因的规模;其次,数据中有大量的噪音,虽然随着研究的进一步发展,获得数据的技术手段在不断提高,能够把数据中的噪音控制到1%以下,但是这些噪音的存在仍然对学习结果产生很大的影响;再次,由于解析度质量不高、图像有划痕、污染以及实验错误等等原因,造成数据中存在数据丢失的现象,可能对学习结果产生影响。(2)网络学习的计算量太大很多方法比如贝叶斯网络,微分方程和布尔网络方法都存在着一个共同的缺点,就是计算复杂性太高,这个缺点使得这些模型和方法在应用到大规模的基因数据上时会有很多困难。(3)对预测的网络进行验证的难度太大。关于基因调控网络方面的具体细节我们仍然不是很清楚,而且目前我们能够掌握到的有文献支持的基因之间的调控关系是不多的,特别是数据库中的的数据具有不稳定性的特点,数据频繁地增加、删除和改动,有的数据甚至出现自相矛盾的情况,因此在进行统计分析时存在很大的困难,特别是在大规模的数据集上。1.4基因调控网络的构建方法基因调控网络中对转录水平的调控的研究方法主要分为自上而下和自下而上两种主策略。自上而下的策略是利用数学建模方法和系统生物学知识,分析基因表达数据,从而重构基因调控网络【10】。这也是目前比较常用的构建基因调控网络的。而在过去曾经占据主导地位的是自下而上的方法,它是利用计算生物学或生物学实验,先找到相互作用的基因或者或蛋白质,从而构建出子网络,最后逐步延伸到整个基因调控网络。这种方法随着研究所的深入,暴露出很多缺点来。首先,成本的问题,一般的实验室很难承担这种实验需要的专门的仪器设备所带来的高昂费用。其次,通过生这种方法得到的调控网络模型,~般体现的是局部信息,而不能从全局上表现实际基因调控的网络结构。所以目前

收藏

分享

举报
下载此文档