全文预览

哈尔滨医科大学《数据挖掘》课后

上传者:梦溪 |  格式:ppt  |  页数:20 |  大小:523KB

文档介绍
来构建基因相关网络,可以把每个基因当作数据对象,然后计算对象间的表达相关度。那么计算这种相关度可以使用___皮尔森相关系数__测度。阐述你选择这种测度的理由?并叙述怎样利用这种测度来构建网络。(因为是连续的)Р疾病的发生、发展与通路密切相关。目前已知的通路有100个。研究人员发现皮肤癌与其中的30个通路相关,中风与其中的20个通路相关。而且这两个疾病共享的通路有10个。选择一种方法计算这两个疾病的相似性值??SMC = (f11 + f00)/(f01 + f10 + f11 + f00) ? = (10+60) / (10+20+10+60) = 0.7 ?J = (f11) / (f01 + f10 + f11) ? = 10 / (10 + 20 + 10) = 0.25Р习题-6Р随机森林方法原理?怎样利用多棵决策树来寻找疾病风险基因?随机森林与组合决策方法的异同点?详细阅读组合决策方法论文?组合决策还适用于解决哪些生物学(医学)问题Р习题-9Р稀疏化的好处?OPOSSUM聚类算法中重要一个步骤是稀疏化,叙述该稀疏化方法?Chameleon算法使用接近性和互连性概念以及簇的局部建模。关键思想是:使用______和______概念,仅当合并后的结果簇______原来的两个簇时,这两个簇才合并。?Jarvis-Patrick(JP)聚类算法首先计算______图,然后使用相似度阈值,稀疏化该图找出稀疏化图的连通分支。Р基于SNN密度的聚类不象JP聚类简单地使用域值,然后取______作为簇,基于SNN密度的聚类使用基于SNN密度和_______方法。?SNN密度的优势。Р习题-6Р考虑下表中的数据?(a)计算项集{e},{b,d}和{b,d,e}的支持度.?(b)利用(a)计算的结果,计算关联规则{b,d}=>{e}和{e}=>{b,d}的置信度。置信度是对称的度量吗?

收藏

分享

举报
下载此文档