全文预览

数据仓库与数据挖掘考试习题汇总

上传者:科技星球 |  格式:doc  |  页数:7 |  大小:121KB

文档介绍
4533 = 0.1869 。 2 、例 7.5 中计算得到:已知头疼的情况下,患脑瘤的概率是 0.007867 ;而例 7.7 中计算得到: 已知有酒精味、头疼的情况下, 患脑瘤的概率是 0.002347. 为什么“有酒精味”这个现象出现能够影响患脑瘤的状况? 事实上,从“有酒精味”到“患脑瘤”之间没有任何的因果关系,也就是说, “有酒精味”并不能影响到脑瘤的产生。但是, “有酒精味”能够影响“患脑瘤”的诊断概率。这是因为, “有酒精味”使得引起“头疼”的更多因素归为喝酒,而不是患脑瘤,从而使得“患脑瘤”的概率大大降低。 3 、贝叶斯网络的三个主要议题是什么? 贝叶斯网络的 3 个主要议题分别是:预测、诊断和历史数据训练。 4 、怎样从历史数据中训练出结点之间的条件概率或联合条件概率? 要训练条件概率 P(B|A) , 可以在历史数据中统计 A 发生的次数 T(A) , 然后统计在 A 发生的数据中 B 发生的次数 T(A,B) , 条件概率 P(B|A) = T(B)/T(A) 。要训练联合条件概率 P(C|A,B) , 可以在历史数据中统计 A、B 共同发生的次数 T(A,B) , 然后在 A、B 共同发生的数据中统计 C 发生的次数 T(A,B,C) , 联合条件概率 P(C|A,B)=T(A,B,C)/T(A,B) 。以上的符号 A、B、C可以表示某个事件,也可以表示该事件的相反事件。 5 、如果叶贝斯网络的各个结点都没有任何证据,从历史数据中如何用两种不同的方法得到各个结点的发生概率? 可以用两种方式从历史数据中得到各个节点的发生概率:( 1 )用各节点的发生次数除以总的数据条数,就是各个节点的发生概率。( 2 )首先,用第一种方法计算原因节点的发生概率, 然后计算原因节点到中间节点或结果节点的条件概率, 最后根据原因节点的概率和这些条件概率计算结果节点的概率。

收藏

分享

举报
下载此文档