首页 数据挖掘导论第六章中文答案

数据挖掘导论第六章中文答案

举报
开通vip

数据挖掘导论第六章中文答案第六章数据挖掘导论1o对于每个下列问题,提供一个关联规则的一个例子从市场购物篮域,满足下列条件。同样,这些规则是主观地描述是否有趣。(一)一个规则,具有较高的支持和高的信心。答:牛奶-T面包。这种明显的规则往往是无趣的。⑹规则,有相当高的支持,但信心不足。答:牛奶金枪鱼。而出售金枪鱼和牛奶可能是高于阈值,并不是所有的事务,包含牛奶也包含金枪鱼。这种低规则往往是无趣的。(C)一个规则,低的支持和信心不足。答:食用油-T洗衣粉。如此低的信心规则往往是无趣的。(d)规则,低支持和高的信心。答:伏特加-T鱼子酱。这样的规则...

数据挖掘导论第六章中文答案
第六章数据挖掘导论1o对于每个下列问题,提供一个关联规则的一个例子从市场购物篮域,满足下列条件。同样,这些规则是主观地描述是否有趣。(一)一个规则,具有较高的支持和高的信心。答:牛奶-T面包。这种明显的规则往往是无趣的。⑹规则,有相当高的支持,但信心不足。答:牛奶金枪鱼。而出售金枪鱼和牛奶可能是高于阈值,并不是所有的事务,包含牛奶也包含金枪鱼。这种低规则往往是无趣的。(C)一个规则,低的支持和信心不足。答:食用油-T洗衣粉。如此低的信心规则往往是无趣的。(d)规则,低支持和高的信心。答:伏特加-T鱼子酱。这样的规则往往是有趣的2o考虑到数据集显示于 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 格6.1。(一)计算支持项集{e},{b、d},{b、d、e}通过治疗每个事务ID作为一个市场购物篮。答:Table6.1.Exampleolmarketbaskettransactions.CustomerIDTransactionIDItemsBought1()001gd,e}10024{a,b.c.e}20012[a.b.d.e}20031{a弓c30015[b,y}30022{皿}40029jc,d]40040恥}50033{仙d,e}50038{a,b,e}s(2})=75=0.8$(卩4})=-|=0-2Ois({6,d,e})=—=0.2|(6・1)(b)UsetheresuItsinpart(a)tocomputetheconfidencefortheassociationruIes{b,d]>{e}and{e}{b,d}.Isconfideneeasymmetriemeasure?c、重岌部分(一)通过将每个客户ID作为一个市场购物篮。每个项目应被视为一个二进制变量(1如果一个项目出现在至少有一个交易购买的顾客,和0否则。),(何)=1=0.8s({“d})=1=14s({4>,d.e})=—=0.8dc(bd——>e)c(e—bd)e没有明显关系s1,s2,d和c23.(a)Whatisthoconfidencefortherules0一*AandA——►0?Answer:c(0——A)=s(0——4).£(必一0)=100%.(b)Letci,C2,andegbetheconfidencevaluesoftherules{p}—»{q}?{p}—{g,r},and{p.r}—respectively.Ifweassumethatc】,co,andC2liavedifferentvalues,whatan?thepossiblerelationshipsthatmayexistamongci.c?、andC3?Whichrulehasthelowestconfidence?Answer:_班PUQ)_"^CpTd5(pur)Considerings(p)>s(pUq)2s(pUr)Thus:cl>c2icc3>£2.Thereforec2hasthelowestconfiden8・(€)Repeattheanalysisinpart(b)assumingthattheruleshaveidenticalsupport..Whichrulehasthehighestconfidence?Answer:Considerings(pUq)=s(pUqUr)buts(p)>s(pUr)Thus;c3>(cl=c2)所以c2有最低的置信度(d)Transitivity:SupposetheconfidenceoftherulesA>BandB——>Carelargerthansomethreshold,minconf.IsitpossiblethatA—>Chasaconfidonoelessthanminconf?Answer:Yes.Itdepends-onthesupportofitemsA,J?,andC.Forexample:s(A.B)=60%s(A)=90%s(A.C)=20%s(B)=70%s(B.C)=50%s(C)=60%LetmincoTif=50%Therefore:c(A—>£?)=66%>minconfc(B—>C)=71%>minconfButc{A—C)=22%^2»,••,At})二…,4卜,Agi})(6.2)Forexample,wocancomparethevaluesofQfor{4.B}and{A.D.C].<({AB})=min(e(4一—>£)).s(A.B).=min=s(7)max(5(4),s(Z?))C({AH,C})=min(c(X—BC),c(Z?—AC),c(CAB))(s(A,B.C)s(A.B.C)s(A.B.C\='s(A)5S(B}rS(C)'=s(乩SC)max(s(X).s(I?).s(C))因为年代(A,B,C)W年代(A,B)和max(s(个),s(B),s(C))Nmax(s(一个),s(B)),B})$g({A,B,C})o(b)“isnon-monotonc.Wecanshowthisbycomparing7/({4.£?})against4({"C})・t/({4:Z?})=min{c(A一一A))_s(A.B)fs(A,B)s(A,B)、叫(吋窗)~max(s(A)5s(B))(6.5)r}({A.B.C})=min(c(AB一C\c(AC一B),c(BC―A))s(A,B,C)s(A,B,C)s(A,B,C)s(AyB)5$(A,G)'gC)max($(4,B),C))(6.6)Since旳9念…'去一1))min(s(一个),s(B),s(0)Wmin(s(一个),s⑻)、X]({A,B,C})可以大于或小于□({A、B})o因此,这些措施是单调。考虑表£・23中显示的购物篮事务。^6-23购物篮事务II务ID购买项1I牛奶,睥湖,尿布)2{曲包,黄油,牛奶)3彳牛奶,尿布.WFI4{面包.黄油,悦干}5{啤酒,饼千.床布}6件孙琢祁,面包.就油)7{而包「黄袖,尿布)8(呷酒.尿布)9I牛奶.尿怖.面包.黄油310(啤濟.饼干}(a)从这些報据屮,能够提収出的黄联规则的最大数量是芻少(包括零支持段的规则〉?(b>能够提取的频繁项集妁最大长度是多少(假定最小支持度>0)?〔0写出从该数据集中能够提取的3•项集的艮大数虽的表达式°(d》找出一个共有蚣大支持度的项集(长皮为2或更大)。(e)战出~对项a和k使御规则{切一{切和卩}~(切具有相同的胃信度.(一)的最大数量,可以提取关联规则从这个数据(包括规则,零支持)?答:有六项数据集。因此总规则的数量是602。(b)什么是频繁项集的最大大小,可以提取(假设用来〉0)?答:因为最长的事务包含4项,最大频繁项集的大小是4。(C)编写一个表达式最大数量的大小3项集,可以源自这个数据集。答:©=20.找到itemset(大小为2或更大),拥有最大的支持。答:{面包、黄油}。找到一双项目,a和b,这样的规则{一}{b}和{b}{一}有同样的信心。答:(啤酒,饼干)或(面包、黄油)。考虔卜而的颇繁3-项集时集合:{1,2.3}J1,2,4),{1.2,3},{1,3.4},{1,3,5},{2,3,4},{2.3,5),{3,4,5}假定数据傑中只有5个项.列出采用幵■合并策略,由候选产生过程得到的所有候选4-项集。列出由Apriori算法的候选产生过程得到的所立候选弘项躺列出Apriori算袪候选剪枝步辍后剩下的所有候选4顼集。(b)Listallcandidate4-itemsetsobtainedbythecandidategenerationproccduieinAprioriAnswer;{123再{123品{124间,{2Wh{2总4冏・(c)Listallcandidate4-itemsetsthatsurvivetheCandidatepruningstepoftheApriahalgorithm.Answer:{1,2.3,4}AprioriH法使用产生-计数的策略找出频繁项集。通过合并-对大小为氏的频繁项集得到一个人小为好1的候选项集(称作候选产生步骤)。在候选项集剪枝步骤中,如果一个候选项集的任何-个子集足不频繁的.则该候选项集将被丢弃。假定将勿戒加算法用于表£24所示数据集,最小支持度为30%,即任何一个项集在少于3个事务中出现就被认为足非频繁的。表6・24购物篮事务的例子事务(D购买项Jla.b.d.e}2{b.c、d}32,btd^}4仏5{b,g
本文档为【数据挖掘导论第六章中文答案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_598372
暂无简介~
格式:doc
大小:138KB
软件:Word
页数:0
分类:
上传时间:2020-05-18
浏览量:87