首页 实验三决策树算法实验实验报告

实验三决策树算法实验实验报告

举报
开通vip

实验三决策树算法实验实验报告-.z.实验三决策树算法实验一、实验目的:熟悉和掌握决策树的分类原理、实质和过程;掌握典型的学习算法和实现技术。二、实验原理:决策树学习和分类.三、实验条件:四、实验容:1根据现实生活中的原型自己创立一个简单的决策树。2要求用这个决策树能解决实际分类决策问题。五、实验步骤:1、验证性实验:〔1〕算法伪代码算法Decision_Tree(data,AttributeName)输入由离散值属性描述的训练样本集data;候选属性集合AttributeName。输出一棵决策树。〔1〕创立节点N;〔2〕Ifsamples都在...

实验三决策树算法实验实验报告
-.z.实验三决策树算法实验一、实验目的:熟悉和掌握决策树的分类原理、实质和过程;掌握典型的学习算法和实现技术。二、实验原理:决策树学习和分类.三、实验条件:四、实验容:1根据现实生活中的原型自己创立一个简单的决策树。2要求用这个决策树能解决实际分类决策问题。五、实验步骤:1、验证性实验:〔1〕算法伪代码算法Decision_Tree(data,AttributeName)输入由离散值属性描述的训练 样本 保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载 集data;候选属性集合AttributeName。输出一棵决策树。〔1〕创立节点N;〔2〕Ifsamples都在同一类C中then〔3〕返回N作为叶节点,以类C标记;〔4〕Ifattribute_list为空then〔5〕返回N作为叶节点,以samples中最普遍的类标记;//多数 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 决〔6〕选择attribute_list中具有最高信息增益的属性test_attribute;〔7〕以test_attribute标记节点N;〔8〕Foreachtest_attribute的值v//划分samples;〔9〕由节点N分出一个对应test_attribute=v的分支;〔10令Sv为samples中test_attribute=v的样本集合;//一个划分块〔11〕IfSv为空then〔12〕加上一个叶节点,以samples中最普遍的类标记;〔13〕Else参加一个由Decision_Tree(Sv,attribute_list-test_attribute)返回节点值。〔2〕实验数据预处理Age:30岁以下标记为“1〞;30岁以上50岁以下标记为“2〞;50岁以上标记为“3〞。Se*:FEMAL----“1〞;MALE----“2〞Region:INNERCITY----“1〞;TOWN----“2〞;RURAL----“3〞;SUBURBAN----“4〞Ine:5000~2万----“1〞;2万~4万----“2〞;4万以上----“3〞MarriedChildrenCarMortgage Pep:以上五个条件,假设为“是〞标记为“1〞,假设为“否〞标记为“2〞。Agese*regioninemarriedchildrencarmortgagepep121121122121122221214121221211112222121112222121121211212112112211121121213122121212221222221222211212211211221212212111212221321211122111211121113222121312212221323311121322312112313311221321312122321311111311312112313312222324312211313322112〔3〕Matlab语句:[TreeRulesMatri*]=DecisionTree(DataSet,AttributName);六、实验结果:实验程序:function[TreeRulesMatri*]=DecisionTree(DataSet,AttributName)%输入为训练集,为离散后的数字,如记录1:11321;%前面为属性列,最后一列为类标ifnargin<1error('请输入数据集');elseifisstr(DataSet)[DataSetAttributValue]=readdata2(DataSet);elseAttributValue=[];endendifnargin<2AttributName=[];endAttributs=[1:size(DataSet,2)-1];Tree=CreatTree(DataSet,Attributs);disp([char(13)'TheDecisionTree:']);showTree(Tree,0,0,1,AttributValue,AttributName);Rules=getRule(Tree);RulesMatri*=zeros(size(Rules,1),size(DataSet,2));fori=1:size(Rules,1)rule=cell2struct(Rules(i,1),{'str'});rule=str2num([rule.str([1:(find(rule.str=='C')-1)])rule.str((find(rule.str=='C')+1):length(rule.str))]);forj=1:(length(rule)-1)/2RulesMatri*(i,rule((j-1)*2+1))=rule(j*2);endRulesMatri*(i,size(DataSet,2))=rule(length(rule));endendfunctionTree=CreatTree(DataSet,Attributs)%决策树程序输入为:数据集,属性名列表%disp(Attributs);[SValRecords]=putEntropy(DataSet,0);if(S==0)%当样例全为一类时退出,返回叶子节点类标fori=1:length(ValRecords)if(length(ValRecords(i).matri*)==size(DataSet,1))break;endendTree.Attribut=i;Tree.Child=[];return;endif(length(Attributs)==0)%当条件属性个数为0时返回占多数的类标mostlabelnum=0;mostlabel=0;fori=1:length(ValRecords)if(length(ValRecords(i).matri*)>mostlabelnum)mostlabelnum=length(ValRecords(i).matri*);mostlabel=i;endendTree.Attribut=mostlabel;Tree.Child=[];return;endfori=1:length(Attributs)[Sa(i)ValRecord]=putEntropy(DataSet,i);Gains(i)=S-Sa(i);AtrributMatric(i).val=ValRecord;end[ma*valma*inde*]=ma*(Gains);Tree.Attribut=Attributs(ma*inde*);Attributs2=[Attributs(1:ma*inde*-1)Attributs(ma*inde*+1:length(Attributs))];forj=1:length(AtrributMatric(ma*inde*).val)DataSet2=[DataSet(AtrributMatric(ma*inde*).val(j).matri*',1:ma*inde*-1)DataSet(AtrributMatric(ma*inde*).val(j).matri*',ma*inde*+1:size(DataSet,2))];if(size(DataSet2,1)==0)mostlabelnum=0;mostlabel=0;fori=1:length(ValRecords)if(length(ValRecords(i).matri*)>mostlabelnum)mostlabelnum=length(ValRecords(i).matri*);mostlabel=i;endendTree.Child(j).root.Attribut=mostlabel;Tree.Child(j).root.Child=[];elseTree.Child(j).root=CreatTree(DataSet2,Attributs2);endendendfunction[EntropyRecordVal]=putEntropy(DataSet,attribut)%计算信息熵if(attribut==0)clnum=0;fori=1:size(DataSet,1)if(DataSet(i,size(DataSet,2))>clnum)%防止下标越界classnum(DataSet(i,size(DataSet,2)))=0;clnum=DataSet(i,size(DataSet,2));RecordVal(DataSet(i,size(DataSet,2))).matri*=[];endclassnum(DataSet(i,size(DataSet,2)))=classnum(DataSet(i,size(DataSet,2)))+1;RecordVal(DataSet(i,size(DataSet,2))).matri*=[RecordVal(DataSet(i,size(DataSet,2))).matri*i];endEntropy=0;forj=1:length(classnum)P=classnum(j)/size(DataSet,1);if(P~=0)Entropy=Entropy+(-P)*log2(P);endendelsevalnum=0;fori=1:size(DataSet,1)if(DataSet(i,attribut)>valnum)%防止参数下标越界clnum(DataSet(i,attribut))=0;valnum=DataSet(i,attribut);Valuee*amnum(DataSet(i,attribut))=0;RecordVal(DataSet(i,attribut)).matri*=[];%将编号保存下来,以方便后面按值分割数据集endif(DataSet(i,size(DataSet,2))>clnum(DataSet(i,attribut)))%防止下标越界Value(DataSet(i,attribut)).classnum(DataSet(i,size(DataSet,2)))=0;clnum(DataSet(i,attribut))=DataSet(i,size(DataSet,2));endValue(DataSet(i,attribut)).classnum(DataSet(i,size(DataSet,2)))=Value(DataSet(i,attribut)).classnum(DataSet(i,size(DataSet,2)))+1;Valuee*amnum(DataSet(i,attribut))=Valuee*amnum(DataSet(i,attribut))+1;RecordVal(DataSet(i,attribut)).matri*=[RecordVal(DataSet(i,attribut)).matri*i];endEntropy=0;forj=1:valnumEntropys=0;fork=1:length(Value(j).classnum)P=Value(j).classnum(k)/Valuee*amnum(j);if(P~=0)Entropys=Entropys+(-P)*log2(P);endendEntropy=Entropy+(Valuee*amnum(j)/size(DataSet,1))*Entropys;endendendfunctionshowTree(Tree,level,value,branch,AttributValue,AttributName)blank=[];fori=1:level-1if(branch(i)==1)blank=[blank'|'];elseblank=[blank''];endendblank=[blank''];if(level==0)blank=['(TheRoot):'];elseifisempty(AttributValue)blank=[blank'|_____'int2str(value)'______'];elseblank=[blank'|_____'value'______'];endendif(length(Tree.Child)~=0)%非叶子节点ifisempty(AttributName)disp([blank'Attribut'int2str(Tree.Attribut)]);elsedisp([blank'Attribut'AttributName{Tree.Attribut}]);endifisempty(AttributValue)forj=1:length(Tree.Child)-1showTree(Tree.Child(j).root,level+1,j,[branch1],AttributValue,AttributName);endshowTree(Tree.Child(length(Tree.Child)).root,level+1,length(Tree.Child),[branch(1:length(branch)-1)01],AttributValue,AttributName);elseforj=1:length(Tree.Child)-1showTree(Tree.Child(j).root,level+1,AttributValue{Tree.Attribut}{j},[branch1],AttributValue,AttributName);endshowTree(Tree.Child(length(Tree.Child)).root,level+1,AttributValue{Tree.Attribut}{length(Tree.Child)},[branch(1:length(branch)-1)01],AttributValue,AttributName);endelseifisempty(AttributValue)disp([blank'leaf'int2str(Tree.Attribut)]);elsedisp([blank'leaf'AttributValue{length(AttributValue)}{Tree.Attribut}]);endendendfunctionRules=getRule(Tree)if(length(Tree.Child)~=0)Rules={};fori=1:length(Tree.Child)content=getRule(Tree.Child(i).root);%disp(content);%disp([num2str(Tree.Attribut)','num2str(i)',']);forj=1:size(content,1)rule=cell2struct(content(j,1),{'str'});content(j,1)={[num2str(Tree.Attribut)','num2str(i)','rule.str]};endRules=[Rules;content];endelseRules={['C'num2str(Tree.Attribut)]};endend
本文档为【实验三决策树算法实验实验报告】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥23.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
阳光心态
在单位培训
格式:doc
大小:64KB
软件:Word
页数:20
分类:教育学
上传时间:2022-07-11
浏览量:3