首页 《信息检索》PPT课件

《信息检索》PPT课件

举报
开通vip

《信息检索》PPT课件信息检索陆燕85427568-0(O)luyan5062@sohu.com老图书馆201精选PPT本课程的相关信息:24个学时1个学分平时成绩占30%,考试成绩占70%。平时成绩来自实习作业参考书目:1.北大、南大、东大出版的《信息检索》、《电子信息资源检索》等。2.《Google使用指南》等。3.《林业信息检索》等。主要内容第一章绪论第二章信息的相关知识第三章信息检索的基本知识第四章计算机信息资源检索第五章特种文献检索实习精选PPT第一章绪论我们在本章节需要完成的学习任务:信息检索的概念(what’sit?)信息...

《信息检索》PPT课件
信息检索陆燕85427568-0(O)luyan5062@sohu.com老图书馆201精选PPT本课程的相关信息:24个学时1个学分平时成绩占30%,考试成绩占70%。平时成绩来自实习作业参考书目:1.北大、南大、东大出版的《信息检索》、《电子信息资源检索》等。2.《Google使用指南》等。3.《林业信息检索》等。主要内容第一章绪论第二章信息的相关知识第三章信息检索的基本知识第四章计算机信息资源检索第五章特种文献检索实习精选PPT第一章绪论我们在本章节需要完成的学习任务:信息检索的概念(what’sit?)信息检索的作用(whatcanitdoforyou)学习信息检索的必要性(Necessary)如何学好“信息检索”(howtomasterit)精选PPTWESEARCHFORIFORMATION信息检索(informationretrival):信息存储(informationstorage)与信息检索(informationretrival)信息检索(IR):信息查询(informationsearch)信息检索(what’sit?)信息检索最直接的作用精选PPT信息检索的作用:获取信息利用信息,避免重复劳动获取的信息的作用:参考求证比较决策……产生新思想,新技术,新发明改善知识结构,提高信息素养和智力水平改变生活方式……精选PPT信息素养信息素养:利用大量的信息工具及主要信息源使问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 得到解答的技术和技能。了解自己的信息需求承认准确和完整的信息是制定明智决策的基础能在信息需求的基础上系统阐述问题能识别潜在的信息源、检索信息源,制定成功的检索策略能利用以计算机为基础的信息技术和其它技术具有评价信息的能力能为实际应用而对信息进行组织具有将新信息结合到现存的知识体现中的能力能采用批判性思维,利用信息并解决问题等本课程的教学目标精选PPT学习信息检索的必要性信息增加速度快信息质量差异大信息源多信息检索工具多信息检索具有跨学科性信息检索有技术与技巧学习后,知道到那找信息,如何找信息,如何处理获取信息,大大提高检索结果的查全率和查准率。精选PPT如何学好“信息检索”掌握必须的基本知识实践总结经验体会实践……forever精选PPT第二章信息的相关知识第一节信息&信息源一、概念信息:1.信息是事物运动的状态与方式。2.用来清除随机事件的形式的不定性的东西。(从功能上的定义)3.信息是主体通过各种认知 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 获得并经过收集、 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 及处理后以某种形式存储起来的事实或数据。精选PPT二、信息的特性客观普遍性依附性可传递性共享性时效性可转换性可识别性精选PPT三、与信息相关的其它概念1.知识:人类对于客观世界的认识。2.情报:人们搜集到的能为我们所用的新知识或新信息。3.文献:记录有知识的一切载体。(人们在认识世界和改造世界的过程中,获得大量客观事物传递的信息,即感性认识或经验,然后对这些感性认识通过大脑进行加工处理,形成理性认识。)(只有将反映自然和社会现象的信息经过加工,上升为对自然和社会发展可观规律的认识,这种再生信息才构成知识。)(情报是知识通过传递并发生作用的部分,也就是说是传递中有用的知识。)(文献是传递知识的有效工具)精选PPT四、信息源一.概念:信息源是指“信息的来源”。二.类型:时间先后:先导信息源,即时信息源,滞后信息源;可保存性:可保存信息源,不可保存信息源;开发程度:潜在信息源,现实信息源口头信息源体语信息源实物信息源文献信息源等非文献信息源精选PPT第二节文献的基本知识一、文献(信息源)类型文献(信息源)类型:1.按文献载体形式分:印刷型微缩型:存储量高达22.5万页/平片声像型电子型2.按文献加工深度分:零次,一次,二次,三次文献。精选PPT一次文献:精选PPT二次文献:20061128:太湖西区公路两侧植物物种多样性的研究/[刊]/朱晓勇,胡海波,鲁小珍/南京林业大学学报.2006.30(3):-85~88摘自《全国报刊索引》精选PPT二、印刷型文献种类图书期刊报纸特种文献精选PPT图书1.图书的定义2.图书的特点3.图书的类别4.国际 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 书号:ISBN:7-301-10446-4/TP.0863精选PPT期刊1.期刊的定义2.期刊的特点3.期刊的分类4.国际标准刊号:ISSN5.核心期刊和同行评审期刊精选PPT报纸1.报纸的定义及特点2.推荐报纸精选PPT特种文献1.特种文献的概念2.特种文献的种类精选PPT三、电子型文献数据库资源网络信息资源电子型文献:以数字代码方式将图、文等信息记录在磁点光介质上,通过计算机或类似功能的设备阅读使用的一类文献。精选PPT第三章信息检索的基本知识第二节信息特征一、概念信息检索:信息存储&信息查找二、实质信息检索实质:信息特征匹配特定用户所需信息的提问标识信息存储的检索标识信息标引和存储过程:对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程信息的需求分析和检索过程。分析用户的信息需求,利用已组织好的检索系统,按照系统提供的方法与途径检索有关信息,即检索系统的应用过程。注:标引:对信息资源的各种检索特征进行分析并使之显化,以便存储和检索的信息加工操作。精选PPT信息特征检索检索途径检索语言Star精选PPT三、信息特征:(文献特征)外部特征:内部特征:题名著者出处号码分类主题检索途径外部特征检索途径:内部特征检索途径:题名途径责任人途径出处途径号码途径分类途径主题途径第二节检索途径(检索入口、检索点)精选PPT一、检索语言的种类:外部特征检索语言:内部特征检索语言:题名检索语言责任人检索语言出处检索语言号码检索语言分类检索语言主题词第三节检索语言(标引语言、索引语言、概念标识系统)信息检索语言是用来描述文献特征和表达信息需求,沟通信息存储人员与信息检索者思想的一种人工语言。标题词:规范化处理的名词术语。用术语表达文献主题和文献需求的主题单元词语言是在标题词语言基础上发展起来的一种规范化检索语言。单元词又称元词,是能表达主题最小的、最基本的、字面上不能再分的词汇单位(如“计算机”、“软件”),作为主题概念的标识。标题词表的形式体现精选PPT叙词叙词语言是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。精选PPT叙词的特点叙词语言吸收了其它检索语言的优点,并加以改进。例如,叙词语言吸收了体系分类语言的等级关系,编制了词族表;吸收了标题词语言的规范化处理方法和参照系统,达到了一词一义,发展了词与词之间的逻辑关系,形成语义网络,编制了叙词表;吸收了单元词语言的组配原理,并取代了单元词语言;吸收了关键词语言的轮排方法,编制了各种叙词索引。因而,叙词语言在直观性、单义性、专指性、组配性、多维检索性、网络性、语义关联性、手检与机检的兼容性、符合现代科技发展的适应性诸方面,都较其它检索语言更加完善和优越。精选PPT叙词语言的基本特性表现1)叙词的概念组配性。叙词语言以概念—语言—事物的逻辑关系来描述主题,并通过概念组配来检索所描述主题的信息。叙词的概念组配方式有四种。①概念相交组配。是指两个或两个以上交叉关系叙词的组配,其结果形成一个新的概念。这个新概念是原来用以组配的两个概念的下位概念,如汽车部件*发动机=汽车发动机。②概念限定组配。表示事物的叙词与表示事物方面的叙词组配,其结果形成一个新的概念,这个新概念可用来表示这一事物的某一属性或某一个方面。如电视机*数字化=数字电视机。以上两种组配方式,所得到的新概念,都是原组配概念的下位概念,缩小了检索范围,提高了叙词概念的专指度,达到提高检准率的目的。③概念并列组配。具有概念并列关系的叙词间的组配,其结果使概念检索的范围扩大,如环境污染+环境保护=环境污染和环境保护。④概念删除组配。是指两个具有上下位关系的叙词间的组配,其结果使概念检索的范围缩小,如计算机-模拟计算机=数字计算机。精选PPT2)叙词的规范性。①词义规范。对同义词(如计算机与电脑)、近义词(如实验与试验)、学名和俗名(如发动机与马达)、不同译名(激光与莱塞)、简称与全称(如中国与中华人民共和国)、不同写法(如X射线与爱克斯射线)等进行选择;对多义词、同形异义词进行限定说明,如杜鹃既表示一种鸟,也表示一种花,就须限定说明为,杜鹃(动物)、杜鹃(植物)。②词类规范。即确定词类的范围。能用作叙词的词类一般要求控制在具有实质意义的名词或动名词的范围之内。③词形规范。即对词的繁简体、词序、字母符号等的规定。上述几个方面的规范中,只有满足一词一义一型要求的词才有可能成为叙词。精选PPT表叙词的语义参照系统3)叙词的语义性叙词与叙词之间存在一定的语义关系。叙词之间的语义关系主要有同义关系、属分关系和相关关系。叙词语言对语义关系的揭示方法,主要通过各种语义参照符号来反映和联系。精选PPT1)主表(字顺表)。是《汉语主题词表》的主体部分,由全部正式叙词款目和非正式叙词款目组成,所有款目严格按汉语拼音音序排检,其基本结构见表2-5。表2-5汉语主题词表基本结构---------------------------------------------DianshiXianxingguan①电视显像管②[56CE]③Kenescope④Televisiontube④Y⑤显像管⑥……Xianxiangguan①显像管⑦[56E[lgh1]]③Kenescope④Picturetube④D⑧电视显像管⑨监视管⑨F⑩彩色显像管(11)固体显像管黑白显像管S(12)电子束管(13)Z(14)电子管(15)C(16)显示管(17)指示管---------------------------------------------说明:①汉语拼音②非正式叙词款目③范畴号④英译名⑤用项符号⑥正式叙词款目⑦正式叙词款目⑧代项符号⑨同义词(非正式叙词)⑩分项符号(11)下位叙词(12)属项符号(13)上位叙词(14)族项符号(15)最高位叙词(族首词)(16)参项符号(17)同义词(正式叙词) [lgh1]精选PPT2)附表。从主表衍生出来的一种专用词汇表,共有四种,系世界各国政区名称、自然地理区划名称、组织机构名称和人名。3)词族索引。又称族系索引、等级索引。是将主表中具有属种关系、部分整体关系和包含关系的正式主题词,按其本质属性展开,显示词间从属关系的一种词族系统。作用是揭示主题词之间族系关系,满足族性检索的需要,其结构见表2-6。表词族索引结构-----------------------------------------GuangboXitong①广播系统②.电视广播系统③..多伴音系统④.无线电广播系统③-----------------------------------------说明:①汉语拼音②一级主题词③二级主题词④三级主题词4)范畴索引又称分类索引,是按照学科范畴并结合词汇分类需要,将主表中的全部款目主题词,按社会科学和自然科学两大范畴划分为58个大类,以便从分类角度查找某一范畴内容有关的主题词,是主表的一种辅助工具。5)英汉对照索引按主题词英译名字母顺序排列的一种主题索引,是通过英译名来选择主题词的辅助工具。精选PPT关键词关键词语言是直接从原文的标题、摘要或全文中抽选出来,具有实质意义的,未经规范化处理的自然语言词汇,作为信息存储和检索依据的一种检索语言。精选PPT第四节信息检索方法工具法追溯法综合法精选PPT第四章计算机信息检索精选PPT第一节计算机检索概述一、计算机信息检索的定义广义:计算机信息存储&检索狭义:使用指令形成检索策略在计算机检索系统中检索所需的信息精选PPT二、计算机检索发展史:(一)国外计算机信息检索发展阶段脱机检索阶段(1954-1964)联机检索阶段(1965-1971)国际联机检索阶段(1972-1994)网络信息检索阶段(1995-)精选PPT(二)国内计算机信息检索发展阶段1975年,从国外引进数据库开展机检服务;1980年,建立国际联机终端开展检索服务;20世纪80年代中后期,自建数据库;90年代初,发展光盘检索;90年代中期,Internet网络化检索阶段。精选PPT三、计算机检索系统的构成主机:运算器、控制器、存储器等硬件及系统操作程序、数据库管理程序、联机控制程序、应用程序等软件。通讯线路:电话通讯网、数据通讯网、卫星通讯网等。检索终端:信息用户与检索系统主机进行人机对话,实现联机检索的设备。包括上网设备、调制解调器等。数据库:是计算机检索的对象。是由一个或数个文档构成,并能够满足某一特定目的或某一特定数据处理系统需要的一种数据集合。精选PPT数据库数据库的基本类型(按内容性质分)数据库的结构精选PPT数据库的基本类型(按内容性质分)1、文献型数据库(fulltextdatabase;bibliographicdatabase)如:国外三大农业数据库、中国学术期刊(光盘版)2、非文献型数据库(factdatabase;datadatabase;概念型数据库、图像型数据库等。)datadatabase:存贮有科学数据,统计资料等数据。Factdatabase:存贮有企业名录、百科全书、人名录等有利用价值的信息。概念型数据库:存贮有各种名词属于或语言资料,一般来源于词典等。图像型数据库:存贮有某些图象信息,如图片、云图、工程设计图等。精选PPT由字段、记录、文档组成字段:字段的构成=字段标识符+字段值字段的类型:三种检索系统存取号AN(AccessionNumber)基本索引字段(Basicindexfields)如Ti、Ab、De等(表达的文献的内容特征)辅助索引字段(AdditionIndexFields)如:Au、Py、Jn、La、Dt等,表达的是文献的外部特征。常用字段代码及其表示法(见下页)数据库的结构:精选PPT字段代码字段名表示方法TITitleapple?intiABAbstractmachineinabDEDescriptorsbuildingindeAUAuthorau=liuBNISBNbn=0-5635-0144-4CCCALClassification(分类号)cc=921CDConferenceDatecd=19960501CLConferenceLocation(会址)cl=hangzhouCTConferenceTitlect=roboticsandautomationCYConferenceYearcy=1996DTDocumentTypedt=bookLALanguagela=englishPYPublicationYearpy>=1990SNISSNsn=1060=9857SOSourcePublicationso=power精选PPT记录:文档:顺排文档(也称主档):按文献存取号先后顺序排列的,相当于检索工具正文部分。倒排文档(索引文档):相当于检索工具中的索引。随机文档:记录随即存储,记录的关键码与存放地址之间建立关系分类号:S511.103.4记录号:96017590著者:徐建龙等篇名:水道白叶枯病抗性基因Xa-21的初步利用刊名:浙江农业学报信息出处:—96.8(2).—70—73主题词:遗传效应育种白叶枯病水稻抗病性精选PPT顺排文档按文献记录的存取号从小到大排列。218653(AN)NonverbalCommunicationinTeachingSmith,HowardAReviewsofEducationalResearch.V49n49p631-72Language:EnglishSchool–relatedresearchisreviewedunder………218654218655……精选PPT倒排文档关键词索引文档表索引词记录号字段号Article195895AB2Artifacts218653AB22Behavior218653AB17Body195895TH2195895AB10……精选PPT四、计算机信息检索服务方式(1)定题检索(2)回溯检索(3)日常检索精选PPT五、计算机信息检索方式(1)脱机检索(2)联机检索(3)国际联机检索(4)光盘检索(5)网络检索精选PPT浏览(browse):相当于分类途径检索(search)六、计算机信息检索方法:精选PPT七、计算机信息检索特点检索速度快,效益高;检索功能强,数量大;检索途径多,手段灵活;检索范围广;服务方式多。精选PPT第二节计算机检索技术1、布尔逻辑检索功能2、词间位置检索功能3、截词检索功能4、字段限定检索功能精选PPT1、布尔逻辑检索功能:表达三种基本逻辑关系逻辑与逻辑或逻辑非精选PPT(1)逻辑与(逻辑乘)用运算符号:AND或*连接检索词例查“有关计算机在图书馆中的应用”的文献,检索式=计算机*图书馆例查“猪的饲养”检索式=猪*饲养用文氏图表示:图1-1精选PPT(2)“逻辑或”用运算符号“OR”或“+”连接两检索词例1查“苹果或梨”方面的文献检索式=苹果+梨它在同义词检索中使用,能提高查全率。例2查“计算机或机器人”方面的文献检索式=计算机+机器人用文氏图表示如下:AORB精选PPT(3)“逻辑非”用运算符号“NOT”或“—”连接两检索词AANDNOTB有的书上也称为“与非”关系,即“逻辑乘”与“逻辑非”例1查“玉米但不是甜玉米”方面的文献。检索式=玉米—甜玉米例2查“不是铬合金”方面的文献。检索式=合金—铬用文氏图表示:图1-3ANOTB精选PPT(4)“异或”关系(AORB)ANDNOT(AANDB)“异或”排除掉的是AANDB部分例A=水上运输工具,B=陆上运输工而“异或”的关系则排除了AANDB的那部分,即“水陆两栖运输工具”不能被命中。这同AORB是有区别的。用文氏图表示如下:(AORB)NOT(AANDB)精选PPT(5)“逻辑非”的“逻辑或”关系即:NOTAORNOTB两检索词的。例:查除俄文、法文两种文字之外的其它各语种的文献。用文氏图表示:图1-5NOTAORNOTB精选PPT(6)“逻辑或”与“逻辑非”即:AORNOTB检索A但否定B后的逻辑或,例:检索焊接(A)方面的资料,但不要技术标准(B)。这样,结果是“焊接标准”的资料被排除了。但是其它一切课题的资料(除标准外)的资料均被命中。用文氏图表示:图1-6因此,AANDNOTB(即逻辑非)和AORNOTB是不同的其效果相差很远。AORNOTB精选PPT(7)A即标引在A检索词下的文献,(8)NOTA检索不是检索词A下文献。总结:布尔逻辑检索是把任何检索课题加工成可以进行逻辑运算的表达式,这是计算机检索的一种被广泛采用的匹配方式。布尔逻辑运算的优点是简单明确、易于理解、符合人们的思维习惯AANOTAA精选PPT2、词间位置检索功能例:天线反射器反射器天线例:检索“小麦中氨基酸”(determinationofaminoacidsinwheat)检索式:determinationwithaminoacidswithwheat 例:flight(1w)control精选PPT3、截词检索功能截词运算符号有两个:“?、*”例:1、teen*teen,teens,teenage,teenager等。2、wom?n=womanorwomen精选PPTL截词方式有很多,按截词位置可以分为:L前截断(后方一直检索):?Chemistrychemistry、biochemistry、electrochemistryphysicochemistry(物理化学)等。L后截断(前方一直检索)例见书111,chem*chemical(化学制品)、chemism(化学机理)、chemomorphosis(化学诱变)、chemosynthesis(化学合成)等。L中间截断:wom?n分别检出了woman,women两词fib?board分别检出了fiberboard,,fibreboard两词。精选PPTL截词检索在中文数据库中截的是词意,例:西北?分别检出了:西北农林科技大学学报、西北园艺、西北纺织学院学报等。L在外文数据库中截的是词的后缀,截断派生出的词汇和原来的词义基本一致。例“金属”metal*metal、metals、metaled、metalist等。L利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率会很大。精选PPT4、字段限定检索功能将检索词限定在某一字段中,检索时,计算机只对限定字段进行运算,以提高检索效果。常用的检索符号有:in、=、<、>、≤、≥例1:Englishinla例2:py≥1992总结:在一个复杂的检索式中,不仅可以有多个运算符,也可以使用括号来指定运算的优先顺序、以及体现概念的完整性。例3:查“玉米方面的英文”文献检索式=(maizeorzea-maysorcorn)indeand(Englishinla)精选PPT第三节重要的学术数据库资源中文学术资源数据库:电子图书数据库电子期刊数据库学位 论文 政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载 数据库标准数据库专利数据库外文学术资源数据库:精选PPT电子图书数据库:超星数字图书馆北京世纪超星信息技术发展有限责任公司检索途径(检索字段):分类浏览、书名、作者、出版日期等阅读器:superstarreader精选PPT书生之家北京书生科技有限公司http://edu.21dmedia.com/index/login.vm检索途径:分类浏览、ISBN、出版单位、作者、关键词等阅读器:书生之家阅读器在线阅读,不能下载。电子图书数据库:精选PPT
本文档为【《信息检索》PPT课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥20.0 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
爱赢
公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)
格式:ppt
大小:792KB
软件:PowerPoint
页数:0
分类:教育学
上传时间:2021-02-19
浏览量:60