首页 计算机检索技术

计算机检索技术

举报
开通vip

计算机检索技术计算机检索技术及中文数据库使用方法一、计算机信息检索的基本技术:布尔逻辑算符、截词算符、位置算符、字段限定检索等等。  在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。一、计算机信息检索的基本技术布尔逻辑算符、截词算符、位置算符、字段限定检索等等。在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机...

计算机检索技术
计算机检索技术及中文数据库使用方法一、计算机信息检索的基本技术:布尔逻辑算符、截词算符、位置算符、字段限定检索等等。  在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。一、计算机信息检索的基本技术布尔逻辑算符、截词算符、位置算符、字段限定检索等等。在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,还有“应用”,这时候就要编制出满足要求的计算机检索式,它是机检的基础。1布尔逻辑检索(BooleanLogicRetrieval)逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(BooleanLogicOperators),即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。检索要求逻辑检索课题表达式检索结果概念相交、限定AND与*计算机用于制图ABAANDBA*B缩小检索范围提高查准率概念平行、并列OR或+土地管理与土地利用ABAORBA+B扩大检索范围提高查全率某一主题去掉一部分相关主题NOT非-除光电测距以外的A电磁波测距BBNOTAB-A提高查准率2位置算符(ProximityOperators)位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“UsingofGPSinRailwayBridge”,也可能是“UsingofGPSinBridgeofRailway”,因而可能编制出这样的检索式,GPSAND(Railway(2N)Bridge)我们可以通过位置检索提高检索的准确率(1)(W)算符与(nW)算符W是word与with的缩写。特点:W词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。nW词序不变,中间可插入N个词。如:potential(w)energy可能检出potentialenergyandfunction又如:gone(2w)wind可能检出gonewiththewind(2)(N)与(nN)算符N是near的缩写特点:N词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。nN词序不限,中间可插入N个词。如:econom??(2N)recovery可能检出economicrecovery,recoveryoftheeconomy,(3)同字段检索A(F)B,F是field的缩写。特点:A、B两词必须出现在同一字段中,词序与词量不限。如:environment(F)impact/DE,表示两个词必须同时出现在叙词字段内。(4)同句检索A(S)B,S是sentence的缩写。特点:A、B出现在同一自然句中(子字段),其词序与词量不受限制。如:electric(S)plant可检出electricpowerplants如:EI中的NEAR;PQDD中的W/n(两词间距小于n个单词,且前后位置任意),Pre/n(两词间距小于n个单词,且前后位置一定)3截词算符(Truncatingoperators)在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。(1)有限截断。是指在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。如输入computer??表示有0-1个字母变化,可检出computer和computers.输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing.(2)无限截断:在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。如:computer?可检出computers,computering,computered,computerization.(3)中间截断:在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出woman,women各种算符在数据库中的实际应用位置算符1)EINEARBridgeNEARPiling*表示这两个词要彼此接近,前后顺序不限。W/nPig*W/2pine*表示两个词的距离不能超过n个单词AdjChanneladjtunnel表示含有这两个词,两个词相邻,位置一定2)ISIProceedings用同句算符(SAME):如Channelsametunnel,表示channel和tunnel出现在同一句子中才符合检索条件。3)CSA:within“X”表示两词之间不得多于x个词,前后位置任意如“womenwithin8movement”(顺序不定)4)Elsevier:ADJ表示两词相邻,前后顺序固定,与"词检索"的结果相同;NEAR或NEAR(N),表示两词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),系统默认值为105)PQDDW/n(两词间距小于n个单词,且前后位置任意),Pre/n(两词间距小于n个单词,且前后位置一定)6)ProQuestW/n(表示连接两个词之间可以插入n个词,前后位置可颠倒)如:Educationw/5intenet表示education和internet之间可以插入5个词,并且前后位置可以颠倒。Pre/n表示前后两词之间最多插入n个词,前后位置一定如:U.Spre/neconomicpolicy可检出U.Saideconomicpolicy,orU.Swartimeeconomicpolicy。截词符或通配符CSA\ISIProceedings\ProQuest\CA用通配符“?”和截词符“*”输入“patent*”,可以检索到patent、patents、patented等,(无限截断)输入"wom?n",可以检索到woman和women。输入“fib??”,可检索到fiber和fibre。(有限截断)EI用“*”和“$”(词根算符)如:Optic*检索结果中包括以optic开头后面加任意多个字母的词例如optic,optics,optical等$manager(强调语义)检索出与该词根具有同样语意的词如$manage将检出managers,managerial和management等词※通配符不能用在检索词的最前面4括号检索(Parentheses)用于改变运算的先后次序,括号内的内容做优先运算。用“( )”可以表示优先级。如比较(GPS OR GIS)AND ChinaGPS OR GISAND ChinaEI中的表示方法:RelevanceAND((AalbersbergWNAU)OR(coolWNAU))5、字段限制检索组成数据库的最小单位是记录,一条完整记录中的每一个著录事项为字段。献书目型数据库的记录基本包括下列字段:(1)存取号字段(AN,AccessNumber)这是计算机检索系统为每个数据库的每篇记录规定的能被计算机识别的特定号码。在同一数据库中,每篇文献记录只有一个存取号;(2)篇(题)名字段(TitleField,/TI)(3)文摘字段(AbstractField,/AB)(4)叙词字段或受控词字段(DestriptorField,/DE;或ControlledtermField-SU)这一字段是标引人员给文献标引的反映其主题概念的词,这些词来自 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 化的词表。也称主题词。(5)自由词字段或非受控词字段(IdentifiedField,/ID;KeywordField,/KW;UncontrolledtermField)这一字段也是标引人员给文献标引反映其主题概念的词,但这些词不是规范化词表中的词。(6)著者子段(Author,AU)(7)著者机构子段(corporatesource,CS或Affiliationsource,AF)(8)刊名字段(journal,JN或SourceTitle,ST)(9)出版年子段(publication,year,PY)(10)文献类型子段(ducumenttype,DT或Type,TY)(11)语种子段(language,LA)(12)分类号子段(classification,CC)使用作者检索时应注意姓名的书写形式:在ISTP中,姓前(全称)名后(缩写):Gong,jy;EDC在SCI中,(1)姓(全称)空格名(首字母并且连写)如:TaitNG;LIDR(2)名前(全称),姓后如:Zequn,guan;Qingquan,Li在EI中,姓名就比较复杂,一般有以下几种情况:姓名都用全称(姓前名后);姓全称名缩写(或名之间用连字符);名前姓后全称如kehengyu=keheng-yu=ke,hengyuke,h.y.=ke,h-y;e,d.c.hengyuke;dongchen,e6短语检索(phrasesearch)即精确检索短语用“”表示,检索出与“”内形式完全相同的的短语,以提高检索的精确度和准确度7自然语言检索(naturallanguage)直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。这种基于自然语言的检索方式又被称为“智能检索”,适合不太熟悉网络信息技术的人员使用。支持自然语言检索的有中文的悠游,英文的AltaVista,Excite,Infoseek,HotBot,AskJeeves等8多种语言检索(multilingualsearch)提供多种语言的检索环境供用户选择,系统按用户选定的语种进行检索并反馈结果,支持多语种检索的如:中文天网,英文AltaVista,Google等。9模糊检索(fuzzysearch)又称概念检索。当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来与关键词意义相近的内容。比如:我们查找“查询”一词时,模糊检索会反馈来包含了“查询”、“查找”“查一查”、“寻找”、“搜索”等内容的网址。反馈网址的排列,一般是完全符合关键词的在最前边,其次是相近的。现在大多数搜索引擎都有这种功能,只是模糊的程度不同。10字母大小写检索如果用户的检索式用小写字母表示,搜索工具既匹配大写又匹配小写,如:china(瓷器),china(中国);如果用大写字母表示,搜索工具认为用户指定了只要大写,就只会查找那些与用户键入的输入形式完全相同的结果,如:china,只检索出china。AltaVista等搜索引擎支持区分大小写的检索实际检索中,往往将多种检索技术混合使用。如:TI(WebORWWW)ANDmarket*TS=(nanotub*SAMEcarbon)NOTAU=SmalleyRE例1:以汽车导航系统为研究课题,构建计算机逻辑检索式题名词:汽车 导航系统 研究题名扩展词:机动车; 全球定位技术(GPS);设计 调查计算机逻辑检索式:(汽车+机动车)*(导航系统+全球定位技术+GPS)*(研究+设计+调查)示例:有关“企业知识产权研究”检索式检索结果(*表示AND,+表示OR,限定篇名字段)(2004-2006)1企业知识产权191篇(准确度最高漏检大)2企业*知识产权404(漏检率较高)3(企业+集团+公司)*知识产权466(适合综述性文献)4(企业+集团+公司)*(知识产权+专利权520(查全率查准率较高)+商标权+著作权+名称权)5(企业+集团+公司)*(知识产权+专利权137(缩小范围效果最佳)+商标权+著作权+名称权)*保护检索结果表明:检索词的选择、逻辑算符的使用、同义词近义词的扩展、检索字段的选择等变化,对检索结果数量的多少、检索的查全和查准有很大影响检索结果过少,漏掉了相关文献?放宽检索要求,提高检全率去掉某个方面的检索要求;放宽检索范围:学科领域、时间、文章类型,关键词出现的字段等;将描述检索主题的词想全,包括同义词及缩写形式;如:MRIORmagneticresonanceimaging使用单数单词检索,可以检索到大多数单词单数、复数和所有格,不规则单词除外;如:city可以检索出city,cities,city’s,cities’使用通配符;检索结果过多,很多文献不相关?进一步限定检索,提高检准率更加准确地描述检索需求;严格限定检索范围:学科领域、时间、文章类型,关键词出现的字段等;选择与检索主题密切相关的词和专业术语,如:kidneydiseaseORrenalfailure,避免使用过于宽泛的词汇,如:influence;使用词组检索或位置检索;在检索结果的基础上进行二次检索;二、数据库的检索方法检索界面浏览方式(Browse)检索方式(Search)浏览方式(Browse)一般包括作者、作者单位、出版物名称及出版社索引或者按学科划分的分类索引如:EIElsevierCSAPROQUESTIEEE\IEE重庆维普以及中国期刊网等等都提供了各种不同的浏览方式检索方式(Search)基本检索(basic\quick\simple\easy)属于一般性的检索,它是根据自己的检索需要,输入字、词或简单的检索式(不能使用位置检索)来完成检索的,是一种初级性的检索方式。高级检索(advance\expend\full\expert)属于专家性的检索,可以根据自己的检索需要,构件比较复杂的检索式(可以使用逻辑、括号、截词以及位置算符)来完成高层次、高质量的检索,检索结果快速、准确。高级检索分为菜单式检索和命令式检索两种三 中文数据库的使用方法中国期刊网重庆维普数据库万方数据库全国期刊联合目录高校期刊联合目录书生之家(一)收录特点中国期刊网目前世界上最大的连续动态更新的中国期刊全文数据库。收录1979年至今约7200种期刊全文。至2005年4月止,累积全文文献1370多万篇。分为九大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学;126个专题文献数据库。知识来源:中国国内约7200种核心期刊与专业特色期刊的全文以及优秀博硕士学位论文和重要报纸重庆维普资讯有限公司是科学技术部西南信息中心下属的一家大型专业化数据公司,是中文期刊数据库建设事业的奠基人。自1989年以来,一直致力于报刊等信息资源的深层次开发和推广应用,业务集数据采集、数据加工、光盘制作发行和网上信息服务于一体。目前,已成为中国最有影响力的数据库建设者之一。维普公司收录有中文报纸400种、中文期刊8000种、外文期刊5000种;已标引加工的数据总量达1300万篇、3000万页次、拥有固定客户2000余家,在国内同行中处领先地位。维普数据库已成为我国图书情报、教育机构、科研院所等系统必不可少的基本工具和获取资料的重要来源。数据主要来源于期刊万方数据资源系统是建立在因特网上的大型科技、商务信息平台。自1997年8月面向社会各界开放以来,在国内外产生了较大的影响,同时在全国各省市建有几百个服务中心,直接用户达数万人。万方数据资源系统以其巨大的信息量和方便的检索查询功能成为我国信息界的知名品牌。万方数据主要资源建立在万方数据庞大的数据库群之上。迄今为止,万方数据自有版权以及与合作伙伴共同开发的数据库总计110多个,归属于8个类别,内容涉及自然科学和社会科学各个专业领域,收录范围包括期刊、会议、文献、书目、题录、 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 、论文、标准专利、连续出版物和工具书等,用户既可以单库、跨库检索,也可以在所有数据库中检索,同时还可以实现按行业需求的检索功能。万方数据资源系统被整合为科技信息子系统、商务信息子系统和数字化期刊子系统三个部分,面向不同用户群,为客户提供全面的信息解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 。同时还提供了学位论文全文和会议论文全文两个数据库。(二)使用方法中国期刊全文数据库(扩展词的用法)中文科技期刊全文数据库(逻辑算法的正确运用)万方数据库(各种文献类型的检索)思考题1)请举出三种以上常用中(外)文数据库使用的检索字段。2)如果要查找某一个精确的词组或短语,需要用到哪种符号?3)在国内外数据库的检索技术中,截词算符一般有哪几种?4)以“城市生活污染”为研究课题,请 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 该课题的主题概念,选择相关的同义词、近义词,并写出基本的计算机逻辑检索式。5)认真分析“计算机辅助教学软件的研制”这一课题,并为其编制基本的逻辑检索式。6)目前很多中外文数据库都提供了主题词表(如CSA/EBSCO/EI/中国期刊网等等),试举例说明题名词、关键词与主题词的区别。7)已知“网络出版对印刷业结构的影响”这篇文章,在我馆电子全文期刊库中有收录,请问哪些数据库中可以找到?并指出文献出处。8)什么是查全率、查准率?在检索策略的实施过程中,如何扩大和缩小检索范围,提高查全率和查准率。9)如果想查找“水泥工业污染物排放标准”应该使用哪个标准库?采用何种途径?如何检索。
本文档为【计算机检索技术】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
旋律
几年的财务工作经验,现认财务主管一职!精通各种财务管理软件
格式:ppt
大小:1MB
软件:PowerPoint
页数:0
分类:
上传时间:2018-06-20
浏览量:3