首页 中国人民大学《信息管理学基础》(马费成 武汉大学出版社)考研复习笔记

中国人民大学《信息管理学基础》(马费成 武汉大学出版社)考研复习笔记

举报
开通vip

中国人民大学《信息管理学基础》(马费成 武汉大学出版社)考研复习笔记1信息管理概论总结笔记1.信息管理学——TheIntroductionToInformationManagement2.信息管理——InformationManagement3.国际标准书号——InternationalStandardBookNumber第一章.信息与信息管理数据、信息、知识和情报是信息与信息管理领域的起点和基石,同时这些概念和它们所代表的外延之间又存在着极为紧密的天然的联系。1.数据(data)—未经整理的、可被...

中国人民大学《信息管理学基础》(马费成 武汉大学出版社)考研复习笔记
1信息管理概论总结笔记1.信息管理学——TheIntroductionToInformationManagement2.信息管理——InformationManagement3.国际 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 书号——InternationalStandardBookNumber第一章.信息与信息管理数据、信息、知识和情报是信息与信息管理领域的起点和基石,同时这些概念和它们所代表的外延之间又存在着极为紧密的天然的联系。1.数据(data)—未经整理的、可被判读的数字、文字、符号、图像、声音、样本等信息(information)—在特定情况下经过整理的、表达一定意义的数字、文字、符号、图像、声音、信号等知识(knowledge)—在信息这一原材料的基础上形成的见解、认识情报—被已知的需求者所寻求的知识或信息数据、信息和知识之间的关系:不能简单理解为相交或不相交,相关或不相关,三者具有独立内涵和典型的外延所指,是转化过程的递进链,是加工组织程度的等级链,是价值量的等级链。2.信息的性质和特征—⑴信息存在的普遍性和客观性⑵信息产生的广延性和无限性⑶信息在时间和空间上的传递性—信息产生于事物的存在和运动,但信息可以独立与其发生源而相对独立,可以由其他物质载体携带在事件或空间中传递。⑷信息对物质载体的独立性和依附性⑸信息对认识主体的相对性—由于人们的观察能力、认识能力、理解能力和目的不同,他们从同一事物中获得的信息量也不同,即使他们的这些能力和目的完全相同,但他们在观察事物时,选择的角度不同,侧面不一样,它们所获得的有关同一事物的信息肯定也不同。3.分类:⑴按信息的性质—语法信息、语义信息和语用信息⑵按信息的内容—经济信息、科技信息、政治信息、文化信息、政策法规信息、娱乐信息⑶按信息的流通渠道—正式信息、非正式信息⑷按信息的记录方式—语声信息、图像信息、文字信息、数字信息、计算信息分类目的:为了认识信息的性质和特征,以便描述信息和处理信息。无论从什么样的角度进行划分,不同种类的信息之间并没有绝对的界限,彼此之间互有交叉重叠。尤其是我们从内容角度对信息的划分更是如此。4.信息流与物质能量流一样,在其运动过程中要经历相同的阶段和过程。物质、能量与反映它们存在和运动的信息是一一对应的,有多少种物质和能量及其在各不同方向的运动,就有多少种信息与之对应。5.社会信息化—指人类社会发展过程中的一种特定现象,在这种现象出现时,人类对信息的依赖程度越来越高,而对物质和能源的依赖程度则相对降低。社会信息化层次:⑴通过自动控制、知识密集而实现的生产工具信息化;⑵通过对生产行业、部门以至整个国民经济的自动化控制而实现的社会生产力系统信息化;⑶通过通信系统、咨询产业以及其它设施而实现的社会生活信息化社会信息化的进程是一个由内圆到外圆逐步渗透扩散、发展的演变过程。[注:1992年,克林顿提出“信息高速公路” 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 ]6.信息管理的实质—人类综合采用技术的、经济的、政策的、法律的、人文的方法和手段对信息流(包括非正规渠道和正规渠道中的信息流)进行控制,以提高信息利用效率、最大限度地实现信息效用价值为目的的一种活动。27.信息管理是一个非常综合性的领域,其理论方法涉及计算机科学、信息科学、图书馆学、情报学、社会学、管理学、经济学、法学、心理学、伦理学等众多的学科。围绕信息管理的理论与实践已经形成了许多独立的学科领域,如信息组织、信息检索、信息系统、信息用户、信息经济、信息市场、信息法学等等,它们从不同的侧面研究和解决社会信息流的控制问题,形成了各具特色、相互补充的学科群。8.信息管理的历史沿革:⑴传统管理阶段—这一阶段以信息源管理为核心,以图书馆产生和长期存在为象征,同时也包含档案管理和其他文献资料管理。早期的图书和档案的社会机构是“同源”的。随着社会经济、科技和文化发展,文献记录的类型大量增加图书馆作为最初的文献收藏机构,逐渐与档案馆分流,成为知识和文献收集、整理和提供利用的社会信息交流中心机构,即形成了独立意义的图书馆。[标志:图书馆的存在和管理]⑵技术管理阶段—这一阶段以信息流的控制为核心,以计算机为工具,以自动化信息处理和信息系统建造为主要工作内容。计算机具有科学计算功能和信息(数据)处理功能。计算机发明研制不到10年就被应用于图书馆的文献信息加工和管理,目的是要提高文献信息加工处理和查找效率,实现对文献信息流的控制。技术管理阶段着眼于用计算机技术处理信息并对信息流进行控制,技术因素占主导地位,技术专家唱主角。⑶资源管理阶段(InformationResourceManagement)—取代过去单纯以信息技术(InformationTechnology)进行信息管理,主张对信息资源要运用技术、经济人文的手段,进行统筹规划全面管理,即管理特征是自上而下的集中式的可控的个性化的实时的管理。特征:资源管理阶段不能把信息资源整合的问题简单看做一个专业或技术性层面的问题,而是一个综合治理的问题,应当在政府统一规划和统筹规划协调下组织实施。资源管理阶段信息资源管理着眼于对人类信息过程的综合性、全方位的控制和协调,这一新概念的提出基于两个原因:①技术管理阶段纯粹的技术手段不能实现对信息的有效控制和利用,因而提出信息资源管理这一新兴的管理模式;②当代社会经济发展使得信息成为一种重要的资源的背景下,迫切需要从经济的角度思考问题。信息资源管理的局限性:①仅关注显在知识尤其是记录性信息的管理而忽略了对另一类十分重要的知识——隐性知识的管理,从而大大限制了其管理范围和信息管理效能的发挥②仅仅关注人类智力劳动的最终成果——记录型信息,对获得这一成果的学习与创新过程却视而不见,因而无法将信息的吸收与创造(生产)过程纳入管理范畴,不能实现全方位的信息管理。③仅仅关注将信息提供给利用者,而对利用者其需求信息的根本原因重视不够,致使它难以将信息升华为知识,从而限制了信息效用价值的实现。④仅仅关注信息在组织内部的免费流动,未能将信息看做一种资产,以资产管理的方式来管理和运作信息,从而忽视了信息的增值问题,影响了组织对信息的评价。⑷知识管理阶段(KnowledgeManagement)—在组织中构建一个人文与技术兼备的知识系统,让组织中的信息与知识通过获得、创造、分享、整合、记录、存取、更新等过程,达到知识不断创新的最终目的,并回馈到知识系统内;个人与组织的知识得以永不间断的积累,从系统的角度进行思考,这将成为系统的智慧资本,有助于企业做出正确的决策,因应市场的变迁。3知识管理简单地说就是对企业的知识资源进行管理的过程,如果对知识进行搜集和整理,如何使每一个员工都最大限度的贡献出其积累的知识,是企业实现知识的共享,就是企业进行信息,进行知识管理的主要目标,知识管理要求企业实现知识的共享,运用集体的智慧,提高企业应变和创新能力,是企业能够对外部要求做出快速反应,并利用所掌握的知识资源预测外部市场的发展方向及其变化。第四章信息获取了解各种信息源及其特点,掌握信息评价的一般指标,能有效进行信息评价及其选择,掌握信息获取效率的一般指标,熟悉信息获取的途径和方法。1.信息的获取和搜集是信息管理的首要环节,施展开信息服务的物质基础。信息管理学将信息源和信息的获取作为主要的研究对象之一。2.信息源—人们在科研活动、生产经营活动、文化活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果的原始记录加工整理所得的成品(如数据库、文摘索引杂志等等)都是借以获得信息的源泉,简称信息源。3.信息源的划分:传播方式→⑴按性质—口传信息源(智力信息)、文献信息源(记录型信息)、实物信息源⑵按时间—先导信息源、即时信息源、滞后信息源⑶按加工—零次信息、一次信息、二次信息、三次信息4.从便于对信息进行管理的角度将信息划分:⑴记录型信息—按物质载体:印刷型、微缩型、计算机阅读型、网络型、视听资料按内容、性质和加工:一次信息—凡是在科研、生产、经营、文化及其他各类活动中产生的原始信息,称为一次信息。如期刊 论文 政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载 、研究报告、市场调查报告、专利说明书及各种网络信息;二次信息—是对一次信息进行加工整理后产生的一类信息,如书目、题录、简介、文摘等形式的检索工具。二次信息的重要作用,不仅在于报道,更重要的是为查找一次信息提供线索;三次信息—在一、二次信息的基础上,经过 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 、综合而产生的信息。人们常把这类信息称为信息分析研究的成果,如综述、述评、学科年度总结、文献指南、书目等;⑵实物信息源⑶智力型信息源—由人脑存储⑷零次信息源—是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听、视、嗅、味、触觉)的结果。零次信息具有直接性、及时性、新颖性、随机性、非存储性等典型特征。5.有价值的信息—有价值的信息是在特定的问题和状态中被利用并有效发挥其功能的信息,是实现某种目标所需要的知识,是进行决策和选择所必需的资料。必须具备及时性、准确性、综合性、获取简易性、经济性等特性。以及如下6个条件:⑴能及时地以适当的方式提供解决问题所需要的依据;⑵信息符合用户需求的内容;⑶信息的可信赖程度高;⑷信息具有综合性;⑸信息容易获取(既不是用特殊手段或极少数人才能获取);⑹信息的费用与目标吻合。6.信息的评价:⑴直接评价法:局限性—第一、对各指标的评分带有极大的主观性,完全取决于信息4工作者个人对信息源的认识和了解。第二、信息源的价值只有在实际利用中的真正动态,因而不能正确反映信息源的价值。第三、上述五项指标也还是不能够完备的。⑵间接评价法:间接评价法是通过信息用户来评价信息源。以调查表的方式调查用户对信息源的需求和利用情况,然后由信息工作者对调查所得到的数据进行统计分析和对比,对信息源的价值作出评定。这种方法的特点是需要信息用户密切配合,工作量较大,但评价效果较为客观。评价指标—①评分平均值:mRmiaijj1[注:jR—信息源j的平均评分m——被调查人数ija—被调查人i给信息源j的评分]②评分比重:miijnjmiijiaap111[注:jp—信息源j的评分比重n——信息源数ija—被调查人i给信息源j的评分m——被调查人数]③最高评分频度:mmp'max[注:maxp—最高评分频度m´——给最高评分的被调查者数m——被调查人数]④平均名次指数:mCMmiijj1[注:jM—信息源j的平均名次ijC—被调查i给信息源j的评分排队名次m——被调查人数]交叉检验—一般把从各个方面获得同一信息,并进行比较评价的方法叫做“交叉检验”。由于信息的比较也是相应的信息源的比较,所以经常注意各种信息源的特点及各自携带的信息、可靠性水平等方面的评价数据,是非常有益的。7.信息获取的效率指标:⑴采全率(Recall)—用来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题性信息(对该系统全体用户而言)在当时系统内外所有切题信息中所占的比例:RrP[注:P—采全率r—该信息系统中切题的信息R—当时系统内外全部切题的信息]⑵采准率(Precision)—用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时该系统所有信息中所占的比例:QrE[注:E—采准率r—该系统中切题的信息5Q—系统内所有的信息]⑶及时率——用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。它由搜集过程的每一环节(从信息的产生到其被输入到信息库)所花费的总时间来计算:niitT1⑷费用率(Cost)—用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。它取决于搜集过程的组织、各环节的技术装备及其他因素:GFC[注:C—单位信息的费用率F—年度搜集信息的总花费G—年搜集到的信息量]⑸劳动耗费率—指信息系统搜集到的单位信息所消耗的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算:niilL1[注:L—搜集信息的工作量il—单位信息在每一环节中的劳动消耗率]该指标取决于信息搜集过程的难度、条件、效率等方面的因素。8.信息搜集的原则:⑴针对性⑵系统性⑶预见性—在信息搜集中不仅要充分注意现存的信息源和信息渠道,还要着眼未来,预见可能产生的新的信息源和信息渠道⑷科学性—需要经常采用科学方法研究信息源的分布规律,选择和确定信息密度大,信息含量多的信息源⑸计划性9.信息搜集的方法与途径:⑴采购—包括订购、现购、邮购、委托代购等具体方式⑵调查—包括访谈,对实物、现场的实地考察搜集(如现场调查、访问、发放问卷、样品搜集等等)⑶交换—利用本系统所拥有的信息源(如出版物等)与其他单位进行交换、互相调剂、互相补充、扩大信息来源。交换的信息源多属于内部资料、非卖品,不能通过采购或其他方式获得,只有通过交换取得。⑷索取—可以通过通讯联系或直接派人联系取得⑸检索—即以手工方式或计算机方式从各种不同的数据库和信息系统中查寻所需要的信息6第五章信息组织1.信息组织(InformationRetrieval)—亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内部特征进行解释和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。信息的内容特征就是信息包含的内容,它可以由关键词、主题词或者其他知识单元表达。信息组织的基本对象就是信息的外部特征和内容特征。2.目录系统——Catalogue关键词——keyworld摘要——abstract3.信息组织的基本内容:⑴信息选择→目的:从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,它是整个信息组织过程的第一步。⑵信息分析—信息分析就是按照一定的逻辑关系从语用、语义和语法上对选择过的信息内、外表特征进行细化、挖掘、加工整理并归类的信息活动。[地位:它是信息描述与揭示的前提和基础,直接影响着信息组织的质量]⑶信息描述与信息揭示—①著录:在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。所谓标目,是从文献内容和形式的某一特征指引排检线索的著录项目。文献著录标准化是指在国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 。著录的标准化有利于提高目录的质量,生产机读目录,便于通过使用计算机实现编目和检索的网络化,从而进一步促进文献的交流和充分利用。[注:国际标准书目著录—InternationalStandardBibliographicDescription简称ISBD国际图书馆协会联合会—InternationalFederationofLibraryAssociation简称IFLA英美编目条例第2版—Anglo-AmericanCatalogingRules:2简称AACR2]②标引:指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程。7标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统,是根据标引和检索需要而编制的人工语言。从用途来讲,标引语言又称检索语言、索引语言;相对于自然语言,标引语言又称受控语言、规范语言文献标引过程一般包括两个环节:a.主题分析b.转换标示标引的类型:一。根据构成原理—分类语言、主题语言、代码语言[分类语言和主题语言是最主要的两类标引语言]二.按标识组合时间的前后—先组式语言、后组式语言、散组式语言[标引的种类最主要的是分类标引和主题标引]信息描述的作用:⑴识别(Recognization)—确认并对要进行组织的信息资源进行个别化描述,使用户能识别被组织的资源对象。⑵定位(Postioning)—提供信息资源位置的信息,以便用户访问时使用。它可以是传统文献集合中信息资源的排列位置,也可以是数据库中的位置。在网络环境下,则主要为信息资源在网络中的地址,从而可以方便用户访问资源。⑶检索(Search/Retrieval)—通过在描述数据中提供检索点,便于用户对资源的检索和利用。传统检索系统一般需要在描述记录的基础上确定检索点,组织相应的检索工具,提供各种基本的检索途径;在电子检索系统中,一般可以利用描述数据和各种特征进行检索。⑷选择—通过记录信息资源的特征,诸如主题、作者、类型、物理形式、层次和日期等,供用户对信息资源的使用价值进行判断,决定是否使用该资源。[元数据(metadata):元数据是关于数据的数据,关于信息的信息,或者描述数据的数据。它是专门用来描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。信息描述的结果,是获得描述记录亦即元数据,用作信息资源的代替无组织检索系统。元数据可以代表信息资源用来组织目录、索引、数据库、搜索引擎等检索系统]⑷信息贮存—信息贮存是将经过加工整理序化后的信息按照一定的格式与顺序存贮在特定的载体中的一种信息活动。信息存储的目的是为了便于信息管理者和信息用户快速的、准确地识别、定位和检索信息。[地位:信息贮存于各种检索工具中意味着信息组织过程的终结,也即意味着信息检索的开始。]4信息组织的特性:⑴信息组织的渗透性—指信息组织存在于各种信息揭示、存储和检索活动之中。⑵信息组织的依附性—指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。⑶信息组织的增效性—指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活动和利用组织的保障。5.信息组织的原则:⑴客观性原则⑵系统性原则⑶目的性原则—信息组织、信息检索和信息传播具有趋于融合的发展态势⑷现代化原则6.信息组织的理论基础:信息组织的最基础理论是语言学、逻辑学和知识分类。逻辑学是关于思维规律的科学。8信息组织的直接目的是建立信息检索语言,各种信息检索语言都建立在概念逻辑和科学分类基础上。信息组织的最终成果是建立不同类型的信息系统,因此系统论、耗撒结构理论、协同学理论和自组织理论等也被广泛的应用于信息组织。[自组织:凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有序状态的系统,就成为自组织系统。自组织与系统是密不可分的,自组织是指系统无需外接指令而能够自行组织、自行创生、自行演化,即自主地从无序走向有序。信息自组织是指作为信息系统组织要素的信息,由于人与人之间、人与系统其他要素之间存在的相关性、协同性或默契性而形成特定结构与功能的过程,也就是信息系统无需外接指令而能自行组织信息,自我走向有序化和优化的过程。自组织系统与信息系统相比,虽然目的与结构一致,但是人在其中的地位和作用不同。信息组织一定需要人的能动性和目的性去干预和指挥;信息自组织过程中,个人或许带有私人目的,但作为总体的人们是在没有外部指令或者说处于被动状态下,而信息的演化、信息之间的相干与有序化是自主地进行的]7.网络信息资源描述的相关标准:⑴MARC(MachineReadableCatalogue)标准:MARC起源于美国国会图书馆于1965年1月提出的“标准机器可读目录记录款式的建议”。MARC主要特点:①共包括001~999个字段,其中999字段为用户自定义的字段②字段内容著录详尽,字段下又设子字段以及重复字段③字段作用强化,可检索的字段多④每条MARC记录可分为头标区、目次区、数据区典型MARC标准:①USMARC(美国国会图书馆机读目录通信格式)②UNIMARC(国际机读目录通信格式)③CNMARC(中国机读目录格式)⑵都柏林核心集(DublinCoreElementSet):由OCLC等组织于1995年提出,1996年12月最终定型。主要特点:①简单易懂②运用灵活③国际通用④可扩展性8.信息组织的分类:⑴文献型信息组织—文献信息都是一定的知识记录在一定的物质载体上的信息形态。每一份文献信息都有它的外部特征和内容特征。[注:外部特征指文献的书名、著者、出版者、出版地、版次、刊期、引文及各种编号等。按照文献的外部特征来组织信息,各种因用法、索引法、目录法用得较多,它们主要用于按已知文献的某些特定要素来查找文献。按文献的内容特征来组织信息,常用的是分类法、主题法、文摘法等,它们主要用于未知信息的查找,有着更明确的选择意义。传统的图书目录学主要以文献为单位来组织信息,而信息学则更深入到以文献的每一信息知识单元来组织信息。]分类:①分类组织法—文献分类是根据文献所反映的内容性质、形式题材和用户用途,分门别类地系统组织文献的一种方法。文献的体系分类法是以科学分类为基础,运用概念划分的方法,按照知识门类的逻辑关系,从总到分,从一般到具体,层层划分逐级展开的层累制号码表示的组织文献的方法。根据这种方法编排的目录称为分类目录。分类与归类是互逆的过程,是一个事物的两个方面。②主题组织法—以语言为基础,用表达概念的词或词组来揭示文献内容的一种方法。划分:a.标题法b.单元词法c.关键词法d.叙词法9③引用组织法—科学文献的显著特点之一,是作者一般都在文章最后附上所引用的各种参考文献。科学引文索引—ScienceCitationIndex简称SCI④文献型信息的宏观组织⑵网络信息组织—主题法、分类法仍然是网络信息组织从语义角度的基本组织方法,引用法则是网络环境下主题树方法和超媒体方法的思想基础。特点:①信息组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息链,甚至知识;②信息组织的范围从文献内外部特征深入到信息单元、知识单元;③信息组织的结果从静态的文本格式发展到动态的多模式连接;④信息组织的形式从数据结构发展到知识表示,即要求信息组织的透明化、易用性;⑤信息组织的技术从手工单一发展到半自动化、自动化、智能化,即要求信息组织的标准化、兼容化划分:①文件方式—文件是计算机保存处理结果的基本单位,很自然的成为网络信息资源组织的一种方式,也是一种较为古老的信息组织方式。优点:a.简单方便b.是贮存非结构化信息的天然单位缺点:a.难以平衡网络负载与文件数量的关系b.对结构化信息组织显得软弱无力c.文件本身可看作信息单元,需要作为对象来管理地位:文件方式常作为网络信息资源管理的辅助形式,作为其他信息组织方式的补充。②数据库方式—所谓数据库组织方式,是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其相关组配查询,就可以找到所需要的信息线索(及相关站点链接),并通过信息线索直接连接到相应的网络信息资源。地位:数据库处理海量信息的能力和优势,使之成为组织网络环境中堆积如山的信息资源的重要方式③主题树方式—所谓主题树组织方式,就是将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需要的信息线索(即相关站点链接),并通过信息线索直接找到相应的网络信息资源④超媒体方式[对超媒体集中精华的解释:用超媒体方式来组织网络信息资源,就是将网上所能获得的各种媒体(文本、图像、声音、视频、文件、网页、超文本连接网、数据库等)的相关信息资源利用超文本技术有机地编织在一起。每一个媒体信息为一个节点(node)或基本单位(unit),节点间以链路(link)相连,将信息资源组织为某种网状结构,用户可以从任意节点开始,自由跳转,浏览和查询信息。]9.知识组织(descriptiuedefinition)—狭义的知识组织是指文献的分类、标引、编目、文摘、索引等一系列整序。广义的知识组织是针对知识的两要素进行的,是知识因子的有序化和知识关联的网络化。特征:⑴自动化—在无人干预的情况下按规定的⑵集成化(integration)—集成是内部互相联系、融合为一个整体或一体化。集成的技术基础信息基础(以数字化和网络化为标准的),信息集成服务提升服务能力的主要服务形式,信息集成和系统集成的发展促进了信息集成的变革。⑶智能化—指对象具备灵敏准确的感知功能、正确的思维与判断功能,行使有效的执行功10能。知识表示—所谓知识表示,是指把知识客体中的知识因子和知识关联表示出来,以便人们识别和理解知识。知识表示是知识组织的基础与前提,任何知识组织方法都要建立在知识表示的基础上。知识表示有主观知识的表示和客观知识的表示两种。知识组织技术与方法—⑴分类法和主题法是客观知识组织的基本工具⑵数据仓库和知识挖掘(knowledgemining/discovery)是主体知识组织的工具[数据仓库的特征在于面向主题、集成性、稳定性和时变性]第六章信息检索(InformationRetrieval)1.1950年,穆尔斯首次提出信息检索。2.信息检索—定义:我们认为信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量文献11中查出所需的资料或信息的过程。通常将满足信息用户的信息需求而建立的,存储经过加工了的信息集合,拥有特定的存储、检索与传送的技术装备,提供一定存储与检索方法及检索服务功能的一种相对独立的服务实体(包括人和检索工作单位),统称为信息检索系统(InformationRetrievalSydtem简称IRS)。[人、检索工具(包括设备)和信息资料是信息检索系统的三个基本要素]划分:⑴按存储和检索的内容划分:①文献检索—回答的是诸如“关于铁路大桥有哪些文献”之类的问题②数据检索—回答诸如“世界上最长的铁路大桥有多长”之类的问题。(数据型)③事实检索—回答诸如“世界上最长的铁路大桥是哪条”之类的问题。(非数据型)⑵按检索系统中信息的组织方式划分:①全文检索②多媒体检索③超媒体检索⑶按检索性质划分:①定期检索—又称为SDI检索②回溯检索—也称为追溯检索⑷按检索要求划分:①强相关检索—强调查准率②弱相关检索—强调查全率信息检索需满足的特性:⑴信息检索的相关性—信息检索系统针对用户的查询,从文档中检出的文档与查询之间的一种匹配关系⑵信息检索的不确定性—语言本身的特性决定了在标引和检索词的选用中都存在不确定性。⑶信息检索的逻辑性——信息检索作为信息管理的核心,具有非常强的逻辑性。在检索语言方面,检索词作为检索语言的典据性文本,其自身编排具有很强的逻辑性;在检索策略的研究方面逻辑性表现的更为明显。2.信息检索的四个发展历程:⑴手工检索阶段(1876-1954)—信息检索源于参考查询、文摘索引工作,较正式的参考工作是由美国图书馆和高校图书馆与19世纪下半期发展,到20世纪40年代,咨询工作的内容又进一步,包括事实性咨询、文摘、专题文献检索提供文献代译。检索从此成为一项独立的用户服务⑵脱机批量处理检索阶段—1954年美国海军机械实验中心使用IBM701型号系统,701初步形成了计算机情报检索系统,这也预示计算机检索系统为代表的信息检索自动化时代的到来,单纯的手工检索和机械检索都或多或少显露出各自的缺点,因此极有必要发展出一种新型的信息检索方式⑶联机检索阶段(1965-1991)—1965年美国系统发展公司研制成功ORBIT联机情报检索软件,开始了联机情报检索系统阶段。与此同时,美国洛克公司研制成功著名的Dialog系统,20世纪70年代,卫星通信技术、微型计算机以及数据库产生的同步发展,使用户得以冲破时空阻碍,实现了国际联机检索。[特征:远程时时检索,多种数据库是联机检索的主要优点,联机检索是计算机信息处理技术和现代通信技术三者的有机结合。]⑷网络化联机检索阶段—随着互联网的迅速发展及超文本技术的出现,基于客户机—服务器的检索软件的开发,实现了将原来的主机系统转移到服务器上使客户机服务器联机检索模式开始取代以往的终端主机结构,联机检索进入了一个崭新的发12展时期。3.信息检索的模型:基本原理—信息概念的中心问题是建立用户需求和文档的表示,及他们之间的相关度(relevance)计算模型(IRmoder),简单的说即给定一定查询,将所有文档安排和该查寻相关度的大小进行排序后返回给用户。面向文本的信息检索系统化称为文本检索模型,到目前为止,人们已经提出若干检索模型并在实际中得到了广泛应用,包括布尔逻辑模型和概率检索模型。类型:⑴布尔逻辑模型(BooleanRetrievalModel,简称BRM):逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要有“与”(AND*)、“或”(OR+)、“非”(NOT-):①如果用AND联接检索词A与B,则检索式为AANDB(A*B),表示让系统检索同时迎合A与B的集合C;②如果用OR联接检索词A与B,则检索式为AORB(A+B),表示让系统查找含有检索词A、B之一或同时包含的信息;③如果用NOT联接检索词A与B,则检索式为ANOTB(A-B),表示被检索文献含有检索词A而不含有检索词B时才能命中。⑵概率检索模型(ProbabilityRetrievalModel,简称PRM):概率检索模型是在布尔逻辑模型基础上为解决检索中存在的不确定性,在概念检索模型首先设定标引词的概率值,一般是在检索任务重复多次,每一个检索用户对检出的文档进行相关性判断,再利用这种反馈信息根据每个词在相关文档集合和无关文档集合的分布情况计算它们的相关概率,将词的权值设计为:)1()1(lg''pppp[注:p—某词在相关文档中出现的概率P´—某词在无关文档中出现的概率]原理—某一文档的权值则是它所含的标引词,于是文档D与用户检索请求Q相关概率可定义为)1()1(lg),(''wpwppwpwdaS,其中p、p´分别为W在相关文档和无关文档中的概率⑶向量空间检索模型(VectorRetrievalModel,简称VRM):原理—基本思想是文档和检索请求(RetrievalQuery)都可以用向量表示,检索过程就可看成是计算文档向量与检索请求向量间的相似度,可以根据相似度值的不同,对检索结果进行排序,可以根据检索结果做进一步相关反馈结果。该模型引用线性代数理论,将待检文档与检索提问都表示成向量,而向量中的元素则是索引词,其数字形式如下:)......,(211iniiwwwd[注:待见文档有n个可检项(term),文本id可表示为一个n维向量;ijw表示为文本id的第j维权值。]④模糊检索模型(FuzzyRetrievalModel,简称FRM)4.信息检索语言—信息检索语言是根据信息检索需要创制的一种人工语言,又称检索语言、信息存贮与检索语言、文献工作语言、索引语言、标引语言、信息检索标识、标识系统等等。信息检索语言由词汇和语法组成。词汇是指登陆在分类表、词表中的全部标识,一个标识(分类号、检索词、代码)就是它的一个语词,而分类表、词表则是它的词典;语法是指如何创造和运用那些标识(单个标识或几个标识的组合)来正确表达文献内容和情报需要,以有效地实现情报检索的一整套规则。5.信息检索效率评价的指标—⑴查全率⑵查准率13⑶漏查率⑷误查率第七章信息服务1.信息服务的原则—⑴针对性原则⑵及时性原则⑶易用性原则⑷成本/效益原则
本文档为【中国人民大学《信息管理学基础》(马费成 武汉大学出版社)考研复习笔记】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥12.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
a谷雨c燕
擅长CFD模拟仿真、考研、模板
格式:pdf
大小:329KB
软件:PDF阅读器
页数:13
分类:工学
上传时间:2019-03-02
浏览量:286