首页 语义网与实用分类系统

语义网与实用分类系统

举报
开通vip

语义网与实用分类系统null语义网与实用分类系统 Semantic Web and Ontologies 语义网与实用分类系统 Semantic Web and Ontologies 秦健 美国雪城大学信息研究学院 jqin@syr.edu提纲提纲语义网的概念 与语义网有关的标准和技术 实用分类系统的定义和作用 语义网发展的过程 实用分类系统的探索性项目 语义网与数字化图书馆 语义网方面的研究课题 早期的网络早期的网络网址标准化 + 网络通讯标准 + 格式兼容终端机PCMACUNIX 工作站HTTP serverFTP se...

语义网与实用分类系统
null语义网与实用分类系统 Semantic Web and Ontologies 语义网与实用分类系统 Semantic Web and Ontologies 秦健 美国雪城大学信息研究学院 jqin@syr.edu提纲提纲语义网的概念 与语义网有关的标准和技术 实用分类系统的定义和作用 语义网发展的过程 实用分类系统的探索性项目 语义网与数字化图书馆 语义网方面的研究课 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 早期的网络早期的网络网址标准化 + 网络通讯标准 + 格式兼容终端机PCMACUNIX 工作站HTTP serverFTP serverGopher serverNNTP server目前的网络目前的网络资源通过极有限的语义相互链接(如:具有表达意义的文件名) 一个资源所在系统无法自动判定其它系统中的资源含义(如:图中资源D通过HREF与资源A和C的链接, 但是无法知道A和C的含义)CABD语义网语义网每个资源有清晰的定义,如软件,文件,人,地点 概念之间的关系有清晰的定义,如软件产生文件,软件依赖于软件,文件的版本,文件具有主题,人所在地点来源:Berners-Lee, 2002产生依赖于依赖于是…的版本主题作者地点在什么是语义网?(1)什么是语义网?(1)语义网就是机器可理解的信息,是数据网或全球性的数据库 原理: 一切可以确定的 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 (人,时间,事件,物体,事物,等)都在网中 每个实体(entity)都有一个统一资源标识(URI) 信息的不完全性 (Web是没有尽头的,语义网也是如此,任何找到的信息都只是部分信息) 网络是不断进化完善的 最少设计 把简单的东西简化,让复杂的东西变得可能 开发简单的应用,着眼于未来的复杂性 不要将不必要的东西标准化 结果要大于部分相加的总和什么是语义网?(2)什么是语义网?(2)语义网的作用是联接相关事件和实体 用VoiceXML标示的一段语音 网络服务(Web Service)描述 部件目录 定购状况 制造过程 化学公式 蛋白质 基因 人 个案历史 日期 日历 事件 地点天气 风险 保险 财务 税 预算 人力资源 假期 飞机航班 餐饮 饮食偏好 个人数据 计算设备 部件目录 ……与语义网有关的标准和技术与语义网有关的标准和技术可扩展置标语言名域国际码统一资源标识可扩展置标语言结构资源描述框架 资源描述框架结构 实用分类系统词表逻辑验证诚信数字化签名能自描述 的文献数据数据 规则 编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf Ontology:实用分类系统Ontology:实用分类系统实用分类系统的主要成分是一整套对某一领域里的知识进行表述的词和术语,编制者根据该知识领域的结构将这些词和术语组成等级类目,同时规定类目的特性及其之间的关系。 为什么需要实用分类系统? 提供机器能够理解的信息结构 使领域知识能够被再利用 课目内容的概念在传统叙词表中的表述课目内容的概念在传统叙词表中的表述课目内容 Course content BT 课目组织 Course organization NT 内容分析 Content Analysis 争议问题(课目内容) Controversial Issues (Course Content) 课目简介 Course Descriptions 课目目标 Course Objectives 课程 Curriculum 课程开发 Curriculum Development 课程指南 Curriculum Guides 选修课 Elective Courses 学位科目内容 Program Content 学位科目的有效性 Program Validation 教科书内容 Textbook Content 验证有效的学位科目 Validated Programs (来源:The ERIC Thesaurus)课目内容的概念在传统叙词表中的表述课目内容的概念在传统叙词表中的表述课目内容 Course content BT 课目组织 Course organization NT 内容分析 Content Analysis 争议问题(课目内容) Controversial Issues (Course Content) 课目简介 Course Descriptions 课目目标 Course Objectives 课程 Curriculum 课程开发 Curriculum Development 课程指南 Curriculum Guides 选修课 Elective Courses 学位科目内容 Program Content 学位科目的有效性 Program Validation 教科书内容 Textbook Content 验证有效的学位科目 Validated Programs (来源:The ERIC Thesaurus)叙词表中的同位词之间并不能显示叙词在概念上的联系注:同一颜色的词有概念上的联系课程内容的概念在实用分类系统中的表述课程内容的概念在实用分类系统中的表述课程 Curriculum课目 Course课目目标 Course objective课目简介 Course description课目类型 Course type课程指南 Curriculum guide学位科目 Program(必修,必选,选修)有课程开发 Curriculum development学科 Discipline学位科目内容 Program content有有目标能力实践实际环境类目 Class特性 property类目 Class下位类 Subclass目标类型有有有特性类型 Property type实用分类系统的例子实用分类系统的例子类目等级结构类名类目定义特性名特性类型限制赋值实用分类系统的组成部分实用分类系统的组成部分类目 (Class,Concept) 类名 class name 定义 definition, documentation 类目类型 class type 特性 (Property, Slot, Role) 特性名 Name 特性类型 Type 特性限制 Constraint, Cardinality 赋值范围 Domain/facets 例子:人及其特性例子:人及其特性PersonManagerTechnicianSubclass:Class:a-kind-ofName ID Role AddressID Phone number Emailhas-property-ofName: Peter Creticos ID: 123456789 Role: Director AddressID: Address101 Phone number: 217-234-5678 Email: peter@workforce.orgInstance:Property: is-ais-ais-ais-aName: Joe Needleman ID: 22345678 Role: Technician AddressID: Address101 Phone number: 217-234-5677 Email: joe@workforce.orghashas叙词表与实用分类系统的比较叙词表与实用分类系统的比较实用分类系统的应用 实用分类系统的应用 医学 电子商务 房地产 金融财务 制造业、工商业的供应链(Supply chain) 电子教学 (e-learning) 图书馆目录 。。。。。。构造知识模型确定概念及 其相关关系用XML/RDF 表述知识模型以知识模型为 基础设计系统实施系统设计实用分类系统的设计、开发、实施过程语义网第一发展阶段语义网第一发展阶段制定有关标准,为语义网的发展提供基础 资源描述框架/可扩展置标语言说明书(RDF/XML Syntax Specification (Revised)) 资源描述框架词汇描述语言1.0:资源描述框架结构(RDF Vocabulary Description Language 1.0: RDF Schema) 资源描述框架概要(RDF Primer) 资源描述框架:概念与定义方式(Resource Description Framework (RDF): Concepts and Abstract Syntax) 资源描述框架语义(RDF Semantics) 资源描述框架检验个案(RDF Test Cases) 网络实用分类系统语言使用个案与 要求 对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗 (Web Ontology Language (OWL) Use Cases and Requirements ) 网络实用分类系统语言参照(OWL Web Ontology Language Reference) 网络实用分类系统语言语义及定义方式(OWL Web Ontology Language Semantics and Abstract Syntax) 网络实用分类系统语言综述(OWL Web Ontology Language Overview) 网络实用分类系统语言检验个案(OWL Web Ontology Language Test Cases) 网络实用分类系统语言指南(OWL Web Ontology Language Guide) 以上标准均在今年2月10日通过成为W3C的推荐级标准语义网第一发展阶段制定的标准语义网第一发展阶段制定的标准可扩展置标语言名域国际码统一资源标识可扩展置标语言结构资源描述框架 资源描述框架结构 实用分类系统词表逻辑验证诚信数字化签名能自描述 的文献数据数据规则语义网第二发展阶段语义网第二发展阶段与第一阶段非常不同 在第一阶段的基础上进一步发展 百家争鸣,比第一阶段的限制少一些 许多建立在RDF之上的新工具和语言 许多新的应用 RDF和OWL将这些语言和应用联系在一起 对新语言进行扩展软件工具的开发 (1) 软件工具的开发 (1) Protégé-2000 http://protege.stanford.edu/ 美国斯坦福大学医学院开发 使用Java和Open Source作为操作平台 可用于编制实用分类系统和知识库(Knowledge Base),有可自行设置的数据输入格式,能够输入数据,也可插入插件来扩展一些特殊的功能如提问、XML转换等。 输出格式有文本、HTML、JDBC、RDF Schema、及XML Schema。 软件工具的开发 (2)软件工具的开发 (2)OntoEdit http://www.ontoprise.de/ 德国的Ontoprise公司开发 提供实用分类系统 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 环境,支持构造概念、关系、定理,不依赖于某一表述语言 利用模块和插件结构,灵活性强,并能够方便地引进专门功能和词库。 支持RDF和DAML (DARPA Agent Markup Language, 国防高级研究项目部智能代理置标语言),并能输入和输出数据库结构与数据(如Oracle, MSSQL, DB2)。 语义网基本组成语义网基本组成URI作为全球标识,如:http://exmaple.com/foo.rdf#bar 利用标识在网上进行查找 大量的词表—实用分类系统—在领域边缘相互连接 真正的系统一般只在语义网的一小部分范围内工作收集和编制实用分类系统收集和编制实用分类系统利用有结构的来源:数据库结构、某些叙词表、术语分类表 利用半结构的来源:网页(特别是XML标记的网页)、词汇、字典 利用无结构的来源:任何其它的文件集合探索性的实验项目 探索性的实验项目 利用已有的叙词表或分类表来改造成实用分类系统 将《艺术和建筑叙词表》中的西方家具部分改造成实用分类系统 (Wielinga等,2001) 英国曼彻斯特大学的OpenGalen项目(Rectoret al 2001) 利用现有文献和领域专家从头做起 美国加州大学圣巴巴拉分校的地理科学数字化图书馆项目 (Smith & Zeng, 2003) OpenGalen实用分类系统的概念表述实例 OpenGalen实用分类系统的概念表述实例 语义网与数字化图书馆 (1)语义网与数字化图书馆 (1)(来源:Kashyap, 2002)语义网与数字化图书馆 (2)语义网与数字化图书馆 (2)数字化的信息资源建立了超出传统图书馆服务的物质基础 信息查找面的扩大: 从文献到事实的查询 从文献到事实到知道事实的人(专家) 对编目索引数据(元数据)要求更细: 人、事件、地点、事物等之间的关系 提供与信息资源相关的具体情况(context)和过程(process)的信息 语义网给数字化图书馆提供了超出传统图书馆服务的理论和技术语义网在科研中的应用语义网在科研中的应用为科研工作中产生的大量数据提供编制元数据、检索、存档的服务, 如: 空间卫星扫描地面积累的数据 临床药物试验的数据 地质勘探数据 环境污染监测数据 科研数据的元数据、存档、检索有赖于语义网的原理和技术 建立学科领域的实用分类系统来制定元数据结构和检索系统 利用实用分类系统来促进交叉学科领域的数据分享和再利用例子:利用元数据管理数据挖掘的结果例子:利用元数据管理数据挖掘的结果(来源:Springmeyer et al 1996)语义网的应用前景语义网的应用前景图书馆面临的挑战图书馆面临的挑战未来图书馆员需要了解: 语义网的理论、标准、技术 实用分类系统的设计、编制、实施 如何与领域专家、系统设计人员合作开发研制为科研、教育服务的语义网应用项目 如何利用语义网的技术为图书馆的现有资源和服务增加价值 应付挑战的策略应付挑战的策略数字化信息资源和服务是趋势,传统图书馆文献处理和服务不能充分利用数字化技术的优势,也无法满足用户的需求 应付挑战的策略: 着眼于完全数字化的资源:将新文献新数据的产生结构化,为自动生成元数据、有结构的数据打基础 着眼于完全数字化的服务:文献、事实、数据等的查找和传送直接在用户的办公桌上完成 这两大方面的策略包含一系列利用语义网和实用分类系统地工具和方法语义网研究开发课题(1)语义网研究开发课题(1)按照当前的实用分类系统与有关技术的标准建立中文的实用分类系统: 建系统的过程可以先选择几个重要而又常用的应用领域(如数字化图书馆元数据自动抽取、电子培训、灾难应急系统等)作为实验,积累一套方法、程序和工具,再推广到其它领域 对已建成的外文实用分类系统进行翻译和语义匹配,作为可互操作性的前提 语义网研究开发课题(2)语义网研究开发课题(2)对应用领域(domain)的结构、词和术语、用户的习惯进行调研,为编制领域实用分类系统(domain ontologies) 提供可靠的一手资料: 利用图书馆已有的知识组织工具(叙词表和分类法)和技术(叙词表和分类法的编制),同时结合实用分类系统、数据库、方法论方面的研究,结合情报检索技术和方法,以及语义网服务涉及方法与信息模型构造方面的研究 建立语义网的基础,包括实用分类系统的内容(即专业领域,如医学、财政、制造业等) 参考文献参考文献Bernard-Lee, T. (2000). Semantic Web - XML2000. Available: http://www.w3.org/2000/Talks/1206-xml2k-tbl/Overview.html Bernard-Lee, T. (2002). The Semantic Web - LCS seminar. http://www.w3c.org/2002/Talks/09-lcs-sweb-tbl/ Rector, A. L., C. Wroe, J. Rogers, & A. Roberts, (2001). Untangling taxonomies and relationships: personal and practical problems in loosely coupled development of large ontologies. In Y. Gil, M. Musen, & J. Shavlik (Ed.) Proceedings of the international conference on knowledge capture (K-Cap’01) (pp. 139-146), New York: ACM. Smith, T. R. & Zeng, M. L. (2003). Building semantic tools for concept-based learning spaces: knowledge bases of strongly-structured models for concepts in advanced DL. Unpublished paper. Springmeyer, R., N. Werner, and J. Long. (1996). Mining scientific data archives through metadata generation. http://www.llnl.gov/ia/sc95/IEEE_apr96/ Wielinga, B. J., Schreiber, A., Wilemaker, J., & Sandberg, J. A. (2001). From thesaurus to ontology. In Y. Gil, M. Musen, & J. Shavlik (Ed.) Proceedings of the international conference on knowledge capture (K-Cap’01) (pp. 194-201), New York: ACM.
本文档为【语义网与实用分类系统】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_726854
暂无简介~
格式:ppt
大小:526KB
软件:PowerPoint
页数:0
分类:互联网
上传时间:2010-05-29
浏览量:52