首页 [5]石油网格数据挖掘新技术研究

[5]石油网格数据挖掘新技术研究

举报
开通vip

[5]石油网格数据挖掘新技术研究 � � 文章编号: 1000- 2634( 2008) 03- 0152- 03 石油网格数据挖掘新技术研究* 肖基毅 a,胡 蓉 a,王以群 b (南华大学: a.计算机科学与技术学院, b.经济管理学院,湖南 衡阳 421001 ) 摘 � 要: 针对石油勘探开发中很多 TB级和 PB级的数据集在许多情况下分布在一个组织的不同地点或不同组织的 多个数据源被集团内所有用户共享的特点,用网格数据挖掘数据集成技术和网格数据挖掘本体技术, 作为石油勘探 开发行业业务工作流程的信息处理基础设施,以满足石油工业对高...

[5]石油网格数据挖掘新技术研究
� � 文章编号: 1000- 2634( 2008) 03- 0152- 03 石油网格数据挖掘新技术研究* 肖基毅 a,胡 蓉 a,王以群 b (南华大学: a.计算机科学与技术学院, b.经济管理学院,湖南 衡阳 421001 ) 摘 � 要: 针对石油勘探开发中很多 TB级和 PB级的数据集在许多情况下分布在一个组织的不同地点或不同组织的 多个数据源被集团内所有用户共享的特点,用网格数据挖掘数据集成技术和网格数据挖掘本体技术, 作为石油勘探 开发行业业务工作流程的信息处理基础设施,以满足石油工业对高性能计算技术的持续需求。提出了W eb serv ice与 网格技术融合、网格与数据集成技术结合和本体与W eb serv ice合成, 给出了基于 Globus Too lk it 4、开放式网格服务体 系结构和 W eb服务的技术实现 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 。研究表明: 网格计算中的任务管理、任务调度和资源管理等服务可以为分布式 数据挖掘提供极大的便利。 关键词: 网格;数据挖掘; 本体; W eb服务;数据集成; 石油勘探开发 中图分类号: TE89� � 文献标识码: A � � DO I: 10. 3863 / .j issn. 1000- 2634. 2008. 03. 039 引 � 言 石油勘探开发行业是一个高度依赖信息技术的 行业, 网格技术必将得到广泛的应用。网格将成为 勘探开发行业应用的基础设施, 为石油勘探开发中 高新技术的应用提供保障, 全面实现信息共享、数据 共享、知识共享。 在石油勘探开发中应用网格和数据挖掘技术, 可以 [ 1- 4] : ( 1) 提高现有资源的利用率。通过资源的共享 与整合,可以方便地彼此 �借用 ,减小资源的闲置, 提高资源的使用效率。 ( 2) 从大量的数据中发现或 �挖掘 有用的知 识。网格中含有大量分布在各网格节点中的数据, 网格数据挖掘就需要跨多个网格节点实施全局数据 挖掘。网格的数据挖掘是数据挖掘技术和网格计算 的有机结合, 它通过共享解决方案、算法、计算、数 据、存储服务来实施可靠和可扩展的数据挖掘任务, 能够在动态变化的多个节点间共享资源和协调解决 数据挖掘问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 。 1� 网格数据挖掘现状 目前有关网格数据挖掘的研究和应用引起了学 术界和工业界的高度重视,越来越多的研究人员, 研 究机构和石油勘探开发企业投入到其中, 取得了不 少研究成果。近年来, 国内外网格环境下支持数据 挖掘的典型系统和 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 有 [ 5- 9] : ( 1) Know ledge Grid(知识网格 )是一个网格环 境下独立于应用领域的知识发现环境, 它提供了专 门 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 的集成并行和串行数据挖掘服务, 管理基本 的数据集成和数据抽取的知识模型。但该系统只有 精通数据挖掘算法的专家才能熟练使用, 如果对算 法不了解, 难以得出好的模型。 ( 2) Un iversa lKnow ledge Grid(通用知识网格 ) 是一种基于本体的网格架构模型, 可在网格环境下 提供高性能的知识发现和知识集成服务, 为分布异 构海量数据的知识发现和知识集成系统提供一个新 的应用解决方案;可满足不同领域、不同层次用户的 知识发现服务,使系统具有开放性、可扩展性和较好 的用户可用性。但该模型用于网格环境下的数据挖 掘应用还需进一步研究。 ( 3) V ega Gr id( 织女星网格 ) 是中科院计算所 完成的织女星网格计算项目, 它试图提供一个网格 中间件,以实现在其基础设施之上的各类应用,包括 数据挖掘应用。与国内外其它网格研究项目相比, 织女星网格项目的最大特点是其 �服务网格 的概 第 30卷 � 第 3期 � � � � � � � � � � � � 西南石油大学学报 (自然科学版 ) � � � � � � � � � � Vo.l 30� No. 3 � 2008年 � 6月 � � � � � � Journa l o f Southw est Petroleum Un iversity( Sc ience& Techno logy Edition) � � � � � � Jun. � 2008 * 收稿日期: 2007- 01- 11 基金项目: 国家社会科学基金 ( 05BTQ025) ;湖南省教育厅科研项目 ( 06C 724 )。 作者简介: 肖基毅 ( 1962- ) ,男 (汉族 ),湖南新田人,副教授,主要从事网格信息资源共享与数据挖掘研究。 念。但是从平台层面上看, 它与 G lobus项目有一致 的目标,存在竞争关系。 ( 4) China ScienceG rid(中国科学网格 )是中国 的知识网格研究,作为中科院计算所的 � 973 项目, 其目标是研究和建立知识网格。它是一个智能互联 环境, 能使用户或虚拟角色有效地获取、发布、共享 和管理知识资源,并为用户提供所需要的知识服务, 辅助实现知识创新、协同工作、问题解决和决策支 持。它包含了反映人类认知特性的认识论和本体 论,应用了社会、生态和经济学原理, 采纳了下一代 互联网所使用的技术和标准。知识网格将超越现有 的信息检索、过滤、挖掘、问题回答等技术领域。 虽然目前已有一些有关异构结点的网格数据挖 掘算法和系统, 但它们都是为某个特定领域而设计 的,这些算法和系统被扩展, 可支持一般领域的应 用。这些系统中的一部分确实具有集成访问和处理 大型数据集的先进接口, 而且支持典型数据挖掘。 因此, 开展石油网格环境下数据挖掘新技术研究显 得十分重要。 2� 网格数据挖掘的新技术 网格是构筑在 In ternet上的一组新兴技术的基 础架构,其目标是在动态变化的、广域分布的异构虚 拟组织间实现协调资源共享以及多领域的科学和工 程问题求解。数据已成为科学、石油勘探开发行业 等领域的重要资源。要分析和挖掘这些广域分布的 海量数据,以获得新的科学知识、规律和决策支持信 息,传统的数据挖掘模式和技术已不能胜任 [ 10- 12]。 笔者认为,新的研究将需要建立网格数据挖掘的体 系结构,借助数据集成技术和本体技术使网格数据 挖掘系统能够对广域分布的海量数据进行高效和智 能的处理、分析和挖掘, 给科学研究、经济发展和社 会生活带来新的发现和巨大的价值。 2. 1� 网格数据挖掘系统的体系结构 网格的重要特点是分布性和动态性。网格的各 种资源不是集中在一起的, 而是分布在不同的地理 位置, 各种资源也是动态变化的。正是网格的这些 特点及其分布式环境,使得网格的数据挖掘系统不 再局限于传统的集中式数据挖掘系统, 而是和网格 一样具有分布性、动态性和自适应性。因此,设计合 理的数据挖掘系统的体系结构对整个系统影响重 大。另外,处理的数据非常庞大及数据挖掘方法的 计算复杂性也要求网格数据挖掘的算法必须具备分 布式计算和并行计算能力。 2. 2� 网格数据挖掘本体技术 数据挖掘是一个包含多个阶段的知识发现过 程。一个简单但典型的数据挖掘过程可能包括数据 预处理阶段、数据挖掘算法的应用阶段以及对挖掘 结果可视化处理阶段。在每个阶段, 都会有多个算 法或方法供数据挖掘工作者选择, 但仅有一些算法 和方法组合是有效的,即使是数据挖掘领域的专家, 也可能会忽略一些重要的、有助于知识发现的数据 挖掘算法或方法。所以, 将本体概念引入到网格数 据挖掘之中,协助数据挖掘领域的新手或专家对数 据挖掘算法进行选择。 2. 3� 网格数据挖掘的数据集成技术 网格是把整个因特网整合成一个巨大的超级计 算机、实现资源的全面共享。由于网格跨越不同管 理域,因此其信息是分布和异构的, 如何快速准确地 从这些信息中检索出所需要的信息, 就需要一个有 效的信息集成机制。将本体引入网格信息集成中, 建立基于本体的网格数据挖掘数据集成中间件, 为 数据挖掘提供统一的视图。 3� 网格数据挖掘新技术的融合 3. 1� W eb Serv ice和网格技术融合 W eb Serv ice和网格技术融合可解决 �无处不在 的集成计算和资源共享 的应用技术问题。在 HT� ML、SMTP等 Internet标准 协议 离婚协议模板下载合伙人协议 下载渠道分销协议免费下载敬业协议下载授课协议下载 的基础上, 使用基于 XML的文本消息传送模型进行通信, 从而真正实现 分布式W eb系统间跨平台、跨语言的无缝融合, 从 而解决传统分布式体系架构无法解决的在 Internet 环境下的松耦合分布式异构问题。 3. 2� 网格与数据集成技术的结合 随着网格技术的发展和商务处理的全球化, 网 格数据集成技术将成为下一代 Internet网中的信息 融合、信息处理、信息发布等关键技术。Web Serv ice 的不断研究和发展给信息集成技术提供了更广阔的 发展空间。利用本体描述服务的结构、类型和语义, 从而使 W eb Serv ice语义表示模型化、统一化, 从语 义层就解决不同数据源或系统的异构问题。所以, 网格数据集成技术将是充分利用传统的信息集成、 W eb Serv ice、本体、网格技术,构造一个虚拟的、实现 更加高效、准确服务的具有超级计算能力的、能更好 153第 3期 � � � � � � � � � � � � � � 肖基毅等: � 石油网格数据挖掘新技术研究 � 分析数据并获得丰富知识的集成系统。 3. 3� 本体与W eb Serv ice的合成技术 W eb Serv ice是网格进行分布式计算的基本元 素。分布在网格上的各种各样的数据挖掘 W eb Serv ice已经成为一类重要的资源。当这些 W eb Serv ice能够在网格上真正实现自由的互联、互通、协 作和联盟的时候, 就形成了一种与当前的信息W eb 类似的软件W eb。所以, 应使用本体与 Web Serv ice 合成使这些 W eb Serv ice能够自主感应并实现它们 所处的环境中的需求。而且,在单个W eb Service不 能实现全部需求的情况下,多个小粒度的W eb Serv� ice能够自主合成, 形成更大粒度的W eb Serv ice, 最 终实现需求。 4� 实现网格数据挖掘的技术方案 采用 J2EE平台的 W eb Service方案。 J2EE是 使用 Java技术开发企业级应用的一种事实上的工 业标准,它提供一个独立的、可移植性的、多用户的、 安全的和基于标准的企业级平台, 从而简化企业应 用的开发、管理和部署。 采用开放式网格服务体系结构 ( OGSA )。OGSA 是集成关键网格技术和W eb Serv ice机制来创建基 于网格的分布式应用框架。它利用了和W eb Serv ice 同样的底层结构, 例如 XML、SOAP、UDD I和W SDL 等,而且对W eb Serv ice进行了许多重要的概念上和 应用上的扩展。 采用 G lobus Toolkit 4 ( GT4)工具包。最著名的 网格计算研究是美国 A rgonne国家实验室研究的 G lobus项目。2005年 5月 G lobus联合体推出 GT4, 它是一个开放源码的网格基础平台,基于开放结构、 开放服务资源和软件库,并支持网格和网格应用, 目 的是为构建网格应用提供中间件服务和程序库。 5� 结 � 论 ( 1) 提出了W eb Serv ice和网格技术融合、网格 与数据集成技术结合、本体与W eb Service合成的技 术实现方法。 ( 2)提出了实现网格数据挖掘的技术实现方 案,即采用 J2EE平台的W eb Service方案、OGSA和 GT4工具包。该技术的最大特点是网格数据挖掘与 W eb Serv ice紧密结合, 并将一切资源看作服务, 极 大地扩展了网格的应用领域和数据挖掘的有效性。 参考文献: [ 1] � 赵改善, 李剑峰,王于静,等. 网格计算技术及其在石油 勘探开发中的应用前景 [ J]. 石油物探, 2005, 44( 5 ): 413- 420. [ 2] � 汪忠德, 王新海,瞿建华,等. 数据挖掘技术在石油勘探 与开发中的研究及应用 [ J]. 石油工业计算机应用, 2007, 15( 1): 17- 20. [ 3] � 魏佳伟,宗蓉,王秀慧,等.网格技术及其在石油行业的应 用前景 [ J].石油天然气学报, 2005, 27( 3): 562- 563. [ 4] � 李延祥, 马财林, 李燕, 等. 数值模拟软件 ( COM ET2. 11)在大宁地区煤层气勘探中的应用 [ J] . 天然气工 业, 2004, 24( 5) : 100- 103. [ 5] � CannataroM, Talia D, T runfio P. D istributed data m in ing on the gr id [ J]. Fu ture Generation Com pute r Sy stem s, 2002, 18: 1101- 1112. [ 6] � Cannataro M, Talia D, T run fio P. Know ledge grid: high per� formance know ledge d iscovery services on the g rid, 2nd In.t W orkshop on G rid Computer in Con junction w ith Supercom� puting 2001[ C]. Berlin: Spr inger, 2001. [ 7] � Bo rzem sk i L. M in ing internet da ta sets for com putationa l g rids, 9th Inte rnational Conference KES 2005[ C]. Ber lin: Springer, 2005. [ 8] � F io let V, Toursel B. Inte lligent database distr ibution on a gr id using c lustering, 3rd Internationa l A ltanticW eb Intelligence ConferenceAW IC 2005[ C]. Berlin: Spr inger, 2005. [ 9] � Com ito C, Ta liaD, T runfio P. G rid se rv ices: pr incip les, im� p lem entations and use[ J]. Interna tiona l Java. J. W eb and G rid Serv ices, 2005, 21( 1): 48- 68. [ 10] � BuetiG, Cong iusta A, Ta lia D. Developing d istributed da� ta m ining app lications in the know ledge gr id fram ew ork, 6 th Interna tiona l Con ferenceVECPAR 2004[ C ]. Ber lin: Spr inge r, 2005. [ 11] � H um e C, L ioyd D, S loanM, et a.l Apply ing g rid techno lo� g ies to d istr ibuted data m ining, 3rd Interna tiona l Confe r� ence GCC2004[ C]. Ber lin: Springer, 2004. [ 12] � H ai Z G. A know ledge g rid mode l and platform for g loba l know ledge sharing [ J]. Expert Systems w ith Applications, 2002, 22: 313- 320. (助理编辑: 朱正喜 ) 154 西南石油大学学报 (自然科学版 ) � � � � � � � � � � � � � � � � 2008年 Journal of Southwest Petroleum University( Science& Technology Edition) � � � � � � No. 3 NEW TECHNOLOGY STUDY ON PETROLEUM GRID DATAM INING XIAO Ji�y ia, HU Ronga, WANG Y i� qunb ( N anhua Un iversity: a. Schoo l of Computer Science and Techno logy; b. Schoo l o f Econom ics andM anagem en,t H engyang Hunan 421001, Ch ina) . JOURNAL OF SOUTHWEST PETROLE� UM UN IVERSITY(SCIENCE & TECHNOLOGY ED ITION ), VOL. 30, NO. 3, 152- 154, 2008( ISSN 1000- 2634, IN CH INESE ) Abstract: In petro leum explorat ion and production areas, massive data co llections o f terabyte ( TB ) and petabyte ( PB) scale need to be used and ana ly zed, moreover, in many cases, these data sets should be shared by large com� mun ities o f users that pool their resources from different sites o f a sing le o rgan ization o r from a large number of insti� tut ions. G rid w ill become the info rmation infrastructure of businessw orkflow in the petro leum industry. Advances in grid computing technology w illm eet the tremendous and scalab le demands of petroleum explorat ion and production for h igh performance computing. G rid platform can provide a lo t of use fu l serv ices w hen peop le process data sets, task managemen,t fo r example, resourcem anagemen t and scheduling are som e o f these services. To show the benefits of the g rid env ironmen,t the grid datam ining in tegrat ion techno logy and the grid datam in ing onto logy technology are presented. Integ ratingW eb serv ice and gr id techno logy, g rid and data integration techno logy and composing onto logy andW eb service are presented, too. This performance is implemen ted on top of the G lobus Too lk it 4, the open g rid services arch itecture andW eb serv ice. Key words: grid; data m in ing; onto logy; W eb serv ice; data in tegrat ion; petro leum exploration and development CITY GAS STATIONMARKETING PERFORMANCE EVALUATION BASED ON THE BEHAVIOR LIU H ong�yuan1, 2, YU X iao� zhong2, SH I Sh i� x in3, YAN Jun�m ei2 ( 1. School o f Econom ic& M anagemen,t South� west Jiao tong Un iversity, Chengdu S ichuan 610031, Ch ina; 2. Staffdepartment of School of E conom ic & M anage� ment, Southw est Petro lume University, Chengdu S ichuan 610500, China; 3. Panzh ihuaUn iversity, Panzhihua Sichuan 617000, Ch ina ) . JOURNAL OF SOUTHWEST PETROLEUM UN IVERSITY ( SC IENCE & TECHNOLOGY ED I� TION ), VOL. 30, NO. 3, 155- 158, 2008( ISSN 1000- 2634, IN CH INESE ) Abstract: In the competit ive marketmode,l the perform ance of city gas stat ion is created by the acts of sales, wh ile the sa les are generated by the behav ior o f consumer aw areness, consum er behav ior, the competitive env ironmen,t marke ting innovat ion and o ther elements o f composition, perform ed by the sa les marketing common elemen ts of the resu lt. B ased on th is understand ing, such factors as sa les o f consumer aw areness, buy ing behav ior, market structure, innovat ion const itute the overa ll index, and according to intron system, them ain ind icato rs o f the indicators are de� composed, the city gas stationsM arket ing Perform ance Evaluation System is constructed, in accordancew ith the in� dex system level nature, by using hierarch ical analysis methods and se lection o f spec ific stations, the construction o f the index system is tested. The results show that consumer satisfact ion, loyalty and recogn it ion o f the quality of serv� ice performance o f gas stations have an important impact on market ing. Key words: city gas station; marke ting performance; index system; sa les practices RESEARCH AND APPLICATIONG OFMONTHLY NATURAL DECLINE RATE PERDICTION XIAO W u 1, 2 , ZHANG X iao� tian2, D ING L i2 ( 1. Facu lty of Resources, China Un iversity o f G eosciences, Be ijing 100083, Ch ina; 2. Geolog ical Scient ific Research Institute o f Sheng li O ilf ie ld, SINOPEC, Dongying Shandong 257015, Ch ina ) . JOURNAL OF SOUTHWEST PETROLEUM UN IVERSITY ( SC IENCE & TECHNOLOGY ED I� TION ), VOL. 30, NO. 3, 159- 162, 2008( ISSN 1000- 2634, IN CH INESE ) 18
本文档为【[5]石油网格数据挖掘新技术研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_582576
暂无简介~
格式:pdf
大小:172KB
软件:PDF阅读器
页数:4
分类:工学
上传时间:2012-01-02
浏览量:18