您现在的位置:233网校 >二级建造师 > 专业工程管理与实务 > 水利水电工程辅导 > 水利水电工程学习笔记

谈谈数据库技术在防洪中的作用与应有前景

来源:233网校 2008-08-07 08:25:00

  2 数据库技术在防洪工作中的应用前景与发展趋势

  2.1采用分布式数据库技术,构建流域数据平台

  分布式数据库系统(Distributed Database System,简称DDBS)是数据库系统和计算机网络相结合的产物。由于数据库应用需求的拓展和计算机硬件环境,特别是网络技术的发展,使分布式数据库系统应运而生,并成为计算机技术最活跃的研究领域之一。英国国家计算中心(National Computing Centre)专门对分布式数据库作了分析和预测,断言:“分布式系统,特别是以分布式数据库作为该系统的核心,将成为今后计算机科学发展的主要方向之一。

  分布式数据库系统,通俗地说,是物理上分散而逻辑上集中的数据库系统。因此,可以被看成是:数据库系统+计算机网络,但是它又有别于这二者的简单结合。这是因为:

  (1)如果在计算机网络中,每个结点都装有数据库系统,其数据虽然可以达到共享,但却没有统一的管理,而且对于用户来说,当使用外场地数据时必须指明场地位置,达不到场地透明性。

  (2)如果只在计算机网络中某一场地设置数据库系统,其它场地不设,这就如数据库系统有多个终端(远程)用户,显然达不到数据分散存储的目标。

  因此,分布式数据库系统的严格定义是:分布式数据库是一组数据库集,逻辑上它们属于同一系统,而物理上它们分散在用计算机网络连接的多个场地上,并统一由一个分布式数据库管理系统管理。

  出于防汛工作的需要,淮委与淮河流域各省、各地区都建立了水情、防洪工程等数据库。随着对防汛工作要求的不断提高,防汛有关的信息在单位与部门之间迫切需要实现共享。共享防汛数据资源的方式之一,就是采用分布式数据库技术,将数据放置在数据库中供大家调用。如果采用集中式数据库,存在着通信开销大、性能欠佳、可用性不高、可扩充性差以及难以管理等缺点。

  集中式数据库由于所有的数据都存在同一台服务器,数据量大,而同时所有的用户都必需从这一台服务器中提取数据,数据库服务器很难同时快速的响应这么多客户机的请求。这样数据库的性能就会成为整个防汛系统的瓶颈。另外,防汛数据来自流域各省,如果数据集中管理,工作量非常之大,数据的更新维护都会出现问题。而如果采用分布式数据库,在流域内构建一个数据平台,一方面实现了数据共享,另一方面,数据由不同的地区进行管理维护。各省或各地区对本部门的资料相对要熟悉,而且数据维护工作也分散开了,这样就提高了数据管理的可维护性。

  比起集中式数据库,分布式数据库有下列4个优点。

  (1)有利于改善性能。大部分数据可以就地访问,减少通信开销,避免集中式数据库成为系统性能瓶颈。

  (2)可扩充性好。可以根据发展的需要增减结点,或对系统重新配置,比集中式数据库灵活。

  (3)可用性好。系统部分失效后,完好的部分仍可继续运行。如果采用冗余技术,还可以获得一定的容错能力。

  (4)自治性好。可以分散管理,统一协调。各个部门的用户总是希望拥有自己的数据,管理自己的数据,同时又想共享其他部门的有关数据。分布式数据库比较好地满足了用户的这些要求。

  由此可见,采用基于分布式技术的数据库系统,构建流域防汛数据共享平台是将来数据库发展的趋势。

  2.2数据挖掘技术的应用

  数据挖掘技术是数据库的新的应用方法,它的任务就是提取隐含于数据库中的、未知的、有用的、不一般的(即不是像OLAP中那样的总和、平均值之类的普通信息)信息或知识,数据挖掘又称数据库中的知识发现。在数据库系统中,人们通过查询获得所需要的数据,数据经过人的理解或解释,成为有用的信息。但数据库的查询手段一般只限于一些基本的数据库操作和聚集函数,通过数据库只能对数据库数据“粗加工”,从中获取一些初级的综合信息。数据库中常常蕴涵着规则、规律、论断之类的高层次信息或知识。仅仅通过查询处理不可能获得这些高层次信息,需要在数据库所提供的数据基础上,经过分析、推理等方法加以“挖掘”。数据挖掘的结果是概念化的知识,这些知识源于数据,但高于数据。

  随着数据库技术的不断发展及数据库管理系统在防汛工作中的广泛应用,水文数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的、尚待进一步开发的信息,如果能把这些信息从数据库中抽取出来,也就是从数据中发现知识和寻找规律,并用它们指导防汛抗旱等工作,将会提高水文工作的质量和水平,促进水文信息化和现代化建设,创造更大的经济效益和社会效益。

  数据挖掘与传统分析(如查询、报表、联机应用分析)的本质区别是,数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。先前未知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

  数据挖掘的一般步骤是:问题理解和提出→数据准备→数据整理→建立模型→评价和解释。从研究者的主观愿望来说,希望数据挖掘过程的最好全自动化。但从目前的技术发展水平来看,在数据挖掘过程中,适当介入一些人工干预、引导或限制,可以提高数据挖掘的有效性和有用性。因此,数据挖掘至少在目前应看成一个人-机交互过程。

  淮委水文局所建的历史水文数据库资料数据累计量已达2~3G,此外还有大量的的天气、工程信息等数据,随着水利信息化工作的不断深入,数据库中的信息量还会大量的增加。这些数量巨大的数据,既为进行水文分析提出了新的方法上的要求,同时也为新的方法的应用提供了可靠的数据保障。进行水文分析所需要处理的数据量很大,沿用传统的技术工具和方法,从这些数量巨大、类型复杂的数据中及时准确地挖掘出满足需要的知识,必然会因为计算能力、存储能力、算法的不足而无能为力。因此,需要有效的水文数据挖掘技术。水文数据挖掘可以应用决策树、神经网络、覆盖正例排斥反例、概念树、遗传算法、公式发现、统计分析、模糊论等理论与技术,并在可视化技术的支持下,构造满足不同目的的水文数据挖掘应用系统。

  水文数据挖掘是精确水文预报和水文数据分析的重要基础,应当足够重视。在充实完善数据库数据的基础上,积极开展水文数据挖掘工作,可以进一步提高水文信息服务水平。为新时期淮河治理、水资源配置提供科技支撑,为维持淮河健康生命提供优质服务

  2.3空间数据库的建立

  地理信息系统(Geographic Information System, GIS)是以地理空间数据为基础,在计算机软硬件的支持卜,对空间相关数据进行采集、管理、操作、模拟、分析和显示,并采用地理模型分析方法,适时提供多种空间和动态的地理信息,为地理研究和地理决策服务而建立起来的计算机技术系统。目前,也有一部分学者将地理信息系统定义为空间数据的管理系统。

  地理信息系统基础软件的组成可以分两大部分。一是核心部分,一是外围部分。核心部分包括对空间数据和属性数据进行组织、存储、编辑、计算、分析、表示和传输的功能软件和应用模型接口处理软件。通常,GIS系统的基础部分是空间数据库和属性数据库,它们分别存放空间数据和属性数据,在全关系化GIS系统中两库合一统称空间数据库。外围设备,主要是数据获取、制图出版软件。

  空间数据库作为GIS基础软件的核心,存储、管理所有地理数据,是GIS数据流向的起点和终点,提供了包括空间数据的数据存储、数据维护、空间数据查询和空间分析等服务功能。空间数据库的设计与实现,直接关系到整个GIS系统的功能与效率。

  空间数据库是数据库发展的必然趋势。空间数据源,特别是图形、图像的模式识别与矢量数据采集系统产生的图形、图像数据和数字信息源的广泛性,异地、异部门空间数据库和多尺度分布式存储管理问题的产生,以及空间数据融合、数据挖掘、决策支持的需要,决定了数据库向空间数据库、空间数据仓库的发展趋势。

  流域数据和资料是多学科、多行业、多类型和多尺度的海量数据,既具有空间特性,又具有时间特征。数据形式上将包括遥感影像数据、图形数据、统计报表数据、文字信息等,现有的数据多具有异构异源性,需要进行规范、沉淀、提炼和集成,需要根据管理和决策的需求按照面向主题的思路来组织数据,并利用空间数据仓库功能强大的多维分析和复杂的空间分析能力来反映淮河流域不同时空尺度下的动态变化趋势,以便决策者更好的进行流域管理和空间决策。

  3 数据库技术的广泛运用是水利信息化的需要

  水利部提出了“以信息化推动现代化”的要求,强调要重点抓好信息化规划、数字流域系统等工作。水利是一个信息密集型行业。水利信息包括水雨情信息、汛旱灾情信息、水量水质信息、水环境信息、水工程信息等。国民经济的现代化建设离不开水利现代化的保障,而水利信息化是水利现代化的基本标志和重要内容。水利信息化是国家信息化建设的重要组成部分,也是水利事业自身发展的迫切需要。

  数据库为各种水利信息的存储和快速检索提供了技术手段。雨情、水情、工情、灾情各种实时数据、预报数据,水资源遥感信息、地理数据等等都需要以字段编码的形式按一定的表结构有效地组织起来形成支撑数字水利的数据库。各类水利数据库的建设是一项长期艰苦细致的工作,为适应信息互联共享的要求,对各类数据库字段编码进行统一的设计以形成行业规范是目前水利信息化一项极其紧迫的任务。(考试大编辑整理)

相关阅读

添加二级建造师学习群或学霸君

领取资料&加备考群

加入备考学习群

加学霸君领资料

拒绝盲目备考,加学习群领资料共同进步!

互动交流
扫描二维码直接进入

微信扫码关注公众号

获取更多考试资料