《空间数据库原理与方法》笔记/期末复习资料(重点课后习题) 您所在的位置:网站首页 数据库期末试卷怎么做 《空间数据库原理与方法》笔记/期末复习资料(重点课后习题)

《空间数据库原理与方法》笔记/期末复习资料(重点课后习题)

2024-07-11 17:39| 来源: 网络整理| 查看: 265

目录

1. 空间数据和空间数据库有哪些主要特征?

1.1. 空间数据的主要特征

1.1.1. 时空特征

1.1.2. 多维特征

1.1.3. 多尺度特征

1.1.4. 海量数据特征

1.2. 空间数据库的主要特征

1.2.1. 综合抽象特征

1.2.2. 非结构化特征

1.2.3. 分类编码特征

1.2.4. 复杂性与多样性特征

2. 空间数据库与传统数据库相比有何差异?

2.1. 信息描述差异

2.2. 数据管理差异

2.3. 数据操作差异

2.4. 数据更新差异

2.5. 服务应用差异

3. 空间数据库有哪些主要作用?目前空间数据库还存在哪些主要问题?

3.1. 空间数据库的主要作用

3.1.1. 空间数据处理与更新

3.1.2. 海量数据存储与管理

3.1.3. 空间分析与决策

3.1.4. 空间信息交换与共享

3.2. 目前空间数据库存在的主要问题

3.2.1. 数据共享问题

3.2.2. 数据“瓶颈”问题

3.2.3. 数据安全问题

4. 数据库设计的基本过程分为哪几个阶段?

4.1. 需求分析

4.2. 概念结构设计

4.3. 逻辑结构设计

4.4. 物理结构设计

4.5. 数据库实施

4.6. 数据库运行与维护

5. 合并分 E-R 图时需要解决的冲突有哪几类?

5.1. 属性冲突

5.2. 命名冲突

5.3. 结构冲突

6. 试述把 E-R 图转换为关系模型所依据的原则。

7. 数据库实施和维护阶段的主要工作是什么?

7.1. 数据库实施阶段的主要工作

7.1.1. 建立实际的数据库结构

7.1.1.1. 数据库模式与子模式,以及数据库空间等的描述

7.1.1.2. 数据库完整性描述

7.1.1.3. 数据库安全性描述

7.1.1.4. 数据库物理存储参数描述

7.1.2. 数据加载

7.2. 数据库维护阶段的主要工作

7.2.1. 对数据库性能的监测和改善

7.2.2. 数据库的转储和恢复

7.2.3. 数据库的安全性、完整性控制

7.2.4. 数据库的重组(织)与重构(造)

8. 简述空间数据库建库的主要内容。

8.1. 资料准备和预处理

8.2. 数据采集

8.3. 数据处理

8.4. 空间数据建库

1. 空间数据和空间数据库有哪些主要特征? 1.1. 空间数据的主要特征 1.1.1. 时空特征

时空特征指的是描述地理空间中事物位置和运动状态随时间变化的特征。这包括事物在空间中的位置、速度和加速度等运动状态,以及这些状态随时间的变化。对于空间数据而言,时空特征是非常重要的,因为它们提供了地理现象在时空维度上的全面描述。时空特征的分析可以帮助我们理解事物的运动规律、趋势和变化。

(通过大量研究,认为地学信息具有多维结构,一般由空间、属性和时间三部分构成,那么对其进行建模就是对空间、属性和时间三者的提问域和答案域都要作出回答。空间数据的空间特性是指空间实体的空间位置及其与其他空间实体的空间关系,指明地物在地理空间中的位置,用于回答 "Where" 提问。空间位置可以用绝对空间位置和相对空间位置来表示。绝对空间位置用来表示地物本身的地理位置,通常用笛卡儿坐标、地理经纬坐标、空间直角坐标 (x,y,x)、平面直角坐标和极坐标等来表示地理空间实体在一定的坐标参考系中的空间位置。相对空间位置用来表示多个地物之间的位置相互关系,通过距离和方向描述相对于其他参照系或地物的空间位置,如某观测站位于某高地 135° 方向 500m 处。空间关系则是地理空间实体之间存在的一些具有空间特性的关系,如拓扑关系、顺序关系和度量关系等。空间特征是空间数据最基本的特征,空间数据记录了地理空间实体对象的空间分布位置和几何形状等空间信息,所以在使用空间数据时首先需要考虑的就是空间特征。属性特性是指地学现象的数量、质量和分类等属性信息,包括用来描述地物的自然或人文属性的定性或定量指标的成分,用于回答 “What” 和 “How” 提问。可以用名义量、顺序量、间隔或比率来表示。例如,表述一个城镇居民点,若仅有位置坐标 (x,y),那只是一个几何点,要构成居民点的地理空间数据,还需要经济(人口、产值等)、社会(就业率等)、资源和环境(污染指数等)等属性数据。时态特性指地理数据采集或地理现象发生的时刻或时段,这部分数据称为时态特征数据或时态数据。同一地物的多时段数据,可以动态地表现该地物的发展变化。时态特征数据可以按时间尺度划分为短期(如地震、洪水、霜冻)、中期(如土地利用、作物估产)、长期(如城市化、水土流失)和超长期(如地壳变动、气候变化)等类型。)

1.1.2. 多维特征

多维特征指的是空间数据具有多个维度的特征。在地理信息系统(GIS)和空间数据分析中,空间数据往往涉及到多个维度的信息,如地理坐标、高度、温度、湿度、人口密度等。通过对多维特征的分析,我们可以更全面地理解空间数据所包含的信息,揭示不同维度之间的关联和规律。

(地理空间数据具有多维结构的特征。地理空间实体或地理现象本身具有各种性质,空间目标的属性特征也称为主题、专题,是与地理空间实体相联系的、具有地理意义的数据和变量,用于表达实体本质特征和对实体的语义定义,一般分为定性(如类型、名称、特征值)和定量(如数量、等级)两种。属性之间的相关关系反映实体间的分类分级语义关系,主要体现为属性多级分类体系中的从属关系、聚类关系和相关关系。地理空间数据不仅能描述空间三维和时间维,也可以表现空间目标的属性以及数据不同的测量方法、不同来源、不同载体等多维信息,实现多专题的信息记录。例如,在一个坐标位置上、既包括地理位置、海拔高度、气候、地貌和土壤等自然地理特征、也具有相应的社会经济信息如行政界线、人口、产量、交通等。此外,一些空间对象或地理目标(如河流)同时又作为其他空间目标的分界线,也是空间数据多重属性的表现。在进行空间数据分析过程中,要重视并充分考虑地理空间数据的多维结构及其对空间关系的影响,为地理系统的综合研究提供技术支持。)

1.1.3. 多尺度特征

多尺度特征指的是空间数据在不同空间尺度上呈现出不同的特征。地理空间具有多种尺度特征,从微观的点线面到宏观的区域和全球范围都可能涉及不同的空间尺度。多尺度特征的分析可以帮助我们理解地理现象在不同尺度下的表现形式,揭示其内部结构和相互作用关系。

(尺度是空间数据的重要特征之一。空间数据的多尺度特征可从空间多尺度和时间多尺度两个方面进行理解。正是空间数据的多尺度特征,导致空间数据的综合难度加大,不利于数据管理和共享。地球系统是由各种不同级别子系统组成的复杂巨系统,各个级别的子系统在空间规模和时间长短方面存在很大差异,而且由于空间认知水平、精度和比例尺等的不同,地理实体的表现形式也不相同,因此多尺度性成为地理空间数据的重要特征。在空间数据中多尺度特征包括空间多尺度和时间多尺度两个方面。空间多尺度是指空间范围大小或地球系统中各部分规模的大小,可分为不同的层次;时间多尺度指的是地学过程或地理特征有一定的自然节律性,其时间周期长短不一。空间多尺度特征表现在数据综合上,数据综合类似于数据抽象或制图概括,是指数据根据其表达内容的规律性、相关性和数据自身规则,可以由相同的数据源形成再现不同尺度规律的数据,它包括空间特征和属性的相应变化。多尺度的地理空间数据反映了地球空间现象及实体在不同时间和空间尺度上具有的不同形态、结构和细节层次,应用于宏观、中观和微观各层次的空间建模和分析应用。)

1.1.4. 海量数据特征

海量数据特征指的是空间数据具有大规模、高密度的特征。随着遥感技术、地理信息采集技术的发展,获取的空间数据越来越庞大,其中包含了大量的地理信息。海量数据特征的分析需要借助于大数据技术和空间数据挖掘技术,以有效地管理、处理和分析这些海量数据,从中提取有用的信息和知识。

(GIS 地理空间数据的数据量极大。它既有空间特征(地学过程或现象的位置与相互关系),又有属性特征(地学过程或现象的特征)。空间数据不仅数据源丰富多样(如航天航空遥感、基础与专业地图和各种经济社会统计数据),而且更新快,空间分辨率不断提高。随着对地观测计划的不断发展,每天可以获得上万亿兆字节的关于地球资源、环境特征的数据,对海量空间数据组织、处理和分析成为目前 GIS 亟待解决的问题之一。空间数据量是巨大的,通常称海量数据。之所以称为海量数据,是指它的数据量比一般的通用数据库要大得多。一个城市地理信息系统的数据量可能达几十吉字节,如果考虑影像数据的存储,可能达几百吉字节。这样的数据量在其他数据库中是很少见的。地理信息系统的海量数据,带来了系统运转、数据组织与储存、网络传输等一系列技术困难,自然也给数据管理增加了难度。正因为空间数据量大,所以需要在二维空间上划分块或者图幅,在垂直方向上划分层来进行组织。)

1.2. 空间数据库的主要特征 1.2.1. 综合抽象特征

空间数据库可以综合存储地理空间数据、属性数据和拓扑关系数据。地理空间数据包括点、线、面等地理要素,属性数据则包括这些地理要素的属性信息,例如人口数量、土地利用类型等。而拓扑关系数据则用于描述地理要素之间的空间关系,比如相邻、覆盖等。

(空间数据描述的是现实世界中的地物和地貌特征,非常复杂,必须经过抽象处理。不同主题的空间数据库,人们所关心的内容也有差别。因此,空间数据的抽象性还包括人为地取舍数据。抽象性还使数据产生多语义问题。在不同的抽象中,同自然地物表示可能会有不同的语义。例如,河流既可以被抽象为水系要素,也可以被抽象为行政边界,如省界、县界等。)

1.2.2. 非结构化特征

地理空间数据具有一定的非结构化特征,即其空间位置和形状难以用传统的关系型数据库模型完全描述。因此,空间数据库需要支持对非结构化空间数据进行有效的存储和查询,以满足地理信息系统中对地理空间数据的需求。

(在当前通用的关系数据库管理系统中,数据记录一般是结构化的,即它满足关系数据模型的第一范式要求,也就是说每一条记录是定长的数据项表达的只能是原子数据,不允许嵌套记录,而空间数据则不能满足这种结构化要求。若将一条记录表达成一个空间对象,它的数据项可能是变长的。例如,1 条弧段的坐标,其长度是不可限定的,它可能是 2 对坐标,也可能是 10 万对坐标;此外,1 个对象可能包含另外的 1 个或多个对象。例如,1 个多边形,它可能含有多条弧段。若 1 条记录表示 1 条弧段,在这种情况下,1 条多边形的记录就可能嵌套多条弧段的记录,因此,它不满足关系数据模型的范式要求,这也就是空间图形数据难以直接采用通用的关系数据管理系统的主要原因之一。)

1.2.3. 分类编码特征

空间数据库通常需要对地理要素进行分类编码,以便进行空间数据的组织和管理。分类编码可以帮助用户对不同类型的地理要素进行识别和区分,同时也方便了空间数据的检索和分析。

(一般而言,每一个空间对象都有一个分类编码,而这种分类编码往往属于国家标准、行业标准或地区标准,每一种地物的类型在某个 GIS 中的属性项个数是相同的。因而在许多情况下,一种地物类型对应一个属性数据表文件。当然,如果几种地物类型的属性项相同,也可以有多种地物类型共用一个属性数据表文件。)

1.2.4. 复杂性与多样性特征

地理空间数据具有复杂性和多样性,包括不同尺度的空间数据、多维空间数据、多源空间数据等。空间数据库需要能够处理这种复杂性和多样性,提供有效的数据存储、查询和分析功能,以满足不同领域对地理空间数据处理的需求。

(空间数据源广、量大,时有类型不一致、数据噪声大等问题。进行数据挖掘的原数据可能包含了噪声、空缺、未知数据,而聚类算法对于这样的数据较为敏感,将会导致质量较低的聚类结果,因此,处理噪声数据的能力需要提高。选取挖掘的样本数据时,合理而准确地抽样是至关重要的,样本大不但降低了抽样效率,而且增加了后续工作的复杂性;样本小又存在样本不具有代表性,准确性不高的问题。因此,需要有效的抽样技术解决大型数据库中的抽样问题。由于进行挖掘所需要的数据可能来自于不同的数据源中,这些数据源中的数据可能具有不同的数据格式和意义,为有效地传输和处理这些数据,需要对结构化或非结构化数据的集成进行深人研究。)

2. 空间数据库与传统数据库相比有何差异? 2.1. 信息描述差异

1)在空间数据库中,数据比较复杂,不仅有与一般数据库性质相似的地理要素的属性数据,还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系。

2)空间数据库是一个复杂的系统,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往很大。空间数据库中的数据具有丰富的隐含信息。例如,数字高程模型(DEM)除了载荷高度信息外,还隐含了地质岩性与构造方面的信息;植物的种类是显式信息,但植物的类型还隐含了气候的水平地带性和垂直地带性的信息等。

2.2. 数据管理差异

1)传统数据库管理的是不连续的、相关性较小的数字和字符;而空间数据是连续的,具有很强的空间相关性。

2)传统数据库管理的实体类型少,并且实体类型之间通常只有简单固定的空间关系;而空间数据库的实体类型繁多,实体类型之间存在着复杂的空间关系,并且能产生新的关系(如拓扑关系)。

3)地理空间数据存储操作的对象可能是一维、二维、三维甚至更高维。一方面,可以把空间数据库看成是传统数据库的扩充;另一方面,空间数据库突破了传统的数据库理论,如将规范关系推向非规范关系。而传统数据库系统只针对简单对象,无法有效地支持复杂对象(如图形、图像)。传统数据库存储的数据通常为等长记录的原子数据,而空间数据库通常由于不同空间目标的坐标串长度不定,具有变长记录的特点,并且数据项也可能很大、很复杂。

4)地理空间数据的实体类型繁多,不少对象相当复杂,地理空间数据管理技术还必须具有对地理对象(大多为具有复杂结构和内涵的复杂对象)进行模拟和推理的功能。但是,传统数据库系统的数据模拟主要针对简单对象,管理的实体类型较少,因而,无法有效地支持以复杂对象为主体的 GIS 领域。随着 GIS 技术向三维甚至更高维方向发展,GIS 系统需要描述表达的对象越来越复杂,这个问题将越来越突出。

5)空间数据库有许多与关系数据库不同的显著特征。空间数据库包含了拓扑信息、距离信息、时空信息,通常按复杂的、多维的空间索引结构组织数据,能被特有的空间数据访问方式所访问,经常需要空间推理、几何计算和空间知识表达等技术。

2.3. 数据操作差异

从数据操作的角度,地理空间数据管理中需要进行大量的空间数据操作和查询,如矢量地图的剪切、叠加和缓冲区等空间操作、裁剪、合并、影像特征提取、影像分割、影像代数运算、拓扑以及相似性查询等,而传统数据库系统只操作和查询文字和数字信息,难以适应空间操作。

2.4. 数据更新差异

1)数据更新周期不同。传统数据库的更新频度较高,而空间数据库的更新频度一般是以年度为限。

2)数据更新的角色不同。空间数据库更新一般由专人负责,一是因为要保证空间数据的准确性,二是空间数据的更新需要专门的技术。而传统数据库的更新可能是任何使用数据库的人员。

3)访问的数据量不同。传统数据库每次访问的数据量较少,而空间数据库访问的数据量大,因而空间数据库要求有很高的网络带宽。

4)数据更新的策略不同。传统数据库一般由事务控制,而空间数据库一般允许访问时间相对滞后的数据,一方面因为空间对象的变化较缓慢;另一方面因为人为因素未能及时更新,但这不影响对先前更新的数据的访问;另外,GIS 系统一般是作为决策支持系统出现的,而决策支持系统基本上使用的是历史数据。

2.5. 服务应用差异

1)一个空间数据库的服务和应用范围相当广泛,如地理研究、环境保护、土地利用和规划、资源开发、生态环境、市政管理、交通运输、税收、商业、公安等许多领域。

2)空间数据库是一个共享或分享式的数据库。

3)传统的关系数据库中存储和处理的大都是关系数据。

3. 空间数据库有哪些主要作用?目前空间数据库还存在哪些主要问题? 3.1. 空间数据库的主要作用 3.1.1. 空间数据处理与更新

地理信息数据一般时效性非常强,因此就要求人们不断地更新数据库。空间数据更新是通过空间信息服务平台用现势性强的现状数据或变更数据更新数据中非现势性的数据,达到保持现状数据库中空间信息的现势性和准确性或提高数据精度;同时将被更新的数据存入历史数据库供查询检索、时间分析、历史状态恢复等。因此空间数据的更新并不是简单的删除替换。这其中又涉及数据的整体更新、局部更新、采集途径、时效性、保持原有数据的不变、更新数据与原有数据正确连接等多方面问题,这些都是空间数据库发展中亟待解决的问题。

3.1.2. 海量数据存储与管理

地理数据涉及地球表面信息、地质信息、大气信息等多种极其复杂的信息,描述信息的数据量十分巨大,容量通常达到吉字节级。空间数据库的数据量远远大于一般数据库的数据量。空间数据库的布局和存取能力对地理信息系统功能的实现和工作效率影响极大。如果在组织的所有工作地点都能很容易地存取各种数据,则能使地理信息系统快速响应组织内决策人员的要求;反之,就会妨碍地理信息系统的快速响应。空间数据库为空间数据的管理提供了便利,解决了数据冗余问题,大大加快了访问速度,防止了由于数据量过大而引起的系统“瘫痪”等。它可以充分利用 RD-BMS 安全用户管理、数据备份等功能,实现空间数据和属性数据真正的无缝连接,提高数据管理和应用效率,便于数据共享,也为 GIS 采用完全的 C/S 模式提供了基础。

3.1.3. 空间分析与决策

空间数据库技术不仅实现了在 DBMS 中存储空间数据的目的,而且能够支持空间数据的结构化查询和分析,可以高效地把这些空间信息在 GIS 软件的工作空间中复原出来。空间数据库,作为源数据库,可通过对原始数据进行日常操作性的应用,提供简单的空间查询和分析。用户在决策过程中,通过访问空间数据库获得空间数据,在决策过程完成后再将决策结果存储到空间数据库中。如果获取空间数据很困难,就不可能进行及时的决策,或者只能根据不完全的空间数据进行决策,其结果都可能导致地理信息系统不能得出正确的决策结果。可见,空间数据库在地理信息系统中的重要性是不言而喻的。

3.1.4. 空间信息交换与共享

空间数据库的应用范围非常广,对于不同的用户群,其要求和使用方式以及所需数据也非常不同。虽然根据不同用户要求,空间数据库系统选用不同的专题地理信息数据库和不同的数据模型,但是随着网络技术的发展,空间数据库系统能够支持网络功能,使得信息的交流与共享变得更加便捷,较好地解决了海量地理信息存储的不便,大大扩展了空间信息的共享范围。相对于各行各业对空间信息技术的需求,空间信息产业的开发与应用突飞猛进,空间数据库技术作为一种综合的新技术、新方法已延伸到国民经济建设的各个领域。借助空间数据库系统,空间信息的应用范围更加广泛,实效性更能得到保障,准确性得以提高,信息的共享程度能得到加强。

3.2. 目前空间数据库存在的主要问题 3.2.1. 数据共享问题

1)数据文件格式统一性。不同的空间数据库系统,其数据文件格式自然不同。如何确定空间数据库系统应包括的数据文件及其数据类型,以保证不同系统的数据可以共享,使已建立的基础数据库的数据可以得以利用。这就需要一个统一的标准作为基础,且基本保证各种系统的数据在转换中不受损失。

2)地理信息的标准化。地理信息标准是通过约定或统一规定来表述客观世界的。地理信息标准化是对地理客体的模拟、抽象和简化过程,最后离它所反映的地理实体越来越远。为统一人们对事物和概念的认识及利用,就必须通过约定或规定,才能使地理信息真正共享。当前的地理信息标准存在着推荐性标准与强制性标准之分。

3)数据共享的政策。地理信息共享政策是一种人们必须遵守的行为准则或行为规范,其调整内容涉及社会经济的各个领域,在不同的社会环境中有着不同的政策。数据的采集与整理需要投入大量的人力、物力和财力,在数据共享方面存在着服务性与商业性的矛盾。在欧美地区数据共享政策是服务性与商业性相结合的,一般都是有偿使用,按照商业活动方式运作,由商业部门自主决定数据价格及使用限制条款的部分。我国对地理信息共享政策的制定是从全国大多数用户利益出发,但其中仍存在着多数用户利益与少数用户利益、长远利益与眼前利益的冲突。

3.2.2. 数据“瓶颈”问题

随着空间数据库的范围越来越广,数据量越来越大,尽管数据的压缩、存储与管理等技术在不断地进步,海量空间数据输入的高额费用仍然是空间数据库应用及发展过程中的一大障碍。这其中包括数据格式不统一的问题,但根本问题是两种数据模型本身的限制。采用矢量数据结构能准确地表示其位置及空间拓扑关系,便于査询,但数字化工作非常烦琐;栅格数据结构的空间数据输人方便,并能方便、快速地与获取空间信息的遥感技术相连接,但提高准确性的同时带来巨大的存储量,且不能实现空间拓扑关系。栅格向矢量转换功能的不完善大大增加了处理的工作量,影响精确度与可靠性。此外,随着 WebGIS 的发展,网络“瓶颈”问题也越来越受到人们的关注。由于所需传输的数据量很大,对于网络带宽、速度等要求非常高。这个问题严重影响了 WebGIS 在实际生活中的应用与发展,是当前急需解决的问题之一。

3.2.3. 数据安全问题

在 WebGIS 逐渐成为空间数据库的主要发展方向的同时,数据的安全性也随之成为一个不可忽视的问题。早期的 GIS 应用中,客户端一般采用文件共享的方式访问服务器上的空间数据文件,但客户端极易被盗取和修改数据文件,这就带来了重大的安全隐患。这样数据库系统管理员必须设定不同用户群的访问权限,避免用户直接访问服务器上的共享文件,使用户只能按照规定方式访问空间数据库。此外,还需要采用适合的网关、防火墙等系统安全技术,最大限度地防止外部的攻击。空间数据库是 GIS 最基本且重要的组成部分之一。在一个项目的工作过程中它往往发挥着核心的作用。数据库的布局和存取能力对 GIS 的功能实现和工作交率影响极大,数据库技术的发展也推动着 GIS 的不断前进。在空间数据库技术不送完善的今天,仍存在着很多不利因素制约着 GIS 的发展,还有很多问题有待人们思考和解决。

4. 数据库设计的基本过程分为哪几个阶段? 4.1. 需求分析

需求分析是数据库设计的第一阶段,在进行数据库设计时,首先必须准确了解与分析用户需求(包括数据与处理)。需求分析是整个设计过程的基础,这一阶段工作做得是否充分与准确,决定了整个系统开发的速度和质量。如果需求分析有误,则以它为基础的整个数据库设计将可能返工重做,因此需求分析是数据库设计人员最麻顷和最困难的工作。该阶段的工作是收集和分析用户对系统的要求,确定系统的工作范围,并产生“数据流图”和“数据字典”,所得的结果是下一阶段概念结构设计的基础。

4.2. 概念结构设计

概念结构设计是对收集的信息和数据进行分析整理,确定实体、属性及联系。将各个用户的局部视图合并成一个全局视图,形成独立于计算机的反映用户观点的概念模型。概念模型仅是用户活动的客观反映,并不涉及用什么样的数据模型来实现它的问题,因此概念模型与具体的 DBMS 无关。概念模型应接近现实世界,结构稳定,用户容易理解,能准确地反映用户的信息需求。实体-联系方法是设计概念模型的主要方法,在该阶段结束时应该产生系统的基本 E-R 图。

4.3. 逻辑结构设计

逻辑结构设计的目标就是把概念结构设计阶段设计好的基本 E-R 图转换为特定的 DBMS 所支持的数据模型,包括数据库模式和外模式,并对其进行优化。目前使用的绝大多数是关系数据模型,所以逻辑结构设计,即是将 E-R 模型转换为等价的关系模型。逻辑结构设计阶段的主要依据有概念结构设计阶段的所有局部和全局概念模式,即局部 E-R 图和全局 E-R 图;需求分析阶段产生的业务活动分析结果,主要包括用户需求、数据的使用频率和数据库的规模。

4.4. 物理结构设计

数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于给定的计算机系统。为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构的过程,就是数据库的物理设计。设计数据库物理结构,设计人员必须充分了解所用 DBMS 的内部特征:数据库的应用环境,特别是数据库应用处理的频率和响应时间的要求;外存储设备的特性。数据库的物理设计通常分为两步:第一步,对物理结构进行评价,评价的重点是时间和空间效率;第二步,如果评价结果满足原设计要求,则可进人到物理实施阶段,否则就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修改数据模型。

4.5. 数据库实施

完成数据库的物理设计之后,设计人员就要用 RDBMS 提供的数据定义语言和其他实用程序将数据库逻辑设计和物理设计结果严格描述出来,成为 DBMS 可以接受的源代码,再经过调试生成目标模式,然后就可以组织数据人库了,这就是数据库实施阶段。一般数据库系统数据量都很大,而且数据来源于部门中的各个不同的终端,数据的组织方式、结构和格式都与新设计的数据库系统有相当的差距,组织数据录人要将各类源数据从各个局部应用中抽取出来,输人计算机,再分类转换,最后综合成符合新设计的数据库结构的形式,输人数据库。因此,这样的数据转换、组织入库的工作是相当费时费力的。

4.6. 数据库运行与维护

数据库试运行合格后,数据库开发工作就基本完成,可以投人正式运行了。但是,由于应用环境在不断变化,数据库运行过程中物理存储也会不断变化,因此,对数据库设计进行评价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和提高。

5. 合并分 E-R 图时需要解决的冲突有哪几类?

各分E-R图之间的冲突主要有三类:属性冲突、命名冲突和结构冲突。

5.1. 属性冲突

包括属性域冲突和属性取值单位冲突。属性域冲突,即属性值的类型、取值范围或取值集合不同。例如,属性“学号”有的定义为字符型,有的为数值型。属性取值单位冲突。例如,属性“身高”有的以厘米为单位,有的以米为单位。

5.2. 命名冲突

包括实体名、联系名、属性名之间异名同义或同名异义等。例如,“成绩”和“分数”属于异名同义。

5.3. 结构冲突

同一对象在不同应用中具有不同的抽象。例如,“课程”在某一局部应用中被当做实体,而在另一局部应用中则被当做属性。同一实体在不同局部视图中所包含的属性个数或者属性的排列次序不完全相同。

属性冲突和命名冲突通常用讨论、协商等行政手段解决;结构冲突则要认真分析后用技术手段解决,例如,把实体变换为属性或属性变换为实体,使同一对象具有相同的抽象;又如,取同一实体在各局部 E-R 图中属性的并作为集成后该实体的属性集,并对属性的取值类型进行协调统一。在进行综合时,除相同的实体应该合并外,还可在属于不同分 E-R 图的实体间添加新的联系。

6. 试述把 E-R 图转换为关系模型所依据的原则。

E-R 图向关系模型转换要解决的问题是如何将实体和实体间的联系转换为关系模式,以及如何确定这些关系模式的属性和码。关系模型的逻辑结构是一组关系模式的集合。E-R 图则是由实体、实体的属性和实体之间的联系三个要素组成。所以将 E-R 图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转换为关系模式,这种转换一般遵循如下原则:

(1)一个实体转换为一个关系模式。实体的属性就是关系的属性,实体的码就是关系的码。

(2)一个 1:1 联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码;如果与某一端实体对应的关系模式合并,则需要在该关系模式的属性中加入另一个关系模式的码和联系本身的属性。

(3)一个 1:n 联系可以转换为一个独立的关系模式,也可以与 n 端对应的关系模式合并。如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为 n 端实体的码。

(4)一个 m:n 联系转换为一个关系模式。与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。

(5)三个或三个以上实体间的一个多元联系可以转换为一个关系模式。与该多元联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为各实体码的组合。

(6)具有相同码的关系模式可合并。

7. 数据库实施和维护阶段的主要工作是什么? 7.1. 数据库实施阶段的主要工作 7.1.1. 建立实际的数据库结构

用 DBMS 提供的数据定义语言编写描述逻辑设计和物理设计结果的程序(一般称为数据库脚本程序),经计算机编译处理和执行后就生成了实际的数据库结构。所用 DBMS 的产品不同,描述数据库结构的方式也不同。有的 DBMS 提供数据定义语言,有的提供数据库结构的图形化定义方式,有的两种方法都提供。在定义数据库结构时,应包含以下内容:

7.1.1.1. 数据库模式与子模式,以及数据库空间等的描述

模式与子模式的描述主要是对表和视图的定义,其中应包括索引的定义。索引在具体的 DBMS 中有聚簇与非聚簇索引之分。使用不同的 DBMS 对数据库空间的描述也有差别,如在 SQL Server 2000 中,数据库空间描述可以包括定义数据库的大小、自动增长的比例以及数据文件、日志文件的存放位置。

7.1.1.2. 数据库完整性描述

在数据库设计时如果没有一定的措施确保数据库中数据的完整性,就无法从数据库中获得可信的数据。在模式与子模式实现中,完整性描述主要包括以下几种:

①对列的约束,包括列的数据类型、列值的约束。其中对列值的约束又有非空约束;唯一性约束;主键约束;外键约束;域(列值范围)的约束等。

②对表的约束。主要有表级约束(多个属性之间)和外键约束。

③多个表之间的数据一致性,主要是外键的定义。

④对复杂的业务规则的约束。一些简单的业务规则可以定义在列和表的约束中,但对于复杂的业务规则,不同的 DBMS 有不同的处理方法。对数据库设计人员来说,可以将触发器定义在数据库结构中,并在应用程序中以编写代码的形式加以控制。

7.1.1.3. 数据库安全性描述

子模式是实现安全性要求的一个重要手段。可以为不同的应用设计不同的子模式。在数据操作方面,系统可以对用户的数据操作进行两方面的控制:一是给合法用户授权,目前主要有身份验证和口令识别;二是给合法用户不同的存取权限。

7.1.1.4. 数据库物理存储参数描述

物理存储参数因 DBMS 的不同而不同。一般可以设置以下参数:块大小、页面大小(字节数或块数)、数据库的页面数、缓冲区个数、缓冲区大小、用户数等。

7.1.2. 数据加载

数据库应用程序的设计应该与数据库设计同时进行。一般地,应用程序的设计应该包括数据库加载程序的设计,在数据加载前,必须对数据进行整理。由于用户缺乏计算机应用的背景知识,常常不了解数据的准确性对数据库系统正常运行的重要性,因而未对提供的数据作严格的检查。所以,数据加载前,要建立严格的数据登录、录入和校验规范,设计完善的数据校验与校正程序,排除不合格数据。数据加载分为手工录人和使用数据转换工具两种。现有的 DBMS 都提供了 DBMS 之间数据转换的工具。如果用户原来就使用数据库系统,可以利用新系统的数据转换工具,先将原系统中的表转换成新系统中相同结构的临时表,然后对临时表中的数据进行处理后插人到相应表中。数据加载是一项费时费力的工作。另外,由于还需要对数据库系统进行联合调试,所以大部分的数据加载工作应在数据库的试运行和评价工作中分批进行。数据库应用程序的设计应该与数据库设计同时进行,因此在组织数据入库的同时还要调试应用程序。

7.2. 数据库维护阶段的主要工作

在数据库运行阶段,数据库经常性的维护工作主要是由 DBA 完成的,包括如下几点:

7.2.1. 对数据库性能的监测和改善

由于数据库应用环境、物理存储的变化,特别是用户数和数据量的不断增加,数据库系统的运行性能会发生变化。某些数据库结构(如数据页和索引)经过一段时间的使用以后也可能会被破坏,所以 DBA 必须利用系统提供的性能监控和分析工具,经常对数据库的运行、存储空间及响应时间进行分析,结合用户的反映确定改进措施。目前的 DBMS 都提供一些系统监控或分析工具。如在 SQL Server 中使用以下组件都可进行系统监测和分析:SQL Server Profiler 组件、Transaction-SQL 工具、Query Analyzer 组件等。

7.2.2. 数据库的转储和恢复

数据库的转储和恢复是系统正式运行后最重要的维护工作之一。因此 DBA 应根据应用要求,制定不同的备份方案,保证一旦发生故障,能很快将数据库恢复到某种一致性状态,尽量减少对数据库的破坏。

7.2.3. 数据库的安全性、完整性控制

在数据库运行过程中,由于应用环境的变化,对安全性的要求也会发生变化,例如,原来有些数据是保密的,现在可以公开查询了,系统中用户的安全级别也会发生改变;同样,数据库的完整性约束条件也会发生改变,这些都需要 DBA 根据实际情况进行相应的改变,以满足用户的应用要求。

7.2.4. 数据库的重组(织)与重构(造)

数据库运行一段时间后,由于记录的增、删、改,会使数据库物理存储情况变坏,影响数据库的存取效率。这时,DBA 要对数据库进行重组和部分重组,以提高系统性能。

数据库的重组是指在不改变数据库逻辑和物理结构的情况下,去除数据库存储文件中的废弃空间,以及碎片空间中的指针链,使数据库记录在物理上近邻。一般情况下,数据库每作一次删除操作后就进行自动重组。但这会影响系统的运行速度。因此常用的方法是,在后台或所有用户离线以后进行系统重组。

数据库的重构是指当数据库的逻辑结构不能满足当前数据处理的要求时,对数据库的模式和内模式的修改。由于数据库重构的困难和复杂性,一般都在迫不得已的情况下才进行。如应用需求发生了变化,需要增加新的应用或实体,取消某些应用或实体;表的增删,表中数据项的增删,数据项类型的变化等。

重构数据库,一般只能对部分数据库结构进行。重构数据库后,还需要修改相应的应用程序。如果应用需求变化太大,需要对全部数据库结构进行重组,说明该数据库系统的生命周期已经结束,需要设计新的数据库应用系统。

在基于数据库的应用系统中,数据库是基础,只有成功的数据库设计,才可能有成功的系统。一个好的数据库,不仅可以为用户提供所需要的全部信息,还可以提供快速、准确、安全的服务,数据库的管理和维护也会相对简单。否则,应用程序设计得再好,整个数据库系统也不可能是成功的。

8. 简述空间数据库建库的主要内容。 8.1. 资料准备和预处理

1)资料准备;

2)对建库资料的要求;

3)资料分析;

4)资料预处理(图面预处理、属性数据处理)。

8.2. 数据采集

1)数据采集工艺流程;

2)数字化方式;

3)手扶跟踪数字化;

4)扫描数字化。

8.3. 数据处理

1)错误检查与编辑;

2)几何纠正;

3)地图投影转换;

4)图像解译;

5)投影转换;

6)图幅拼接;

7)拓扑关系生成;

8)属性数据录入。

8.4. 空间数据建库

建库过程可分为 5 个步骤:

1)数据字典和数据索引的生成;

2)图形与属性数据库的建立;

3)建立用户密码、规定用户使用权;

4)软件系统与数据的融合检查;

5)数据库系统运行测试。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有