数字档案馆数据重复 您所在的位置:网站首页 档案馆数据 数字档案馆数据重复

数字档案馆数据重复

2024-07-10 17:27| 来源: 网络整理| 查看: 265

数字档案馆数据重复

首先对于电子文件的归档是有一定要求的,你所说的直接形成的电子档案是照片或者视频之类的?还是word、exel表格?照片视频一般归于声像档案。后者不归档。纸质档案数字化加工是有一定要求的,形成的只是图片格式,这两种电子档案类别是不同的。

关注我的微博可以学到很多关于档案管理方面的知识

数据挖掘 有哪些注意事项

1数据挖掘方法的选择

由于数据挖掘方法功能的各不相同,所以要针对挖掘需求和目标,采用适合的模式和算法,特别是在对多个数字档案馆进行跨馆、跨库挖掘的时候,各馆可能采用不同的数据库系统内核,如ORICLE、SQLSERVER、DBII等等,且各馆馆藏内容也大相径庭,所以在进行数据挖掘的时候应立足于所处的数字化馆藏环境,在方法的选择上有的放矢,不能一概而论。

2数据挖掘结果的准确性

即对数据挖掘质量的控制问题。数字档案馆数据库中涉及大量的数据信息,在这些海量数据面前,不可避免的会出现冗长,甚至错误的数据,所以在进行数据挖掘时,应根据数据挖掘任务的不同,选择适合的挖掘类型和算法,并对出现的错误数据进行修正、处理、加工,为档案馆提供科学合理的各种分析报告和相关预测信息,指导档案馆工作人员采取正确手段,并为档案馆改进服务、作出决策提供智力支持。

3用户隐私的保护

档案馆利用数据挖掘技术优化服务,提高管理水平的同时,也不可避免的增加了侵犯用户隐私权的可能性,因为用户在利用数字档案资源的过程中涉产生大量的个人信息,这些信息包括:用户的姓名、工作、学历、兴趣等,它们一旦被其它别有用心的人所获取,用户就有可能受到,进而造成用户对档案馆的反感,影响到用户的二次利用,所以档案馆应该妥善保管这些信息,建立有效的隐私保障机制,不能在未得到用户授权的情况下将他们的个人隐私泄漏出去。

4人力资源的保障

数据挖掘脱胎于计算机领域,要在基于知识管理的数字档案馆中实施数据挖掘必然离不开优秀的计算机专业人员和管理人员,但只强调专业技术,忽视对其业务技能的培养,也会制约数字档案馆的发展,所以在数字档案馆建设过程中,需要加强对专业技术人员的档案知识补充,同时调整档案馆管理人员的知识结构,使他们尽可能的掌握必要的网络、数据库基础知识。

从实体管理到信息管理,从信息管理到知识管理已是档案馆发发展的不可逆转进程,基于知识管理的数字档案馆是档案馆发展的必然组织形式。数据挖掘可以快速有效地分析和处理来自数字档案馆内外的海量数据和信息,使隐性知识显性化,显性知识结构化,为数字档案馆的科学管理和服务水平的不断提高提供了有力支持,使档案馆向着知识化的方向发展,随着信息技术的不断深入和挖掘算法的不断改进,数据挖掘必将与数字档案馆的知识管理结合得更加紧密,显现出更加强大的生命力。

数字铀矿地质档案馆建设方案初探

曹泽欣 郭安北 朱虹 王鹏

(核工业航测遥感中心档案馆 石家庄 050002)

摘要 本文从铀矿地质档案工作存在的问题出发,提出了解决问题的方案,阐述了技术路线,论述了方案所设计的关键技术。最后,就数据的组织、总体框架、模块功能设计、结构模式、信息安全保障等方面对数字铀矿地质档案馆建设方案进行了探讨。

关键词 数字铀矿地质档案馆 地理信息系统 方案

1 前言

1.1 铀矿地质档案工作存在的问题

铀矿地质工作开展五十余年来,积累了海量的地质档案资料。这些数据是铀矿地学空间信息的重要组成部分,具有很好的开发应用潜力。随着“数字地球”与“数字国土”工作的不断深入,空间信息的开发与共享得到高度的重视。与此同时,利用3S技术对科技成果进行管理的热潮正在兴起。传统的管理、服务方式已经不能满足现今工作的需求,尤其在信息的快速存取、管理和服务等方面都面临着新的挑战。

铀矿地质档案管理存在的主要问题有:

(1)相对其他地质行业,数字档案建设起步较晚;

(2)基础数据建、入库率低;

(3)地质档案管理方式老化:主要还是以人工方式为主,图形和属性数据管理分割;

(4)地质档案服务层次较低:服务处在低级阶段,检索工具简单(目录级),查询时间长、查准率和查全率不高,地质档案的复制、年终报表统计仍然以手工为主。

1.2 解决问题的方案

随着计算机技术的发展,特别是数据库、GIS技术的发展,为数字铀矿地质档案馆的建立提供了可能。GIS作为空间信息管理、服务系统,是进行铀矿地质档案管理、服务的最佳途径。基于MAPGIS的数据中心集成开发技术,建立MAPGIS的数字铀矿地质档案馆可解决铀矿地质档案实际工作面临问题,实现铀矿地质档案管理现代化、馆藏机构标准化、地质资料管理数字化、资料服务网络化。

2 技术路线

(1)应用MAPGIS数据中心架构,结合铀矿地质档案的特点,建立具备海量空间数据管理能力的数字铀矿地质档案馆框架。

(2)应用MAPGIS-IMS,采用Web Service技术,建立基于Web服务的档案发布管理、综合查询、档案利用、符合OGC标准的数据服务的模型,实现空间数据资源的集成共享。

(3)应用国内权威的电子签章技术,为系统提供电子签章功能,满足档案管理日常办公的电子批文需求,提高系统的安全性。

(4)利用MAPGIS空间数据引擎和SQL Server等商用数据库管理系统,提供海量空间数据管理解决方案。

3 方案涉及的关键技术

3.1 海量空间数据管理、服务技术

铀矿地质档案资料中,地形图、地质图、专题地质图件等空间数据占相当大的比重。因此,数字铀矿地质档案建设方案中海量空间数据的管理、服务成为技术关键点。要实现海量空间数据管理、服务的能力,应解决实现海量空间数据的管理、存储,空间数据的查询、检索等功能。数字铀矿地质档案馆建设方案基于MAPGIS平台,通过MAPGIS强大的空间数据管理能力和大型商用数据库管理系统的数据管理能力的结合,解决海量空间数据管理、存储、服务等问题。MAPGIS的空间数据引擎负责数据库的空间数据存取管理,商用数据库管理系统负责空间数据的存储管理。

3.2 面向服务的系统架构技术

数字铀矿地质档案馆建设方案可采用面向服务的系统架构技术,设计灵活的系统框架。系统功能通过组件、模块来搭建,形成有机的整体。这样可使建设方案更为健全,易于维护,同时,给以后的扩展、与其他方案的集成提供了充分的空间。

3.3 Web Service技术

数字铀矿地质档案馆方案将基于Web Service技术,结合MAPGIS平台对OGC标准的支持,提供标准的数据服务接口,开发瘦客户、基于浏览器的方案功能模块,用于数据管理、服务和发布。

3.4 电子签章技术

数字铀矿地质档案馆建设方案采用嵌入式中间件方式,应用电子签章技术,确保系统的安全性,减少重复劳动,方便各个环节的审核、批复、签字;追踪监控复制电子数据的流向。

4 数字铀矿档案馆建设的方案

数字铀矿档案馆建设要坚持以科学发展观统领全局,以核工业地质局的“‘十二五’发展规划纲要(草案)”为指导,坚持统一部署,分步实施,突出重点,集中维护;合理配置资源,面向管理、服务,利用现代信息技术,建立符合铀矿地质特点的数字档案馆方案,实现跨越式发展和管理方式的根本转变,使铀矿地质档案管理和国际接轨,管理、服务上升到一个新台阶。

4.1 数据的组织

核工业地质资料数据主要为成果地质资料,具体包括地质档案数据、图形数据(空间数据)。

(1)空间数据组织形式。对于空间数据,可以利用MAPGIS平台构建空间数据库,根据空间数据的具体分类情况进行组织,构成相应的树形数据目录结构。一般情况下,一个档案号构成一个空间数据库,每个数据库包含多个要素数据集;一个数据集相对应于一幅图件,而构成图件的多个专题要素图层构成,有序地存储在数据集中。

(2)地质档案数据组织形式。地质档案可分为地质、物探、化探、遥感、科研等类型,档案由正文、附图、附表及附件4部分内容构成。一般情况下,一个档案包括一篇正文、多个附图文件、多个附表、附件若干。对于地质档案的组织,可以在分类基础上进行,通过关键字段将档案的各部分内容紧密关联在一起。

4.2 总体框架

数字铀矿地质档案馆是一个以MAPGIS、网络、数据库等先进技术为基础,主要提供地质档案资料数据管理、资料借阅管理、日常管理以及综合信息查询功能的集成化多层结构系统。总体框架如图1示。

图1 总体框架

4.3 模块功能设计

数字铀矿地质档案馆是一个管理铀矿地质档案资料的集成化数据管理平台,主要包括数据管理、综合查询、信息发布、利用管理、系统维护等五大模块(图2)。

图2 模块功能组成

4.4 结构模式

数字铀矿地质档案馆采用大型数据库和成熟的GIS平台、C/S和B/S共同存在的混合结构模式进行搭建(图3)。

地质档案数据管理部分为C/S模式,主要供管理人员对数据进行维护管理,部署在专门的数据管理部门。

其他模块基于B/S模式,部署在档案馆电子阅览室,通过浏览器查询地质档案数据;数字铀矿地质档案馆、主管领导、外部分支机构之间相关的日常工作处理事务通过专网连接。

图3 结构模式

4.5 信息安全保障

信息安全技术体系由一系列硬件、网络、软件系统方面的安全策略组成。

(1)硬件资源的安全策略

硬件资源的安全策略主要针对数字化铀矿地质档案馆中所涉及的硬件实体的安全防护,包括:机房的安全保障、主机设备的安全、涉密设备的安全,采用独立、安全的管理模式等。

(2)网络方面的安全策略

确保网络方面的安全,做好内部网络规划,建立合理的网络结构,确保网络畅通,避免因网络阻塞或中断,导致业务受影响。如有必要,建立专网连接,提高网络数据传输的安全性。

(3)系统及数据方面的安全策略

系统及数据方面的安全策略可从以下几个方面考虑:

①电子签章,②授权管理,③身份鉴别与认证,④数据自身安全,⑤病毒防范。

5 结语

数字铀矿地质档案馆建设是一项较为复杂的系统工程,它涉及铀矿地质资料的分类、组织、采集、存储、管理、服务等全过程。设计建设方案时,应充分利用网络、GIS和数据库技术,结合铀矿地质资料的具体特点,优化地质档案数据组织、管理,提供地质档案的高效服务,研制起点高、易操作、功能强,切实可行的数据集成共享平台,实现铀矿地质档案资料的数字管理、服务,最大限度地方便数据管理人员和用户的利用,真正发挥铀矿地质资料社会效益和经验效益,使铀矿地质档案管理和国际接轨,管理、服务上升到一个新台阶。

如何创新档案管理工作

导语:档案管理包括档案的收集、整理、保管、鉴定、统计和提供利用等一系列活动的总和,档案管理的终极目的是为档案利用者提供权威的、可信的档案信息服务。随着时代的发展和社会的进步,现代档案管理工作已成为相对较为专业化、复杂化的系统工程,尤其在档案管理现代化的发展要求下,档案管理工作面临着新的挑战和机遇。

一、当前档案管理工作存在的不足

(一)人才队伍建设滞后

一方面,由于我国高校档案专业设置较晚,从而导致档案管理专业人才培养和输出相对较少,人才资源供给受限。另一方面,从现阶段档案管理人员构成看,无论是政府机关、企事业单位还是高校、公共档案馆等,档案管理人员构成良莠不齐,大多数管理员缺乏档案管理专业背景。

同时,档案管理相关部门对这部分管理人员的理论知识与实践技能培训缺位,继续教育难以有效实施,总之难以形成一支专业能力强、业务素质熟练、构成结构科学合理的档案管理队伍。此外,相关单位对档案管理工作缺乏相应的重视,预算支付严重不足,这在客观上制约了专职档案人才的'配置和培养。

(二)制度建设和执行实效不足

从现状看,现阶段不少档案管理机构普遍存在制度建设缺位等“制度短板”现象,甚至没有相应的岗位职责,缺乏系统、科学的规章制度,管理模式较为粗放。如在档案材料管理方面,档案员对于归档材料往往疏于审查,导致部分档案材料严重失实,甚至有造假现象发生,严重损害了档案的真实性;档案员主动收集和保管意识差,对于档案材料明显缺失却渎于补全完整,损害了档案的完整性,导致信息缺漏。

(三)管理模式相对落后,信息化水平较低

目前大部分档案管理机构仍沿用传统管理模式,档案资料的提供、利用、开发仍以纸质媒体为主,档案管理的信息化、数字化水平较低。不可否认,纸质档案有其自身存在优势,在档案史上也发挥了重要的记录和凭证作用,但在信息化和数字化为主导的现代社会,纸质档案因其重复利用率低,归档工作量大,保管条件严苛且成本较高,容易丢失或损毁等问题,被电子档案取代应为不争之势。

二、做好档案管理工作的创新举措

(一)加强组织建设,打造档案管理专业队伍

时代的发展和社会分工的细化给档案管理工作和档案管理者提出了更新更高的要求,档案管理工作的质量直接取决于档案工作人员的素质。作为新时期的档案管理者,必须解放思想、与时俱进,努力提高自身的综合素质,适应新时期档案事业的发展和要求。

一方面,新招录档案管理工作人员应优先从具有档案专业背景的应聘者中录取。档案管理工作是一门技术性强、专业要求高的艺术,每一项程序都有相应的理论和技术支撑,档案管理工作者只有通过系统的专业学习和长期的管理实践才能掌握这些理论和方法,从而保证档案管理质量,提升档案管理水平。

另一方面,从目前档案管理部门实际出发,现有在岗的档案管理工作人员大多不具有档案专业背景,甚至有相当一部分管理人员文化水平较低,这是不能回避的现实,因而对这一部分档案管理工作者的继续教育和培训迫在眉睫。档案管理工作者应不断更新学习理念和学习方法, 掌握现代化档案管理方法和手段,做到与时俱进,不断提升档案管理水平。

(二)完善制度建设,强化制度执行实效

新的历史条件下,档案管理工作欲寻求自身的突破,实现科学可持续发展,必须坚持用制度管人管事,没有制度就无所谓管理,建立健全各项档案管理规章制度,是实现档案管理工作科学化和规范化的题中之义。

首先,完善档案管理责任制度,落实岗位职责分工,切实扭转档案管理工作人员责任心不强,失职、渎职行为,强化档案材料收集管理和及时移交归档的力度。其次,完善竞争上岗制度,选拔专业人才,充实档案管理工作岗位,培养具有“创造型、复合型、协作型”多素质人才。第三,完善档案管理经费支付预算制度,保障档案管理耗材供给,保证教育培训经费,从硬件和软件两个方面不断提升档案管理的现代化水平和服务质量。

(三)创新档案管理模式,提高信息化水平

信息技术的飞越发展带来了传统生产方式、生产模式的巨大变革,传统的档案管理模式与档案管理平台已不能满足社会的发展和时代的需要。积极运用现代科技文明的成果,创新档案管理数字化平台,提高档案管理信息化水平,是实现档案管理工作可持续发展的必由之路,也是提高其服务质量和效率的重要途径。

档案管理信息化的目的是利用现代信息技术,更加科学、合理、高效地辅助档案管理工作,减少重复性劳动,提高档案管理质量和效率。档案管理工作是一项工作量大、劳动强度高、枯燥重复性工作,而通过信息化技术能很好地解决这些重复、大批量且有规律的数据与信息管理工作,并能保证过程的正确性和信息的时效性。

同时,积极运用信息化技术构建数字档案馆,实现档案资料数字化、信息传递网络化和信息资源共享化,进一步提升档案管理水平,推动档案管理向现代化、信息化转型。

数字档案室及档案数字化建设方案

数字档案室的建设数字档案馆系统综合应用物联网、云计算、移动互联网等新技术,开发了对档案实体、档案内容、档案服务和档案管理等信息的感知、处置等功能,实现了对档案信息资源和档案业务信息资源的智慧收集、智慧管理、智慧服务、智慧保护和智慧监督,为档案馆物与物、人与物、人与人的全面互联、互通、互动提供了基础条件。基于OCR技术生成档案数字化成果文本数据资源库,结合应用原生电子档案内容信息,实现了档案信息资源的数据化管理,可以进行全文检索,并采用数据挖掘技术构建虚拟资源库,突破了传统的档案数字化理念,对实现档案资源的深度控制和挖掘创造了条件。基于数据智能采集技术,采用多样化、组合式信息资源收集方式,实现了智慧城市建设中重要的信息资源之一 —— 专业档案数据库的高效接收和有序管理。采用大数据技术的智慧档案馆,通过云计算技术虚拟合并各档案馆之间的数据,做到实时互通,跨馆出证。采用模型控制技术,实现了机关归档电子文件质量监管、进馆电子档案质量检查、开放档案划控辅助管理、档案馆业务目标督查等工作的辅助管理,有效地推进了档案馆业务工作的信息化。应用RFID 技术,实现了智慧档案馆智能感知管理平台对实体档案、在馆人员及相关业务信息的综合感知和智能处置,拓展了RFID技术在档案馆工作中的应用领域。如文档服务中心发出调卷指令后,在规定时间内库区RFID 标签信息阅读器未感知到相关档案出库信息,将自动发送短信提示库房保管人员办理调卷业务。基于编研人员的档案利用,通过对档案信息资源的深入挖掘,实现对档案信息资源的智能检索,提高了档案检索的查全率和查准率;同时基于数据挖掘技术,支持对检索结果的知识图谱展示以及档案信息的自动聚类,为利用者提供了便捷、高效的档案利用服务。根据业务需要,智能形成编研材料。感知档案,通过标签可以知道档案的状态,可以对档案实体进行识别、定位、跟踪、监控和管理,帮助档案管理人员实时掌握每一份档案的状态,实现管理者与档案实体的沟通。这样可以避免传统档案管理中出现的一些问题。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有