云计算期末考试知识点 您所在的位置:网站首页 云计算的技术原理有哪些内容 云计算期末考试知识点

云计算期末考试知识点

2024-07-06 22:40| 来源: 网络整理| 查看: 265

第2章

1.Google云计算技术包括哪些内容? 答题要点:(P13)要答出有关技术的分类和名称。 答: Google云计算技术包括:Goge分布式文件系统GFS,分布式计算编程模型 MapReduce, 分布式锁服务 Chubby,分布式结构化数据表 Bigtable,分布式存储系统 Megastore,分布式 监控系统 Dapper,数据交互分析工具 Dremel和 PowerDril,等等。 2.当前主流分布式文件系统有哪些?各有什么优缺点? 答题要点:(P13)此题的问法有些不完整,题义应该是问传统分布式文件系统的实现方法与 Google的分布式文件系统GFS的区别 答: Redhat、IBM、Sun等公司都有分布式文件系统的解决方案,这些解决方案依靠RAD技术、SAN存储区域网来容错(是基于硬件的容错),对构建分布式文件系统的硬件有较高的 要求,存储成本高。 Google的GFS是使用软件的方式,在文件系统上实现容错,可以使用廉价的机器构建,存储成本低。相对于传统的分布式文件系统, Google的GFS分布式文件系统的容错性能在可靠性和存储成本上都具有优势。 3.GFS采用了哪些容错措施来确保整个系统的可靠性? 答题要点:(P16-17)除了要把容错技术的名称答出来以外,还要简单说明机理。 答: Google的GFS采用的容错机制可以分为: (1) Master容错。 Master上保存着GFS的元数据(包括命名空间(Name)和 Chunk映射表等),这些元数据 及 Master的操作日志保存在磁盘中, Master出错时而磁盘数据完好时,可以通过磁盘数据 恢复 Master GFS对 Master进行远程实时备份,如果 Master彻底死机,另外一台 Master可以迅速接替其 工作。 (2) Chunk Server容错。 Chunk是GFS的数据块,一个 Chunk默认存储3个位于不同 Chunk Server的副本, Master 会检查 Chunk的副本数,在出现 Chunk副本丢失或不可恢复时, Master自动将该副本复制 到其他 Chunk Server。 另外, Chunk以文件的形式保存在 Chunk server, Chunk文件以Bock(64K)来划分,每一 个 Block对应一个32位的校验和, Chunk Server会检査数据和检验和,如果不匹配就返回错误。 4.MapReduce与传统的分布式程序设计相比有何优点? 答题要点:(P18) 答: MapReduce封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供了个简单而强大的接口。通过这个接口,可以把大尺度的计算自动地并发和分布执行,使编程变得非常容易。另外,MapReduce也具有较好的通用性,大量不同的问题都可以简单地通过MapReduce来解决。 5.Chubby的设计目标是什么? Paxos算法在 Chubby中起什么作用? 答题要点:(P24-27) 答: Chubby的设计目标主要有:(1)高可用性和高可靠性。(2)高扩展性。(3)支持粗粒 度的建议性锁服务。(4)服务信息的直接存储。(5)支持通报机制。(6)支持缓存机制。 Paxos算法在 Chubby中起到保证副本之间数据一致的作用( Chubby cel(单元)中的所有副 本都要保持完全一致) 6.阐述 Bigtable的数据模型和系统架构。 答题要点:(P33-39) 答: Bigtable的数据模型是一个多维映射表,通过行关键字、列关键字和时间戳进行索引(定 位数据):(1)行。行关键字用于标识Bigtable中不同的行,可以是任意字符串,大小不能超过64KB。Bigtable中的数据是通过行关键字按字典序进行排序的。(2)列。Bigtable中的 列,以列族进行组织,一个列关键字以“族名:列名”的形式表示,每个列族中的列属于同 种数据类型,并且访问控制( Access Control)是在列族上进行定义的。(3)时间戳。用于在区别 Bigtable中数据的版本,同一个行、列定位的数据,可以根据设置保存具有不同时间戳 的数据值。 Bigtable主要由三个部分组成:主服务器 Master server、子表服务器 Tablet Server和客户端 程序库( Client Library)。主服务器主要进行一些元数据操作以及子表服务器之间的负载调度 问题,子表服务器则以子表的形式(通过GFS以 SSTable类型文件)保存 Bigtable的数据, 个子表服务器负责存储若干个(通常100个左右)子表。访问 Bigtable服务需要使用 Bigtable 的客户端。 7.分布式存储系统 Megastore的核心技术是什么? 答题要点:(P47) 答: Megastore最核心的技术是复制。 8.大规模分布式系统的监控基础架构 Dapper关键技术是什么? 答题要点:(P56) 答: Dapper关键技术主要有两个方面:(1)轻量级的核心功能库。 Dapper的监控过程基本 对应用层透明。(2)二次抽样技术。利用二次抽样技术成功解决了低开销及广泛可部署性的 问题。 9.相比于行存储,列存储有哪些优点? 答题要点:(P62) 答:相对于行存储,列存储以属性为单位



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有