阿里云大数据ACA及ACP复习题（181~190）

2024-06-21 14:33| 来源: 网络整理| 查看: 265

181.PAI-DSW是一款云端机器学习开发IDE，为用户提供交互式编程环境，且DSW提供非持久化的本地存储，那么如何（ D ）实现持久化存储DSW数据。A:创建PAI-DSW实例B:编写持久化本地存储脚本C:选择File > Export Notebook As... > 目标格式D:创建NAS或OSS类型数据集，并将数据集挂载到DSW指定的路径

解析：DSW提供非持久化的本地存储，如果需要持久化存储DSW数据，需要创建NAS或OSS类型数据集，并将数据集挂载到DSW指定的路径

182.下列关于阿里云Flink版框架的描述正确的是？（ B ）A:阿里云Flink版框架主要处理离线数据，Apache Flink则主要处理实时数据B:阿里云FIik版是实时计算的一个流式计算引擎C:Flink可以处理离线数据与实时数据D:Flink主要实现将企业数据库的业务数据导入到其它在线存储平台上

解析：https://help.aliyun.com/document_detail/110778.html阿里云实时计算Flink版是一套基于Apache Flink构建的⼀站式实时大数据分析平台，提供端到端亚秒级实时数据分析能力，并通过标准SQL降低业务开发门槛，助力企业向实时化、智能化大数据计算升级转型。

183.下列关于Apache Spark的MLlib组件的描述正确是？（ D ）A:基于内存多语言执行的核心引擎B:提供流计算组件C:是一个用来处理结构化数据的Spark组件D:Spark机器学习库

解析：Spark的MLlib提供了较丰富的机器学习库，包括分类、回归、协同过滤、聚合，同时提供了模型选择、自动调参和交叉验证等工具来提高生产力。MLlib主要支持非深度学习的算法模块链接：https://help.aliyun.com/document_detail/441938.html

184.一些实时数据产生后会有很高价值，但是这些数据的价值会随时间流逝而减少，流计算系统的价值在于业务方可在更短的时间内挖掘实时数据中的价值，并将这种低延迟转化为竞争优势。下列选项中，关于流计算系统，描述正确的是？（ ABC ）A:处理大数据的基本要求，如每秒处理几十万条实时数据B:保证数据较低延迟采集，达到秒级别，甚至是毫秒级别C:支持大数据的基本架构，能够平滑扩展D:开发复杂部署比较麻烦

解析：对于一个流计算系统来说，它应达到如下需求：（1）高性能。处理大数据的基本要求，如每秒处理几十万条数据。（2）海量式。支持TB级甚至是PB级的数据规模。（3）实时性。必须保证一个较低的时延，达到秒级，甚至是毫秒级别。（4）分布式。支持大数据的基本架构，必须能够平滑扩展。（5）易用性。能够快速进行开发和部署。（6）可靠性。能可靠地处理流数据。

185.HDFS主要采用主从结构模型，分别负责数据请求与数据存储的功能，其中主(master)节点进程名是？（ B ）A:DataNodeB:NameNodeC:ResourceManagerD:NodeManager

解析：HDFS的主节点称为 NameNode

186.HDFS主要采用主从结构模型，分别负责数据请求与数据存储的功能，以下选项中关于这种结构描述正确的是？（ AC ）A:HDFS采用了Master/Slave结构模型B:一个HDFS集群包含一个DataNode和若干个NameNodeC:NameNode为中心服务器，负责管理文件系统的命名空间及客户端对文件的访问D:副本默认为1份，副本数可以通过配置文件修改

解析：HDFS采用了主从（Master/Slave）结构模型；一个HDFS集群包括一个NameNode和若干个DataNode； Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问；可以通过修改hdfs的配置文件自定义块大小，默认每个块的副本数是3,可以通过修改hdfs的配置文件自定义副本数；

187.MaxCompute支持流式数据实时写入并在数据仓库中开展分析。高性能秒级弹性并发查询，满足近实时分析场景需求。体现了MaxCompute在大数据处理与分析中的什么作用？（ C ）A:弹性能力与扩展型B:集成AI能力C:支持流式采集和近实时分析D:数据存储能力

解析：https://help.aliyun.com/document_detail/27800.html 支持流式采集和近实时分析支持流式数据实时写入并在数据仓库中开展分析。与云上主要流式服务深度集成，轻松接入各种来源的流式数据。支持高性能秒级弹性并发查询，满足近实时分析场景需求。

188.云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级解决方案。（ A ）A:数据仓库B:非关系型数据库C:网络服务D:数据库建模

解析：云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。链接：https://help.aliyun.com/product/27797.html

189.Quick BI中，能无缝对接各类数据源，10亿+数据聚合亚秒级响应，体现了其哪种优势？（ D ）A:智能数据分析和交互B:快速搭建数据门户C:安全管控数据权限D:强大的Quick数据引擎

解析：链接：https://www.aliyun.com/product/bigdata/bi强大的Quick数据引擎内置查询加速引擎支持多种加速模式，亿级数据秒级处理

190.使用Flume采集系统日志数据时，Flume的正确流程是？（ A ）A:Web数据源-Source一Channel一Sink一HDFSB:Web数据源-Sink一Channel一Source-HDFSC:Web数据源一Channel一Source一Sink一HDFSD:Web数据源一Source一Sink一Channel一HDFS

解析：Flume架构是souce-channel-sink,可参考：https://flume.apache.org/

【本文地址】

公司简介

联系我们