spark 部署方式 您所在的位置:网站首页 mapreduce10 spark 部署方式

spark 部署方式

2023-05-21 21:15| 来源: 网络整理| 查看: 265

spark 部署方式_生产环境

Local模式 Local模式就是运行在一台计算机上的模式,通常就是用于在本机上练手和测试。它可以通过以下集中方式设置master。

local: 所有计算都运行在一个线程当中,没有任何并行计算,通常我们在本机执行一些测试代码,或者练手,就用这种模式。 local[K]: 指定使用几个线程来运行计算,比如local[4]就是运行4个worker线程。通常我们的cpu有几个core,就指定几个线程,最大化利用cpu的计算能力 local[*]: 这种模式直接帮你按照cpu最多cores来设置线程数了。 使用示例:

/bin/spark-submit –cluster cluster_name –master local[*] …

总而言之这几种local模式都是运行在本地的单机版模式,通常用于练手和测试,而实际的大规模计算就需要下面要介绍的cluster模式。 cluster模式 cluster模式肯定就是运行很多机器上了,但是它又分为以下三种模式,区别在于谁去管理资源调度。(说白了,就好像后勤管家,哪里需要资源,后勤管家要负责调度这些资源)

standalone模式 这种模式下,Spark会自己负责资源的管理调度。它将cluster中的机器分为master机器和worker机器,master通常就一个,可以简单的理解为那个后勤管家,worker就是负责干计算任务活的苦劳力。具体怎么配置可以参考Spark Standalone Mode 使用standalone模式示例:

/bin/spark-submit –cluster cluster_name –master spark://host:port …

–master就是指定master那台机器的地址和端口,我想这也正是–master参数名称的由来吧。

mesos模式 这里就很好理解了,如果使用mesos来管理资源调度,自然就应该用mesos模式了,示例如下:

/bin/spark-submit –cluster cluster_name –master mesos://host:port … yarn模式 同样,如果采用yarn来管理资源调度,就应该用yarn模式,由于很多时候我们需要和mapreduce使用同一个集群,所以都采用Yarn来管理资源调度,这也是生产环境大多采用yarn模式的原因。yarn模式又分为yarn cluster模式和yarn client模式:

yarn cluster: 这个就是生产环境常用的模式,所有的资源调度和计算都在集群环境上运行。 yarn client: 这个是说Spark Driver和ApplicationMaster进程均在本机运行,而计算任务在cluster上。 使用示例:

/bin/spark-submit –cluster cluster_name –master yarn-cluster …



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有