介绍-华为云

MAPREDUCE服务 MRS-Spark ThriftServer接口介绍:简介

简介 ThriftServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 ThriftServer是一个JDBC接口，用户可以通过JDBC连接ThriftServer来访问SparkSQL的数据。ThriftServer在启动的时候，会启动一个SparkSQL的应用程序，而通过JDBC连接进来的客户端共同分享这个sparkSQL应用程序的资源，也就是说不同的用户之间可以共享数据。ThriftServer启动时还会开启一个侦听器，等待JDBC客户端的连接和提交查询。所以，在配置ThriftServer的时候，至少要配置ThriftServer的主机名和端口，如果要使用Hive数据的话，还要提供Hive Metastore的URIs。 ThriftServer默认在安装节点上的10000端口起一个JDBC服务，可以通过Beeline或者JDBC客户端代码来连接它，从而执行SQL命令。如果您需要了解ThriftServer的其他信息，请参见Spark官网：http://spark.apache.org/docs/1.5.1/sql-programming-guide.html#distributed-sql-engine。

MAPREDUCE服务 MRS Spark接口介绍

MAPREDUCE服务 MRS-Spark Java API接口介绍:Spark SQL常用接口

Spark SQL常用接口 Spark SQL中重要的类有： SQLContext：是Spark SQL功能和DataFrame的主入口。 DataFrame：是一个以命名列方式组织的分布式数据集 DataFrameReader：从外部存储系统加载DataFrame的接口。 DataFrameStatFunctions：实现DataFrame的统计功能。 UserDefinedFunction：用户自定义的函数。常见的Actions方法有：表5 Spark SQL方法介绍方法说明 Row[] collect() 返回一个数组，包含DataFrame的所有列。 long count() 返回DataFrame的行数。 DataFrame describe(java.lang.String... cols) 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 Row first() 返回第一行。 Row[] head(int n) 返回前n行。 void show() 用表格形式显示DataFrame的前20行。 Row[] take(int n) 返回DataFrame中的前n行。表6 基本的DataFrame Functions介绍方法说明 void explain(boolean extended) 打印出SQL语句的逻辑计划和物理计划。 void printSchema() 打印schema信息到控制台。 registerTempTable 将DataFrame注册为一张临时表，其周期和SQLContext绑定在一起。 DataFrame toDF(java.lang.String... colNames) 返回一个列重命名的DataFrame。 DataFrame sort(java.lang.String sortCol,java.lang.String... sortCols) 根据不同的列，按照升序或者降序排序。 GroupedData rollup(Column... cols) 对当前的DataFrame特定列进行多维度的回滚操作。

MAPREDUCE服务 MRS Spark接口介绍

全球SIM联接 GSL-标签管理:操作步骤

操作步骤登录全球SIM联接控制台。在左侧导航树中选择“标签管理”。请您根据实际需求选择以下操作：新增标签在页面左上角单击“新增标签”。在打开的“新增标签”对话框中，输入标签名称。标签名称支持输入100位以内的字符，包含数字、英文字母、下划线、中划线和中文，且名称不能重复。单击“提交”，完成标签创建。修改标签在需要修改的目标标签列，单击“修改”。在弹出的“修改标签”对话框中，修改标签名称。单击“提交”。删除标签在需要删除的目标标签列，单击“删除”。在弹出的“警告”对话框中，单击“确认”，即可删除该标签。

全球SIM联接 GSL 控制台功能介绍

合作伙伴中心-概述

概述华为云解决方案提供商有面向最终客户转售华为云的资格。解决方案提供商可以通过为客户提供基于华为云的产品和服务，获得销售华为云相应的收益。解决方案提供商可以以顾问销售模式或者代售模式拓展子客户。顾问销售模式：经销商关联的客户与华为云直接交易，客户向华为云付款，华为云或者云商店服务商负责向客户开票，伙伴获得华为云给予的激励。代售模式：经销商关联的客户与解决方案提供商进行交易，客户只能使用解决方案提供商的拨款进行消费，客户的发票由解决方案提供商开具。伙伴向华为云付款，华为云或者云商店服务商负责向伙伴开票。下面按照顾问销售模式和代售模式介绍解决方案提供商的交易模式。父主题：交易模式介绍

合作伙伴中心交易模式介绍

MAPREDUCE服务 MRS-Scala:SparkSQL常用接口

SparkSQL常用接口 Spark SQL中常用的类有： SQLContext：是Spark SQL功能和DataFrame的主入口。 DataFrame：是一个以命名列方式组织的分布式数据集。 HiveContext：获取存储在Hive中数据的主入口。表6 常用的Actions方法方法说明 collect(): Array[Row] 返回一个数组，包含DataFrame的所有列。 count(): Long 返回DataFrame中的行数。 describe(cols: String*): DataFrame 计算统计信息，包含计数，平均值，标准差，最小值和最大值。 first(): Row 返回第一行。 Head(n:Int): Row 返回前n行。 show(numRows: Int, truncate: Boolean): Unit 用表格形式显示DataFrame。 take(n:Int): Array[Row] 返回DataFrame中的前n行。表7 基本的DataFrame Functions 方法说明 explain(): Unit 打印出SQL语句的逻辑计划和物理计划。 printSchema(): Unit 打印schema信息到控制台。 registerTempTable(tableName: String): Unit 将DataFrame注册为一张临时表，其周期和SQLContext绑定在一起。 toDF(colNames: String*): DataFrame 返回一个列重命名的DataFrame。

MAPREDUCE服务 MRS 常用API介绍

MAPREDUCE服务 MRS-Scala:Spark Streaming常用接口

Spark Streaming常用接口 Spark Streaming中常见的类有： StreamingContext：是Spark Streaming功能的主入口，负责提供创建DStreams的方法，入参中需要设置批次的时间间隔。 dstream.DStream：是一种代表RDDs连续序列的数据类型，代表连续数据流。 dstream.PariDStreamFunctions：键值对的DStream，常见的操作如groupByKey和reduceByKey。对应的Spark Streaming的JAVA API是JavaStreamingContext，JavaDStream和JavaPairDStream。 Spark Streaming的常见方法与Spark Core类似，下表罗列了Spark Streaming特有的一些方法。表4 Spark Streaming方法介绍方法说明 socketTextStream(hostname: String, port: Int, storageLevel: StorageLevel = StorageLevel.MEMORY_AND_DISK_SER_2): ReceiverInputDStream[String] 从TCP源主机：端口创建一个输入流。 start():Unit 启动Spark Streaming计算。 awaitTermination(timeout: long):Unit 当前进程等待终止，如Ctrl+C等。 stop(stopSparkContext: Boolean, stopGracefully: Boolean): Unit 终止Spark Streaming计算。 transform[T](dstreams: Seq[DStream[_]], transformFunc: (Seq[RDD[_]], Time) ? RDD[T])(implicit arg0: ClassTag[T]): DStream[T] 对每一个RDD应用function操作得到一个新的DStream。 UpdateStateByKey(func) 更新DStream的状态。使用此方法，需要定义状态和状态更新函数。 window(windowLength, slideInterval) 根据源DStream的窗口批次计算得到一个新的DStream。 countByWindow(windowLength, slideInterval) 返回流中滑动窗口元素的个数。 reduceByWindow(func, windowLength, slideInterval) 当调用在DStream的KV对上，返回一个新的DStream的KV对，其中每个Key的Value根据滑动窗口中批次的reduce函数聚合得到。 join(otherStream, [numTasks]) 实现不同的Spark Streaming之间做合并操作。 DStreamKafkaWriter.writeToKafka() 支持将DStream中的数据批量写入到Kafka。 DStreamKafkaWriter.writeToKafkaBySingle() 支持将DStream中的数据逐条写入到Kafka。表5 Spark Streaming增强特性接口方法说明 DStreamKafkaWriter.writeToKafka() 支持将DStream中的数据批量写入到Kafka。 DStreamKafkaWriter.writeToKafkaBySingle() 支持将DStream中的数据逐条写入到Kafka。

MAPREDUCE服务 MRS 常用API介绍

MAPREDUCE服务 MRS-MapReduce REST API接口介绍

MapReduce REST API接口介绍功能简介通过HTTP REST API来查看更多MapReduce任务的信息。目前Mapresuce的REST接口可以查询已完成任务的状态信息。完整和详细的接口请直接参考官网上的描述以了解其使用：http://hadoop.apache.org/docs/r3.1.1/hadoop-mapreduce-client/hadoop-mapreduce-client-hs/HistoryServerRest.html 准备运行环境在节点上安装客户端，例如安装到“/opt/client”目录，可参考“安装客户端”。进入客户端安装目录“/opt/client”，执行下列命令初始化环境变量。 source bigdata_env 操作步骤获取MapReduce上已完成任务的具体信息命令： curl -k -i --negotiate -u : "http://10.120.85.2:19888/ws/v1/history/mapreduce/jobs" 其中10.120.85.2为MapReduce的“JHS_FLOAT_IP”参数的参数值，19888为JobHistoryServer的端口号。在部分低版本操作系统中使用curl命令访问JobHistoryServer会有兼容性问题，导致无法返回正确结果。用户能看到历史任务的状态信息（任务id，开始时间，结束时间，是否执行成功等信息）运行结果 { "jobs":{ "job":[ { "submitTime":1525693184360, "startTime":1525693194840, "finishTime":1525693215540, "id":"job_1525686535456_0001", "name":"QuasiMonteCarlo", "queue":"default", "user":"mapred", "state":"SUCCEEDED", "mapsTotal":1, "mapsCompleted":1, "reducesTotal":1, "reducesCompleted":1 } ] } } 结果分析：通过这个接口，可以查询当前集群中已完成的MapReduce任务，并且可以得到表1 表1 常用信息参数参数描述 submitTime 任务提交时间 startTime 任务开始执行时间 finishTime 任务执行完成时间 queue 任务队列 user 提交这个任务的用户 state 任务执行成功或失败父主题： MapReduce接口介绍

MAPREDUCE服务 MRS MapReduce接口介绍

AI开发平台MODELARTS-推理基础镜像列表:X86架构（CPU/GPU）的推理基础镜像

X86架构（CPU/GPU）的推理基础镜像表1 TensorFlow AI引擎版本支持的运行环境 URI 2.1.0 CPU GPU(cuda10.1) swr.{region_id}.myhuaweicloud.com/atelier/tensorflow_2_1:tensorflow_2.1.0-cuda_10.1-py_3.7-ubuntu_18.04-x86_64-20221121111529-d65d817 1.15.5 CPU GPU(cuda11.4) swr.{region_id}.myhuaweicloud.com/aip/tensorflow_1_15:tensorflow_1.15.5-cuda_11.4-py_3.8-ubuntu_20.04-x86_64-20220524162601-50d6a18 2.6.0 CPU GPU(cuda11.2) swr.{region_id}.myhuaweicloud.com/aip/tensorflow_2_6:tensorflow_2.6.0-cuda_11.2-py_3.7-ubuntu_18.04-x86_64-20220524162601-50d6a18 表2 Pytorch AI引擎版本支持的运行环境 URI 1.8.0 CPU GPU(cuda10.2) swr.{region_id}.myhuaweicloud.com/atelier/pytorch_1_8:pytorch_1.8.0-cuda_10.2-py_3.7-ubuntu_18.04-x86_64-20221118143845-d65d817 1.8.2 CPU GPU(cuda11.1) swr.{region_id}.myhuaweicloud.com/aip/pytorch_1_8:pytorch_1.8.2-cuda_11.1-py_3.7-ubuntu_18.04-x86_64-20220524162601-50d6a18 表3 MindSpore AI引擎版本支持的运行环境 URI 1.7.0 CPU swr.{region_id}.myhuaweicloud.com/atelier/mindspore_1_7_0:mindspore_1.7.0-cpu-py_3.7-ubuntu_18.04-x86_64-20220702120711-8590b76 1.7.0 GPU(cuda10.1) swr.{region_id}.myhuaweicloud.com/atelier/mindspore_1_7_0:mindspore_1.7.0-cuda_10.1-py_3.7-ubuntu_18.04-x86_64-20220702120711-8590b76 1.7.0 GPU(cuda11.1) swr.{region_id}.myhuaweicloud.com/atelier/mindspore_1_7_0:mindspore_1.7.0-cuda_11.1-py_3.7-ubuntu_18.04-x86_64-20220702120711-8590b76

AI开发平台MODELARTS 推理基础镜像介绍

AI开发平台MODELARTS-推理基础镜像列表:ARM + Ascend 架构的推理基础镜像

ARM + Ascend 架构的推理基础镜像表4 TensorFlow AI引擎版本支持的运行环境 URI 1.15.0 Snt9 swr.{region_id}.myhuaweicloud.com/atelier/tensorflow_1_15_ascend:tensorflow_1.15-cann_5.1.0-py_3.7-euler_2.8.3-aarch64-d910-20220715093657-9446c6a 表5 Pytorch AI引擎版本支持的运行环境 URI 1.8.1 Snt9 swr.{region_id}.myhuaweicloud.com/atelier/pytorch_1_8_ascend:pytorch_1.8.1-cann_5.1.0-py_3.7-euler_2.8.3-aarch64-d910-20220715093657-9446c6a 表6 MindSpore AI引擎版本支持的运行环境 URI 1.7.0 Snt9 swr.{region_id}.myhuaweicloud.com/atelier/mindspore_1_7_0:mindspore_1.7.0-cann_5.1.0-py_3.7-euler_2.8.3-aarch64-d910-20220715093657-9446c6a

AI开发平台MODELARTS 推理基础镜像介绍

AI开发平台MODELARTS-Notebook基础镜像x86 自定义专用镜像:镜像一：conda3-cuda10.2-cudnn7-ubuntu18.04

镜像一：conda3-cuda10.2-cudnn7-ubuntu18.04 表1 conda3-cuda10.2-cudnn7-ubuntu18.04镜像介绍 AI引擎框架是否使用 GPU （CUDA 版本） URL 包含的依赖项无是（cuda 10.2） swr.{region_id}.myhuaweicloud.com/atelier/user_defined_base:cuda_10.2-ubuntu_18.04-x86_64-20221008154718-2b3e39c 例如：华北-北京四 swr.cn-north-4.myhuaweicloud.com/atelier/user_defined_base:cuda_10.2-ubuntu_18.04-x86_64-20221008154718-2b3e39c 华东-上海一 swr.cn-east-3.myhuaweicloud.com/atelier/user_defined_base:cuda_10.2-ubuntu_18.04-x86_64-20221008154718-2b3e39c 华南-广州 swr.cn-south-1.myhuaweicloud.com/atelier/user_defined_base:cuda_10.2-ubuntu_18.04-x86_64-20221008154718-2b3e39c PyPI 程序包 Ubuntu 软件包 ipykernel 6.7.0 ipython 7.34.0 jupyter-client 7.3.4 ma-cau 1.1.3 ma-cau-adapter 1.1.3 ma-cli 1.1.5 matplotlib 3.5.1 modelarts 1.4.11 moxing-framework 2.1.0.5d9c87c8 numpy 1.21.6 pandas 1.3.5 pillow 9.2.0 pip 20.3.3 psutil 5.9.1 PyYAML 6.0 scipy 1.7.3 tornado 6.2 automake build-essential ca-certificates cmake cpp curl g++ gcc gfortran grep libcudnn7 libcudnn7-dev nginx python3 rpm tar unzip vim wget zip

AI开发平台MODELARTS Notebook基础镜像介绍

AI开发平台MODELARTS-Notebook基础镜像x86 自定义专用镜像:镜像二：conda3-ubuntu18.04

镜像二：conda3-ubuntu18.04 表2 conda3-ubuntu18.04镜像介绍 AI引擎框架是否使用 GPU （CUDA 版本） URL 包含的依赖项无否 swr.{region_id}.myhuaweicloud.com/atelier/user_defined_base:ubuntu_18.04-x86_64-20221008154718-2b3e39c 例如：华北-北京四 swr.cn-north-4.myhuaweicloud.com/atelier/user_defined_base:ubuntu_18.04-x86_64-20221008154718-2b3e39c 华东-上海一 swr.cn-east-3.myhuaweicloud.com/atelier/user_defined_base:ubuntu_18.04-x86_64-20221008154718-2b3e39c 华南-广州 swr.cn-south-1.myhuaweicloud.com/atelier/user_defined_base:ubuntu_18.04-x86_64-20221008154718-2b3e39c PyPI 程序包 Ubuntu 软件包 ipykernel 6.7.0 ipython 7.34.0 jupyter-client 7.3.4 ma-cau 1.1.3 ma-cau-adapter 1.1.3 ma-cli 1.1.5 matplotlib 3.5.1 modelarts 1.4.11 moxing-framework 2.1.0.5d9c87c8 numpy 1.21.6 pandas 1.3.5 pillow 9.2.0 pip 20.3.3 psutil 5.9.1 PyYAML 6.0 scipy 1.7.3 tornado 6.2 automake build-essential ca-certificates cmake cpp curl g++ gcc gfortran grep nginx python3 rpm tar unzip vim wget zip

AI开发平台MODELARTS Notebook基础镜像介绍

云数据库 GEMINIDB-企业级特性介绍

企业级特性介绍 GeminiDB Redis接口基于云原生分布式架构，实现了计算与存储分离，完全兼容社区版Redis6.2(包含6.2.x)、5.0及以下版本，提供了更多的企业级特性。资源独享，分片不限流计算节点部署在独享容器，租户隔离，稳定性高。面对高并发流量，节点不被限流。内置独享型负载均衡器，转发性能和稳定性更高。计算节点支持绑定公网IP，方便用户迁移上云和远程调试。秒级弹性伸缩，轻松应对业务峰谷支持存储和计算各自独立伸缩。单实例最大支持千万级QPS和36TB容量。数据量增长场景，容量的扩容只需一键即可秒级完成，业务应用无感知。业务量突增的场景（比如游戏、电商的活动期间，临时有更高的QPS诉求），可通过增加节点和提升规格两种方式进行扩容，后续可轻松缩容，对业务的影响仅为秒级连接重连。一库替代多库，简化业务架构基于高性能存储池，实例自动加载高频访问的热数据在计算节点的内存中，内部自动完成冷热数据交换，业务优先从内存中读取热数据，兼顾数据的高可靠和低时延。 GeminiDB Redis接口适合存储持续增长的重要业务数据（比如游戏玩家数据、用户画像、行为日志、文章资讯等），相比使用Redis+MySQL的架构场景，架构更简洁、数据存储更可靠，同时还具备更高的综合性能和性价比。支持3AZ部署 3AZ实例支持将计算和存储资源都会均匀分布在3个可用区，部署规则严格遵循反亲和组，实例具备超高可靠性。支持故障节点秒级接管，在独有的存算分离架构下，即使发生N-1节点同时故障的极端场景，依然可以秒级恢复业务访问，超高可用。支持跨Region双活容灾支持企业级双活容灾能力，用户可创建2个独立的实例（同Region或跨Region），并搭建容灾关系，如果其中一个实例出现极端场景的故障，另一个实例能继续提供可靠的数据库服务。支持双向数据同步，支持断点续传。账号管理，支持DB级权限控制支持使用65536个DB，支持创建200个子账号。用户不但可以为子账号设置只读或读写权限，还可为子账号配置可访问的DB列表，从根本上避免多租户之间数据误操作风险。支持为Hash key的Field单独设置过期时间开源Redis只支持为Hash key整体设置过期时间。GeminiDB Redis接口新增了一组hash命令，这一新功能让用户可以为一个Hash key中的指定Field单独设置过期时间，将业务层面的淘汰逻辑下沉到数据库中实施，简化业务架构。 exHash最佳实践详见GeminiDB Redis广告频控业务exHash方案。数据强一致，不会发生脏读开源Redis采用异步复制，数据副本间弱一致。在计数器、限流器、分布式锁等常见业务场景中，会带来脏读隐患，可能会导致业务逻辑错乱。 GeminiDB Redis接口将数据副本下沉到高性能存储池中，一旦写入成功，将保障数据3副本强一致存储，后续业务访问不会发生脏读。增强版事务功能支持事务功能，即MULTI/EXEC。相比开源Redis的伪事务，GeminiDB Redis接口实现了真事务，即支持ACID，在底层实现了对回滚的支持，满足了事务的原子性。增强版前缀扫描当用户对实例执行Scan类扫描命令时，如指定前缀匹配（match prefix*），则此时的扫描性能将远远超越开源Redis。这是因为GeminiDB Redis接口将该场景下达命令复杂度优化到了O(logN + M)，其中N是整体数据量，M是匹配的数据量。而开源Redis的扫描复杂度则是更慢的O(N)。父主题：产品介绍

云数据库 GEMINIDB 产品介绍

MAPREDUCE服务 MRS-数据拷贝:不同Region

不同Region 当源集群与目标集群处于不同Region时，用Distcp工具将源集群数据拷贝到OBS，借助OBS跨区域复制功能（请参见跨区域复制）将数据复制到对应目的集群所在Region的OBS，然后通过Distcp工具将OBS数据拷贝到目的集群的HDFS上。由于执行Distcp无法为OBS上的文件设置权限、属主/组等信息，因此当前场景在进行数据导出时也需要将HDFS的元数据信息进行导出并拷贝，以防HDFS文件属性信息丢失。

MAPREDUCE服务 MRS 数据迁移方案介绍

MAPREDUCE服务 MRS-数据拷贝:线下集群向云迁移

线下集群向云迁移线下集群可以通过如下两种方式将数据迁移至云：云专线（DC）为源集群与目标集群之间建立云专线，打通线下集群出口网关与线上VPC之间的网络，然后参考同Region执行Distcp进行拷贝。数据快递服务（DES）对于TB或PB级数据上云的场景，华为云提供数据快递服务 DES。将线下集群数据及已导出的元数据拷贝到DES盒子，快递服务将数据递送到华为云机房，然后通过云数据迁移 CDM将DES盒子数据拷贝到HDFS。

MAPREDUCE服务 MRS 数据迁移方案介绍

MAPREDUCE服务 MRS-YARN REST API接口介绍:操作步骤

操作步骤获取运行在Yarn上的任务的具体信息。命令： curl -k -i --negotiate -u : "https://10-120-85-2:8090/ws/v1/cluster/apps/" 其中10-120-85-2为ResourceManager主节点的hostname，8090为ResourceManager的端口号。用户能看到哪个队列的任务，要看这个用户是否有这个队列的admin权限。如果当前组件使用了Ranger进行权限控制，需基于Ranger配置相关策略进行权限管理。运行结果： { "apps": { "app": [ { "id": "application_1461743120947_0001", "user": "spark", "name": "Spark-JDBCServer", "queue": "default", "state": "RUNNING", "finalStatus": "UNDEFINED", "progress": 10, "trackingUI": "ApplicationMaster", "trackingUrl": "https://10-120-85-2:8090/proxy/application_1461743120947_0001/", "diagnostics": "AM is launched. ", "clusterId": 1461743120947, "applicationType": "SPARK", "applicationTags": "", "startedTime": 1461804906260, "finishedTime": 0, "elapsedTime": 6888848, "amContainerLogs": "https://10-120-85-2:8044/node/containerlogs/container_e12_1461743120947_0001_01_000001/spark", "amHostHttpAddress": "10-120-85-2:8044", "allocatedMB": 1024, "allocatedVCores": 1, "runningContainers": 1, "memorySeconds": 7053309, "vcoreSeconds": 6887, "preemptedResourceMB": 0, "preemptedResourceVCores": 0, "numNonAMContainerPreempted": 0, "numAMContainerPreempted": 0, "resourceRequests": [ { "capability": { "memory": 1024, "virtualCores": 1 }, "nodeLabelExpression": "", "numContainers": 0, "priority": { "priority": 0 }, "relaxLocality": true, "resourceName": "*" } ], "logAggregationStatus": "NOT_START", "amNodeLabelExpression": "" }, { "id": "application_1461722876897_0002", "user": "admin", "name": "QuasiMonteCarlo", "queue": "default", "state": "FINISHED", "finalStatus": "SUCCEEDED", "progress": 100, "trackingUI": "History", "trackingUrl": "https://10-120-85-2:8090/proxy/application_1461722876897_0002/", "diagnostics": "Attempt recovered after RM restart", "clusterId": 1461743120947, "applicationType": "MAPREDUCE", "applicationTags": "", "startedTime": 1461741052993, "finishedTime": 1461741079483, "elapsedTime": 26490, "amContainerLogs": "https://10-120-85-2:8044/node/containerlogs/container_e11_1461722876897_0002_01_000001/admin", "amHostHttpAddress": "10-120-85-2:8044", "allocatedMB": -1, "allocatedVCores": -1, "runningContainers": -1, "memorySeconds": 158664, "vcoreSeconds": 52, "preemptedResourceMB": 0, "preemptedResourceVCores": 0, "numNonAMContainerPreempted": 0, "numAMContainerPreempted": 0, "amNodeLabelExpression": "" } ] } } 结果分析：通过这个接口，可以查询当前集群中Yarn上的任务，并且可以得到如下表1。表1 常用信息参数参数描述 user 运行这个任务的用户。 applicationType 例如MAPREDUCE或者SPARK等。 finalStatus 可以知道任务是成功还是失败。 elapsedTime 任务运行的时间。获取Yarn资源的总体信息。命令： curl -k -i --negotiate -u : "https://10-120-85-102:8090/ws/v1/cluster/metrics" 运行结果： { "clusterMetrics": { "appsSubmitted": 2, "appsCompleted": 1, "appsPending": 0, "appsRunning": 1, "appsFailed": 0, "appsKilled": 0, "reservedMB": 0, "availableMB": 23552, "allocatedMB": 1024, "reservedVirtualCores": 0, "availableVirtualCores": 23, "allocatedVirtualCores": 1, "containersAllocated": 1, "containersReserved": 0, "containersPending": 0, "totalMB": 24576, "totalVirtualCores": 24, "totalNodes": 3, "lostNodes": 0, "unhealthyNodes": 0, "decommissionedNodes": 0, "rebootedNodes": 0, "activeNodes": 3, "rmMainQueueSize": 0, "schedulerQueueSize": 0, "stateStoreQueueSize": 0 } } 结果分析：通过这个接口，可以查询当前集群中如表2。表2 常用信息参数参数描述 appsSubmitted 已经提交的任务数。 appsCompleted 已经完成的任务数。 appsPending 正在挂起的任务数。 appsRunning 正在运行的任务数。 appsFailed 已经失败的任务数。 appsKilled 已经被kill的任务数。 totalMB Yarn资源总的内存。 totalVirtualCores Yarn资源总的VCore数。

MAPREDUCE服务 MRS YARN接口介绍

云服务器内容精选

介绍

7*24

备案

专业服务

退订

建议反馈

售前咨询热线