MapReduce

时间:2020-11-17 17:04:29

MapReduce是Hadoop的核心,是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念“Map(映射)”和“Reduce(化简)”,及他们的主要思想,都是从函数式编程语言借来的,还有从矢量编程语言借来的特性。

当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(化简)函数,用来保证所有映射的键值对中的每一个共享相同的键组。

图1分布式批处理引擎

什么是MapReduce

MapReduce是用于并行处理大数据集的软件框架。MapReduce的根源是函数性编程中的map和reduce函数。Map函数接受一组数据并将其转换为一个键/值对列表,输入域中的每个元素对应一个键/值对。Reduce函数接受Map函数生成的列表,然后根据它们的键缩小键/值对列表。MapReduce起到了将大事务分散到不同设备处理的能力,这样原本必须用单台较强服务器才能运行的任务,在分布式环境下也能完成。


MapReduce服务 MRS

MapReduce服务(MapReduce Service)提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、Spark、HBase、Kafka、Storm等大数据组件。

包年更优惠,买1年只需付10个月费用

 

查找用户||https://support.huaweicloud.com/devg3-mrs/mrs_07_440014.html,HDFS简介||https://support.huaweicloud.com/devg-mrs/mrs_06_0112.html,配置存算分离集群||https://support.huaweicloud.com/usermanual-mrs/mrs_01_0768.html,安装客户端||https://support.huaweicloud.com/usermanual-mrs/admin_guide_000171.html,MRS作业简介||https://support.huaweicloud.com/usermanual-mrs/mrs_01_0051.html

https://www.huaweicloud.com/product/mrs.html

猜你喜欢