MAPREDUCE服务 MRS-Hive基本原理:Hive原理

时间:2025-05-19 17:35:57

Hive原理

Hive作为一个基于HDFS和MapReduce架构的 数据仓库 ,其主要能力是通过对HQL(Hive Query Language)编译和解析,生成并执行相应的MapReduce任务或者HDFS操作。Hive与HQL相关信息,请参考HQL 语言手册

图3为Hive的结构简图。

  • Metastore:对表,列和Partition等的元数据进行读写及更新操作,其下层为关系型数据库。
  • Driver:管理HQL执行的生命周期并贯穿Hive任务整个执行期间。
  • Compiler:编译HQL并将其转化为一系列相互依赖的Map/Reduce任务。
  • Optimizer:优化器,分为逻辑优化器和物理优化器,分别对HQL生成的执行计划和MapReduce任务进行优化。
  • Executor:按照任务的依赖关系分别执行Map/Reduce任务。
  • ThriftServer:提供thrift接口,作为JDBC的服务端,并将Hive和其他应用程序集成起来。
  • Clients:包含WebUI和JDBC接口,为用户访问提供接口。
图3 Hive结构
support.huaweicloud.com/productdesc-mrs/mrs_08_001101.html
提示

您即将访问非华为云网站,请注意账号财产安全