数据湖探索 DLI-数据湖探索简介:DLI产品结构

时间:2025-06-13 10:53:48

DLI 产品结构

DLI的产品结构如下:

图1 DLI Serverless架构

其中核心模块介绍如下:

表2 DLI架构核心模块简介

模块名称

功能说明

计算引擎

  • Spark:支持大规模数据的批处理和交互式分析,提供高性能的分布式计算能力。
  • Flink:支持实时流处理,能够处理大规模的实时数据流,支持事件时间处理和状态管理。
  • HetuEngine:支持交互式数据分析,能够快速处理复杂的SQL查询,支持多种数据源的连接和查询。

存储服务

使用OBS、数据库存储用于数据分析的结构化或非结构化数据,提供数据的持久化存储服务。

数据源连接

  • 支持对接云上数据源,例如OBS: 对象存储服务 ,用于存储和管理非结构化数据。RDS关系型数据库服务,用于存储和管理结构化数据。DWS 数据仓库 服务,用于高效的数据查询和分析。
  • 支持对接云下数据源,例如自建数据库场景,如MySQL、PostgreSQL、HDFS数据。

统一资源管理

  • 资源解耦:DLI采用存算分离架构,将计算资源和存储资源解耦,您可以根据实际需求灵活调整计算资源和存储资源的配比,提高资源利用率,降低成本。
  • 弹性伸缩:DLI计算资源基于容器化Kubernetes,具有极致的弹性伸缩能力。能够根据作业需求自动调整资源配置,响应作业需求。
  • 多租户支持:支持计算资源按租户隔离,确保不同租户之间的资源独立。每个租户可以独立管理自己的计算资源,实现资源的精细化管理,帮助企业实现部门间的数据共享和权限管理。
  • 计算资源按量付费:您只需为实际使用的计算资源付费,无需预先购买和管理服务器,提高资源的使用效率。

统一元数据管理

  • 多源元数据整合:DLI支持对多种数据源的元数据进行统一管理,包括云上数据源(如OBS、RDS、DWS、 CSS 等)和云下数据源(如自建数据库、Redis等)。您无需将数据搬迁到统一的 数据湖 中,即可实现对不同数据源的元数据的管理和分析。
  • 元数据同步:DLI提供的元数据管理功能确保元数据的实时性和一致性。
  • 元数据查询与管理:DLI提供标准SQL接口,用户可以使用SQL语句查询和管理元数据。支持对元数据的增删改查操作,方便用户进行 数据治理 和分析。
  • 数据安全与权限管理:支持数据目录、数据库和表的权限管理。用户可以对不同租户和用户组设置不同的权限,确保数据的安全性和合规性。

行业生态拓展

华为云 数据湖探索 (DLI)通过其强大的Serverless架构和多模引擎支持,能够满足不同行业的多样化需求,推动各行业的数字化转型和创新。

support.huaweicloud.com/productdesc-dli/dli_01_0378.html
提示

您即将访问非华为云网站,请注意账号财产安全