数据湖探索 DLI-数据湖探索简介:核心功能

时间:2025-06-20 15:57:18

核心功能

DLI 详细的功能清单请参考DLI功能总览

表1 DLI核心功能

功能分类

功能描述

DLI是基于Serverless架构的数据处理和分析服务

DLI是无服务器化的大数据查询分析服务,使用DLI服务您只需为实际使用的弹性计算资源付费,无需维护和管理云服务器。

  • 计算资源按量计费:真正的按使用量(扫描量/CU时)计费,不运行作业时0费用。
  • 自动扩缩容:根据业务负载,对计算资源进行预估和自动扩缩容。

DLI支持多种类型的计算引擎

完全兼容Apache Spark、Apache Flink、HetuEngine等生态,支持标准SQL、Spark SQL、Flink SQL,兼容 CS V、JSON、Parquet和ORC主流数据格式。

  • Spark是用于大规模数据处理的统一分析引擎,聚焦于查询计算分析。DLI在开源Spark基础上进行了大量的性能优化与服务化改造,不仅兼容Apache Spark生态和接口,性能较开源提升了2.5倍,在小时级即可实现EB级数据查询分析。
  • Flink是一款分布式的计算引擎,可以用来做批处理,即处理静态的数据集、历史的数据集;也可以用来做流处理,即实时地处理一些实时数据流,实时地产生数据的结果。DLI在开源Flink基础上进行了特性增强和安全增强,提供了数据处理所必须的Stream SQL特性。
  • HetuEngine是提供交互式查询分析能力的开源分布式SQL查询引擎,具备高性能、低延迟的查询处理能力,支持在大规模数据存储中进行数据查询和分析。了解更多HetuEngine请参考产品优势

DLI支持多种连接方式

DLI提供了多种连接方式满足不同的用户需求和使用场景。

DLI支持的链接方式:

  • 控制台方式
  • API方式
  • SDK方式
  • 客户端工具
  • 使用DataArts服务提交DLI作业
  • 对接BI工具的可视化分析

更多DLI连接方式的介绍请参考DLI连接方式

DLI支持对接多种数据源的跨源分析

  • Spark跨源连接:可通过DLI访问CloudTable,DWS,RDS和 CSS 等数据源。具体内容请参考 数据湖探索 用户指南》。
  • Flink跨源支持与多种云服务连通,形成丰富的流生态圈。 数据湖 探索的流生态分为云服务生态和开源生态:
    • 云服务生态:数据湖探索在Flink SQL中支持与其他服务的连通。用户可以直接使用SQL从这些服务中读写数据。如DIS、OBS、CloudTable、 MRS 、RDS、 SMN 、DCS等。
    • 开源生态:通过增强型跨源连接建立与其他VPC的网络连接后,用户可以在数据湖探索的租户授权的队列中访问所有Flink和Spark支持的数据源与输出源,如Kafka、Hbase、ElasticSearch等。

    具体内容请参见《数据湖探索开发指南》

DLI支持的三大基本作业类型

  • SQL作业支持SQL查询功能:可为用户提供标准的SQL语句。具体内容请参考《数据湖探索SQL语法参考》
  • Flink作业支持Flink SQL在线分析功能:支持Window、Join等聚合函数,用SQL表达业务逻辑,简便快捷实现业务。具体内容请参考Flink OpenSource SQL语法参考
  • Spark作业提供全托管式Spark计算特性:用户可通过交互式会话(session)和批处理(batch)方式提交计算任务,在全托管Spark队列上进行数据分析。具体内容请参考《数据湖探索API参考》

DLI支持存算分离

用户将数据存储到OBS后,DLI可以直接和OBS对接进行数据分析。存算分离的架构下,使得存储资源和计算资源可以分开申请和计费,降低了成本并提高了资源利用率。

存算分离场景下,DLI支持OBS在创建桶时数据冗余策略选择单AZ或者多AZ存储,两种存储策略区别如下:

  • 选择多AZ存储,数据将冗余存储至多个AZ中,可靠性更高。选择多AZ存储的桶,数据将存储在同一区域的多个不同AZ。当某个AZ不可用时,仍然能够从其他AZ正常访问数据,适用于对可靠性要求较高的数据存储场景。建议优选使用多AZ存储的策略。
  • 选择单AZ存储,数据仅存储在单个AZ中,但相比多AZ更加便宜。收费详情请参见OBS产品价格详情

DLI通过弹性资源池实现对资源的统一的管理和调度

弹性资源池后端采用CCE集群的架构,支持异构,对资源进行统一的管理和调度。

详细内容可以参考DLI用户指南的弹性资源池和队列简介

support.huaweicloud.com/productdesc-dli/dli_01_0378.html