数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是完全托管的大数据处理分析服务,无需ETL,使用SQL和Spark程序就可以对华为云上多源异构数据进行探索

扫描1GB数据3分钱,按需付费

了解详情
产品优势
  • 便捷易用

    无需管理基础设施,零维护成本,数秒内开通服务,即开即用;支持标准SQL,兼容SparkSQL,保持用户使用习惯

  • 多源分析

    支持对云上多个数据源查询探索,数据无需复杂的加载、转换;支持对多种数据格式探索分析,分析维度可以自由选择

  • 企业多租户

    计算资源按租户隔离,保障用户作业SLA;数据权限控制到表/列,方便用户实现数据精细化管理

  • 无限扩展

    结合OBS近乎无限的扩展能力,数据规模支持从GB~EB级自由扩展;服务自动弹性扩容,用户不感知,无需关心资源是否够用

应用场景
  • 交互式多维分析

  • 异构数据源分析

  • 历史数据明细查询

  • 海量行为日志分析

交互式多维分析

交互式多维分析

某电商的用户的购买记录、商品评价数据通过DLI分析处理之后,可以将商品的好评率、重复购买率、转化率等通过BI报表实时展现,给商城的广告投放、运营决策、商品管理提供可靠的数据支撑

优势

超大规模

交易、日志、图片任意数据类型,数据量GB~EB任意扩展

超低成本

扫描1GB数据3分钱,按需付费

兼容主流生态

兼容Apache Spark,支持用户复杂自定义处理

灵活预处理

智能预汇聚,海量数据中挖掘真正信息,分析数据降至1/10~1/100

异构数据源分析

异构数据源分析

Data Lake Insight支持华为云上对象存储OBS、表格存储CloudTable、关系型数据库RDS的数据做关联分析,满足客户在异构数据源之间做复杂分析的需求

优势

数据免搬迁

不需要复杂的ETL,利用SQL就可以做联合查询

兼容主流生态

兼容Apache Spark,支持用户复杂自定义处理

多类型数据格式支持

支持对用户存放在OBS中原始格式的分析,用户无需转换,格式包括文本,CSV,JSON,Parquet,ORC等

历史数据明细查询

IoT:车队管理

当前全国各类型载货车队过百万,车队管理粗放,成本高昂,通过DLI对车辆历史数据进行驾驶行为分析,运输路线回放,帮助车队精细化监控,有效降低管理成本

优势

海量数据支持

DLI支持对应表的数据存在OBS中,数据量GB~EB任意扩展

数据无需预先转换

直接使用SQL对OBS上历史数据分析,无需复杂的加载转换

多类型数据格式支持

支持对用户存放在OBS中原始格式的分析,用户无需转换,格式包括文本,CSV,JSON,Parquet,ORC等

海量行为日志分析

在线教育:学习行为分析

学生学习过程的打点日志记录,存放到公有云OBS,利用DLI对这些行为日志进行学习行为习惯分析,为老师、家长,以及学生提供参考,以此针对性提升学习效率

优势

低成本

海量日志数据存放在OBS中,成本低廉

简单易用

直接使用SQL分析,不用单独搭建系统,编写复杂的处理程序

灵活探索

支持多维度分析查询,可以从学习时长,答题正确率,关联知识点等多方面进行探索分析,业务灵活创新,快速上线

建议搭配使用

对象存储服务 obs

新特性
  • 2018-03-30

    支持查询CloudTable

  • 2018-04-25

    服务正式商用并更名为DLI

  • 2018-04-30

    全托管Spark计算集群正式上线

  • 2018-05-30

    多编辑器控制台

功能描述

  • 标准接口,低门槛分析

    提供用户多种使用方式,支持标准SQL,兼容用户使用习惯

  • 直接查询OBS数据

    支持对OBS数据查询探索,即来即用,使用灵活

标准接口,低门槛分析

  • 支持Web Console界面、RESTFul API,提供多类型使用方式

  • 标准SQL2003,兼容SparkSQL/HQL,TPC-H/TPC-DS

直接查询OBS数据

  • 存储计算分离,支持数据存放在OBS上,通过DLI服务,您可以直接使用SQL对OBS数据进行查询

  • 支持临时按需探索,您无需预先准备任何资源,随时可以对数据进行查询,查询完也无需做任何的销毁动作

  • 安全可用

    完善的认证体系,数据11个9持久性,服务安全可用

  • 细粒度租户管理

    资源按租户隔离,数据细粒度权限控制

安全可用

  • 安全的认证体系:华为云通过C-STAR中国认证、工信部可信云认证、网信办云服务网络安全评估、公安部云服务等保三级认证、ISO27001

  • 用户接入认证,服务内部通信加密,跨域双向认证,数据传输加密,保障用户安全使用服务

细粒度租户管理

  • 支持按租户申请资源队列,企业租户可以为内部不同部门用户指定资源队列,达到隔离计算资源效果,从而保障各部门应用的SLA

  • 企业管理员可以对内部用户进行数据权限控制,如创建/删除表,查询部分列等权限

免费试用

高达4核8G云服务器0元体验

免费体验