数据湖探索 DLI

数据湖探索(Data Lake Insight,简称DLI)是基于Apache Spark生态,完全托管的大数据处理分析服务。企业使用标准SQL或Spark程序就能轻松完成异构数据源的联邦分析,挖掘和探索数据价值

按需付费,CU单价¥1.4/小时

了解详情
产品优势
  • 兼容开放

    基于开源Apache Spark生态和接口,线下Spark应用可以无缝平滑迁移到云上,减少迁移工作量

  • 算力强大

    使用大数据高扩展性框架,轻松处理TB~EB级海量数据,自如应对不同场景的数据分析处理需求

  • 性能卓越

    使用内存计算模型、DAG调度框架、高效的优化器,综合性能是传统MapReduce模型的百倍以上

  • 成本更低

    按使用时长计费,使用时收费,不使用不收费,定价单位是CU(1CU = 4核CPU + 16GB内存),CU单价为¥1.4/小时

主要功能

  • 运行标准SQL

    使用JDBC和SDK等接口运行标准ANSI SQL 2003,无需关心具体SQL引擎的部署和运维,就能基于海量数据进行分析。

  • Serverless Spark

    基于Apache Spark生态,提供Spark Streaming、Spark Batch等Spark全栈能力,能够基于Spark API轻松完成TB~EB级数据处理分析

运行标准SQL

Serverless Spark

  • 企业级多租户

    支持计算资源按租户隔离,保障作业SLA;支持数据权限控制到表/列,帮助企业实现部门间数据共享和权限管理

  • SQL on AI

    将对图片、视频、语言的处理分析能力嵌入在SQL里,提供结构化与非结构化数据的融合分析能力

企业级多租户

SQL on AI

  • 异构数据源联邦分析

    支持多种数据格式( CSV、JSON、Parquet、ORC、CarbonData等),云上多种数据源(OBS、DWS、CloudTable、RDS等),数据无需搬迁,即可实现对云上多个数据源进行联邦分析,帮助企业快速完成业务创新和数据价值探索。

  • 无限扩展

    存储和计算资源自动弹性扩容,可自如面对流量、数据等的突增。用户不感知,无需关心资源是否够用。

异构数据源联邦分析

无限扩展

应用场景
  • 海量日志分析

  • 异构数据源联邦分析

  • 大数据ETL处理

海量日志分析

游戏运营数据分析

游戏公司不同部门日常通过游戏数据分析平台,分析每日新增日志获取所需指标,通过数据来辅助决策。例如:运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等,了解游戏当前状态及后续响应活动措施;投放部门通过平台获取新增玩家、活跃玩家的渠道来源,来决定下一周期重点投放哪些平台

优势

高效的Spark编程模型

使用Spark Streaming直接从DIS中获取数据,进行数据清理等预处理操作。只需编写处理逻辑,无需关心多线程模型

简单易用

直接使用标准SQL编写指标分析逻辑,无需关注背后复杂的分布式计算平台

按需计费

日志分析按实效性要求按周期进行调度,每次调度之间存在大量空闲期。DLI按需计费只在使用期间收费,成本较独占集群降低50%以上

异构数据源联邦分析

车企数字化服务转型

面临市场新的竞争压力及出行服务不断变革,车企通过构建车联云平台和车机OS,将互联网应用与用车场景打通,完成车企数字化服务转型,从而为车主提供更好的智联出行体验,增加车企竞争力,促进销量增长。例如:通过对车辆日常指标数据(电池、发动机,轮胎胎压、安全气囊等健康状态)的采集和分析,及时将维保建议回馈给车主

优势

多源数据分析免搬迁

关系型数据库RDS中存放车辆和车主基本信息,表格存储CloudTable中存放实时的车辆位置和健康状态信息,数据仓库DWS中存放周期性统计的指标。通过DLI无需数据搬迁,对多数据源进行联邦分析

数据分级存储

车企需要保留全量历史数据支撑审计类等业务,低频进行访问。温冷数据存放在低成本的对象存储服务OBS上,高频访问的热数据存放在数据引擎(CloudTable和DWS)中,降低整体存储成本

告警快速敏捷触发服务器弹性伸缩

对CPU、内存、硬盘空间和带宽无特殊要求

大数据ETL处理

地理大数据分析

地理大数据具有大数据的相关特征,数据体量巨大,例如全球卫星遥感影像数据量达到PB级;数据种类多,有结构化的遥感影像栅格数据、矢量数据,非结构化的空间位置数据、三维建模数据;在大体量的地理大数据中,通过高效的挖掘工具或者挖掘方法实现价值提炼,是用户非常关注的话题

优势

灵活探索

支持全栈Spark能力,具备丰富的Spark空间数据分析算法算子,全面支持结构化的遥感影像数据、非结构化的三维建模、激光点云等巨量数据的离线批处理,支持带有位置属性的动态流数据实时计算处理

大数据ETL

具备TB~EB级遥感影像数据治理能力,能快速将海量遥感影像数据接入上云,快速完成影像数据切片处理,为分布式批处理计算提供弹性分布式数据集

使用指南

免费体验 0元领取云主机

点击领取