[快速入门]数据湖平台
智能数据湖_FusionInsight_数据湖应用场景_大数据-华为云

了解详情 FusionInsight全景图 类别 场景 服务 优势 多元分析 一站式大数据平台 云原生数据湖 MRS 全球累计交付30万+节点,30%性价比提升 全托管大数据服务 数据湖探索 DLI 流、批、交互式一体,AIl in SQL,秒级扩缩容 数据仓库 云数据仓库 GaussDB(DWS)

数据治理中心

AI开发平台 ModelArts 政务场景 方案概述 深度结合华为数据之道方法论构建政务数据管理机制;基于华为数据湖底座及数据治理平台,联合行业伙伴构建省市统一政务数据湖,统一数据管理平台,数据开放共享平台,数据要素流通平台 业务价值 统筹建设、统一数据架构、统一数据湖平台、一体化数据资源

数据仓库服务 DWS

多源数据采集,打破数据孤岛,形成统一的数据展现平台 统一分析决策平台 统一的数据决策平台,多维分析企业经营数据,有效支撑企业的经营决策 多场景展现 搭配BI工具多终端数据展现PC端/移动端/大屏,满足业务部门各种报表诉求 搭配使用 数据湖探索 DLI MapReduce服务 MRS 数据湖治理中心 DataArts

WeLink互动教学平台

智慧教室互动教学平台 把数字化教育带入每一间教室 WeLink互动教学平台围绕教学核心场景,联合优质教学资源,为学校构建极简、开放、智能的线上线下融合教学环境。 购买 咨询专家 下载WeLink 方案介绍 互动型教室 • 支持本地/远程互动教学 • 多终端接入、4K无线投影 • 极简录播,一键分享

AI平台ModelArts入门

AI开发平台ModelArts入门 AI平台ModelArts入门 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 购买 控制台 专家咨询

AI平台ModelArts资源

AI平台ModelArts资源 AI平台ModelArts资源 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 购买 控制台 文档 资源与工具

应用平台 AppStage

应用平台 AppStage 应用平台 AppStage 面向下一代的应用平台,帮助开发者快速高效地实现云原生应用及AI原生应用的全生命周期管理 面向下一代的应用平台,帮助开发者快速高效地实现云原生应用及AI原生应用的全生命周期管理 智能体平台 Versatile 免费体验立即了解

数据仓库服务应用场景_数据仓库服务客户案例_GaussDB(DWS)

多源数据采集,打破数据孤岛,形成统一的数据展现平台 统一分析决策平台 统一的数据决策平台,多维分析企业经营数据,有效支撑企业的经营决策; 多场景展现 搭配BI工具多终端数据展现PC端/移动端/大屏,满足业务部门各种报表诉求。 建议搭配使用 云数据迁移 CDM 数据湖治理中心 DGC BI/报表软件

MapReduce服务

精心打造的功能 一站式融合平台 提供Kafka、Flink、Spark、HBase、Presto等全栈大数据引擎,支持数据湖,数仓、BI、AI融合,助力客户走向融合的一站式大数据平台。 一键式平台搬迁 100%兼容开源大数据生态,提供一键式搬迁工具,能够帮助客户快速完成自建平台的平滑迁移,整

[相关产品]数据湖平台
Apache Hudi

Apache Hudi是下一代流数据湖平台,它直接在数据湖中引入了核心的仓库和数据库功能。Hudi提供了两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。Apache Hudi,也被发音为“hoodie”,是下一代流数据湖平台。它直接在数据湖中引入了核心的仓库和数据库功

数据地图 SaaS版

数据资产,为企业数字化转型提供有力支撑。       数据治理实施落地后,企业业务数据汇聚到数据湖平台内。数据作为数字化转型的核心要素,支撑数据应用,使能业务决策,推动业务创新。数据湖平台为数据提供汇集的载体,承载数据目录的梳理,形成可以支撑数据应用的数据资产。随着数据的汇聚,数

数据地图

数据资产,为企业数字化转型提供有力支撑。       数据治理实施落地后,企业业务数据汇聚到数据湖平台内。数据作为数字化转型的核心要素,支撑数据应用,使能业务决策,推动业务创新。数据湖平台为数据提供汇集的载体,承载数据目录的梳理,形成可以支撑数据应用的数据资产。随着数据的汇聚,数

数据中台软件

管理、数据湖备份、标准数据仓库备份、中心数据仓库备份、系统操作日志等功能;支持记录平台中台中所有操作的日志信息,方便进行日志审计7、公共模块,提供:业务系统管理、用户管理、角色权限管理、菜单管理、文件上传、消息推送列表、消息推送管理、流程管理、通用设置等功能;支持管理平台登录标题

华为云智能数据培训服务

,每班最大人数20人 开发者认证培训1.华为云大数据工作级开发者认证培训定位于培养了解一站式大数据平台MRS、数据湖治理中心DGC的架构,掌握MRS常用组件、DGC工作流及华为数据湖探索服务DLI的使用方案,熟知华为大数据搬迁方案的大数据开发工程师及数据治理工程师。课程内容:大数

蓝光存储配套服务

离线数据迁移服务离线数据迁移服务面向用户提供TB或PB级的海量数据离线迁移工具,有效降低用户成本的同时,提供稳定、快速的数据传输,包括用户到用户、用户到数据湖(IDC)、数据湖(IDC)到数据湖(IDC)等多种数据迁移场景。2.在线数据迁移与技术支持服务在线数据迁移与技术支持提供在线数据迁移工具、专业技术人员支持等服务。3

数字化营销平台配套服务-CNP

华为云数字化营销平台配套服务致力于为企业客户提供数据治理实施服务,依赖强大的平台能力建立企业数据治理体系,通过数据接入、清洗、模型构建、标签构建等数据服务,实现数据资产化、资产服务化,打通数据与业务之间的壁垒。  根据华为数字化转型经验提供企业数据管理方法指导,为企业建设完善的数据治理体系提供方法论

数字化营销平台配套服务

华为云数字化营销平台配套服务致力于为企业用户增长解决方案的客户提供数据治理实施服务,依赖用户增长强大的平台能力建立企业数据治理体系,通过数据接入、清洗、模型构建、标签构建等数据服务,实现数据资产化、资产服务化,打通数据与业务之间的壁垒。  具备各行业数据治理经验,能提供完善的咨询服务

煤矿数据集成设计服务-HCS版

华为煤矿军团数据集成设计服务依托华为20余年数据管理实践,以及煤矿军团在矿山行业的持续探索,为企业高效落地数据平台和数据集成方案。数据湖集成方案设计:包括数据调研、数据湖功能架构设计、用户权限适配、集成方案设计、集成实施指南编制、集成方案汇报、服务验收等工作。根据调研得到结果,包

[相似文章]数据湖平台
什么是数据湖探索服务_数据湖探索DLI用途与特点

Jar作业开发指南 精选文章推荐 更多相关文章精选推荐,带您了解更多华为云数据湖探索 了解数据湖探索 图解数据湖探索 什么是数据湖弹性资源池 数据湖探索使用约束限制 数据湖探索计费说明 数据湖探索与其他云服务的关系 数据湖探索快速入门 创建并提交Spark SQL作业 创建并提交Spark

什么是跨源连接-数据湖探索DLI跨源连接

展,能够通过SQL语句、Spark作业或者Flink作业访问其他数据存储服务并导入、查询、分析处理其中的数据,数据湖探索跨源连接的功能是打通数据源之间的网络连接。 数据湖探索跨源连接的功能是打通数据源之间的网络连接,目前DLI支持跨源连接访问的数据源包括:CloudTable HBase,CloudTable

什么是Flink OpenSource SQL_数据湖探索_Flink OpenSource SQL

OpenSource SQL的特点与功能 数据湖探索DLI是完全兼容Apache Flink,也支持标准Flink OpenSource SQL作业,DLI在开源Flink基础上进行了特性增强和安全增强,提供了数据处理所必须的Stream SQL特性。 数据湖探索DLI是完全兼容Apache

什么是Spark SQL作业_数据湖探索DLISpark SQL作业

SQL作业的特点与功能 数据湖探索DLI是完全兼容Apache Spark,也支持标准的Spark SQL作业,DLI在开源Spark基础上进行了大量的性能优化与服务化改造,不仅兼容Apache Spark生态和接口,性能较开源提升了2.5倍,在小时级即可实现EB级数据查询分析。 数据湖探索DLI是完全兼容Apache

MapReduce工作原理_MapReduce是什么意思_MapReduce流程_MRS_华为云

混合云和公有云两种形态:混合云版本,一个架构实现离线、实时、逻辑三种数据湖,以云原生架构助力客户智能升级;公有云版本,协助客户快速构建低成本、灵活开放、安全可靠的一站式大数据平台。 云原生数据湖MRS(MapReduce Service)为客户提供Hudi、ClickHouse、

什么是弹性资源池_数据湖探索DLI弹性资源池

弹性资源池功能与特点 数据湖探索服务DLI用途与特点 弹性资源池的主要功能是资源进行统一的管理和调度,弹性资源池的特点有以下几点:统一资源管理、租户资源隔离、分时按需弹性等。 弹性资源池的主要功能是资源进行统一的管理和调度,弹性资源池的特点有以下几点:统一资源管理、租户资源隔离、分时按需弹性等。

移动开发平台_SAAS平台_基础软件_低代码开发平台

移动开发平台 移动开发平台 如何快速了解移动开发平台,saas平台,基础软件,低代码开发平台?软件开发生产线 CodeArts是一站式、全流程、安全可信的云原生DevSecOps平台,开箱即用,预置最佳实践,助力质量提升和效率倍增。华为云移动开发平台开放免费试用,欢迎您来体验。

什么是云平台_云平台介绍_云服务平台登录入口

平台介绍 云平台介绍 什么是云平台?华为云平台能为您提供安全、可信、持续创新的云计算相关的产品与服务;助力企业降本增效的精品应用、满足不同阶段业务需求,加速企业数字化转型。 什么是云平台?华为云平台能为您提供安全、可信、持续创新的云计算相关的产品与服务;助力企业降本增效的精品应

大数据应用范围有哪些_大数据技术与应用要学习什么课程

大数据治理与开发 数据湖治理中心 数据湖治理中心(DGC)是数据全生命周期一站式开发运营平台,提供数据集成、数据开发、数据治理、数据服务、数据可视化等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业客户快速构建数据运营能力。 数据接入服务 数据接入服务(Data

数据湖平台

数据平台总体架构

本项目一期以离线数据分析为主,按照华为云数据使能方案的离线数据湖子方案,以华为公有云为载体,为客户建设离线数据湖平台,作为本次项目数据分析应用的数据底座。

离线数据湖平台整体架构如下,核心由三个云服务组成,大数据平台 MRS 数据仓库 平台DWS、数据集成治理平台 DataArts Studio

图1 离线数据湖整体架构

离线数据湖平台可以向实时数据湖、ITOT融合数据湖、数据资产平台、数据可信流通等其他子方案演进,整体演进方案如下:

图2 华为云数据使能方案总体演进

华为云数据使能方案为客户提供全栈大 数据管理 方案,覆盖“采存算管用”的全数据生命周期处理环节,支持公有云、混合云、 边缘云 等多种基础设施形态,支持向未来平滑演进。

数据仓库服务DWS

GaussDB (DWS)是企业级的大规模并行处理关系型 数据库 。其采用MPP(Massive Parallel Processing)架构,支持行存储与列存储,提供PB(Petabyte,2的50次方字节)级别数据量的处理能力。数据仓库服务(GaussDB(DWS),简称DWS)是一种在线数据处理数据库,提供即开即用、可扩展且完全托管的分析型数据库服务。DWS是基于华为融合数据仓库GaussDB产品的 云原生 服务,兼容标准ANSI SQL 99和SQL 2003,同时兼容 PostgreSQL /Oracle数据库生态,为各行业PB级海量大数据分析提供有竞争力的解决方案。

GaussDB(DWS)在核心技术上跟传统数据库相比有巨大优势,可以解决很多行业用户的数据处理性能问题,可以为超大规模数据管理提供高性价比的通用计算平台,并可用于支撑各类数据仓库系统、BI(Business Intelligence)系统和决策支持系统,统一为上层应用的决策分析等提供服务。DWS可广泛应用于金融、车联网、政企、电商、能源、电信等多个领域,已连续两年入选Gartner发布的数据管理解决方案魔力象限,相比传统数据仓库,性价比提升数倍,具备大规模扩展能力和企业级可靠性。

图3 数据仓库产品架构

华为并行数据库基于Shared-nothing/MPP架构,面向开放x86平台,数据跨所有节点均匀分布,所有节点以并行方式工作,提供标准SQL接口,支持SQL92,99,2003标准,支持JDBC/ODBC标准接口,提供多达256个物理节点PB级数据存储分析的扩展能力。

大数据服务MRS

图4 云原生数据湖全景

基于MRS,建设企业级云原生数据湖,云原生数据湖主要包括数据湖,数据集市:

  • 数据湖:企业内多种格式数据源汇聚的大数据平台,通过严格的数据权限和资源管控,将数据和算力开放给各种使用者,为数据湖。一份数据支持多种分析,是数据湖最大的特点。数据湖又分为三个阶段:
    1. 离线数据湖:将企业内多种格式数据源汇聚的大数据平台,通过严格的数据权限和资源管控,将数据和算力开放给各种使用者。其中数据从数据源产生后到进入到数据湖存储,无法做到实时,通常超过15分钟。离线数据湖主要用来支撑企业内部T+1小时级别的离线分析和处理。
    2. (离线数据湖是客户大数据平台的必选,一般的客户做大数据处理都要使用离线数据湖,但是离线数据湖的时效性很低,只能做到小时级处理,已经开始逐渐无法满足各行业需求,因此除非客户坚持目前和未来如果干年对时效性都没有要求,不建议选择离线数据湖)
    3. 实时数据湖:将企业内多种格式数据源汇聚的大数据平台,通过严格的数据权限和资源管控,将数据和算力开放给各种使用者。其中数据从数据源产生后,可以实时进入到数据湖存储,通常在1到15分钟之间。实时数据湖既可以用来支撑企业内部T+1小时级别的离线分析和处理,也可以支撑企业内部实时分析和处理。
    4. 逻辑数据湖:将企业内多种格式数据源汇聚的大数据平台,通过严格的数据权限和资源管控,将数据和算力开放给各种使用者。其中数据并不是在物理上汇聚到了一个数据平台上,而是如果干个物理分开的数据平台形成虚拟数据湖。
  • 数据集市:企业内存储特定格式数据,提供给特定类型查询分析,满足特定的业务场景,针对特定用户的,特定的数据平台。各个集市之间,数据会有重复。

数据治理中心 DataArtsStudio

数据治理中心DataArts Studio是针对企业数字化运营诉求提供的数据全生命周期管理、具有智能数据管理能力的一站式治理运营平台,包含数据集成、数据架构、数据开发、数据质量监控、数据目录管理、数据服务等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型。

图5 数据治理方案图
  • 数据集成

    支持批量数据迁移、实时数据集成和数据库实时同步,支持20+异构数据源,全向导式配置和管理,支持单表、整库、增量、周期性数据集成。

  • 数据架构

    作为数据治理的一个核心模块,承担数据治理过程中的数据加工并业务化的功能,提供智能数据规划、自定义主题数据模型、统一数据标准、可视化数据建模、标注数据标签等功能,有利于改善数据质量,有效支撑经营决策。

  • 数据开发

    大数据开发环境,降低用户使用大数据的门槛,帮助用户快速构建大数据处理中心。支持数据建模、数据集成、脚本开发、工作流编排等操作,轻松完成整个数据的处理分析流程。

  • 数据质量

    数据全生命周期管控,数据处理全流程质量监控,异常事件实时通知。

  • 数据目录

    提供企业级的元数据管理,厘清信息资产。通过数据地图,实现数据目录的数据血缘和数据全景可视,提供数据智能搜索和运营监控。

  • 数据服务

    标准化的数据服务平台,提供一站式数据服务开发、测试部署能力,实现数据服务敏捷响应,降低数据获取难度,提升数据消费体验和效率,最终实现数据目录的变现。

  • 数据安全

    数据安全为数据治理中心提供数据生命周期内统一的数据使用保护能力。通过敏感数据识别、分级分类、隐私保护、资源权限控制、 数据加密 传输、加密存储、数据风险识别以及合规审计等措施,帮助用户建立安全预警机制,增强整体安全防护能力,让数据可用不可得和安全合规。

  • 智能数据湖

    DataArts Studio集成了丰富的数据引擎,支持对接所有华为云的数据湖与数据库云服务,例如 MapReduce服务 MRS、数据仓库服务DWS等,也支持对接企业传统数据仓库,例如Oracle。

数据湖平台常见问题

更多常见问题 >>
  • 智能数据湖运营平台(DAYU)是数据全生命周期一站式开发运营平台,提供数据集成、数据开发、数据治理、数据服务等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业客户快速构建数据运营能力。

  • 智能数据湖运营平台(DAYU)是为了应对上述挑战、针对企业数字化运营诉求提供的数据全生命周期管理、具有智能数据管理能力的一站式治理运营平台,包含数据集成、规范设计、数据开发、数据质量监控、数据资产管理、数据服务等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业快速构建从数据接入到数据分析的端到端智能数据系统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型。

  • 智能数据湖运营平台功能:规范设计、数据集成、数据开发、数据质量、数据资产管理、数据服务、数据安全

  • 智能数据湖运营平台(DAYU)是数据全生命周期一站式开发运营平台,提供数据集成、数据开发、数据治理、数据服务、数据可视化等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座,帮助企业客户快速构建数据运营能力。

  • DAYU智能数据湖运营平台采用基础包+增量包的计费模式。基础包按包年、包月计费;增量包分为批量数据迁移和实时数据接入两类,均采用按需和套餐包的计费模式。

  • 智能数据湖运营平台应用场景:一站式的数据运营治理平台、云上数据平台快速搭建、基于行业领域知识库快速构建数据中台