DLI跨源查询
数据湖探索(Data Lake Insight,简称DLI)是一款大数据分析工具,提供标准SQL,完全兼容Spark接口,支持自动弹性扩展,云上多数据源联邦分析,提供资源和数据细粒度管控的多租户能力,广泛应用于IoT,互联网,游戏等行业统计报表,行为日志分析,历史数据查询审计等场景
数据自由流动 支持多种数据源 支持多种数据源 DIS支持从用户应用系统、kafka系统、Flume系统做实时数据采集 DIS支持从用户应用系统、kafka系统、Flume系统做实时数据采集 多种数据接入方式 多种数据接入方式 提供RestAPI、SDK、Agent等多种数据接入方
ebSQL界面工具DAS、Data Studio。 04 导入数据 支持多种数据源和导入工具完成数据入库:支持OBS外表、GDS外表导入;支持CDM、DRS、DLI实时入库;支持访问远端MRS数据源;支持元数据导入和导出;支持DSC进行SQL脚本迁移等等。 05 数据分析 导入数
实时报表查询与分析 实时报表查询与分析 通过实时、批量接入把源业务系统数据采集到CloudTable Doris中,下游业务应用对数据进行多维度、多模式分析,并可以在亚秒级内响应,快速得出报表结果 优势 实时数据写入 支持采集多种数据源,百万行/s 实时数据写入 亚秒级查询响应 使
65、华为 TE20 Cloud 、MAXHUB 华为云会议专款 SC系列65/75寸 查看推荐配置 中型会议室为企业提供专业的现代化会议空间,拥有高质量的音视频会议效果,多人实时互动批注,满足跨企业、跨地域、跨终端的智能沟通,提供全场景多屏互动协作体验 使用场景: 部门培训、汇报性高层会议
质量六性100%覆盖,支持从数据标准生成质量规则,支持单列、跨列、跨行和跨表的分析 异常数据导出 为推动PDCA持续清洁,数据质量支持异常数据导出,便于反馈到源端进行纠正 跨源一致性对账 针对不同IT系统的数据,基于跨源引擎逐行比对数据一致性,支持统计结果对账分析 了解详情 查看 全域数据资产 DataArts
配,外接触控屏体验书写协作的畅快 联接时空 改变未来 CloudLink Board CloudLink Bar CloudLink Box CloudLink Board CloudLink Bar CloudLink Box 购买咨询热线: 4000-955-988或950808按1转1
寻址发起跨链访问。 数据安全和隐私保护 基于TEE的证明生成流程,保证跨链交互数据安全可靠,跨链中继侧不记录对应链的数据信息,支持跨链组件点对点数据交互,防止隐私泄露,有效保护跨链数据隐私。 基于TEE的证明生成流程,保证跨链交互数据安全可靠,跨链中继侧不记录对应链的数据信息,支
Data Wrapper,简称FDW),不同的集群之间可以互相访问数据,例如在GaussDB集群A中访问GaussDB集群B中的数据。结合GDS,可以实现跨集群数据一键式高速迁移。如图3-2所示,通过GDS在两个集群之间形成高效的实时数据中转通路,将数据从源集群导出,不经落盘直接导入目标集群。
MR7A 65/86寸 购买咨询 中型会议室 中型会议室为企业提供专业的现代化会议空间,拥有高质量的音视频会议效果,多人实时互动批注,满足跨企业、跨地域、跨终端的智能沟通,提供全场景多屏互动协作体验 使用场景 部门培训 汇报性高层会议 会议室容量:8-15人 推荐配套终端 方案1:华为办公宝
51CloudLink(弹性混合云专线),基于锐速全球骨干传输网,连接企业与大规模公有云,为客户提供的高速专线服务。1、用于搭建企业自有计算环境到公有云用户计算环境的高速、稳定、安全的专属通道。用户可使用专线接入服务将本地数据中心的计算机与云上的云服务器或托管主机实现私网相连,充
多频道,本接口仅限于内部数据分析统计、机器学习,不得用于终端展示。版权问题需要您联系新闻发布者获取。为保证数据的及时性,每5-10分钟刷新一次【已获“国家二级等保”,安全更有保障】 国际实事,体育赛事,热门头条
支持500多家银行卡查询。通过银行卡号查询该银行卡详细信息,包括所属银行、归属地、卡类型、银行卡产品名称、银行电话、银行网站、银联luhn、Bin码等信息【已获“国家二级等保”,安全更有保障】覆盖面广,支持500多家银行卡查询,数据丰富,返回开户行所在地、卡种、产品名称、客服电话、银行名称等信息
查询历史数据的分析统计。本接口数据仅用于学习分析,不得用于对外展示!根据股票代码、日期获取股票历史数据及相关分析,返回日期、开盘价、收盘价、最高价、最低价、成交量、成交额、换手率、涨跌幅等,可绘制相应日线图及走势(已获“国家二级等保”)股票历史行情数据,股票相关分析
【whois查询-whois域名查询】通过网站域名或地址查询域名相关信息,返回包含域名状态、WHOIS服务地址、城市、省份、区号、国家、邮箱、名称、更新时间、域名名称服务器、域名注册机构、有效时间、创建时间等信息。—— 我们只做精品!一、产品介绍 :【whois查询-whois域
【节假日查询 黄历查询 吉日查询 】接口可查询传统日历、节假日、运势、宜忌等信息,广泛用于日程安排,出行指南,风水评估等。 —— 我们只做精品!一、产品介绍 :【节假日查询 黄历查询 吉日查询 】接口可查询传统日历、节假日、运势、宜忌等信息,广泛用于日程安排,出行指南,风水评估等。
【今日油价 油价查询】实时查询今日油价,覆盖全国31个省,支持国五标准,包含92号汽油、95号汽油、98号汽油、0号柴油价格,每日更新。—— 我们只做精品!一、产品介绍 :【今日油价 油价查询】实时查询今日油价,覆盖全国31个省,支持国五标准,包含92号汽油、95号汽油、98号汽油、0号柴油价格,每日更新。——
司代码mobile:收件人/寄件人手机号后4位(顺丰和丰网需要,其他快递不需要)tel:快递公司电话letter:快递名称首字母logo:快递公司logourl:快递网址 产品介绍:【快递查询-快递单号查询-快递物流查询-快递物流单号查询-物流快递查询-快递物流信息查询-快递单号
平台是赋能集团/企业与外部企业数据跨节点计算及价值挖掘的轻量级隐私计算产品。提供包括联邦学习、多方安全计算等核心隐私计算算法及安全的隐私安全计算环境,并提供全流程的节点发现、数据发现、授权管理、计算管理、任务管理,实现多方数据安全流通。数据应用:我们不限制买卖方的数据条件,无论是否有标签都可以成为发起方。
PostGre,SMN。 帮助文档 跨源连接的概述 跨源连接:DLI增强型跨源连接底层采用对等连接,直接打通DLI队列与目的数据源的VPC网络,通过点对点的方式实现数据互通,能够提供比经典型跨源更加灵活的使用场景与更加强劲的性能。 跨源分析:增强型跨源支持DLI服务已实现的所有跨源业务,并且通过可以
ark队列上进行数据分析。 支持多数据源分析: Spark跨源连接:可通过DLI访问CloudTable,DWS,RDS和CSS等数据源。 Flink跨源支持与多种云服务连通,形成丰富的流生态圈。数据湖探索的流生态分为云服务生态和开源生态: 开源生态:通过增强型跨源连接建立与其他
OpenTSDB表相关语法跨、源连接DWS表相关语法跨、源连接RDS表相关语法、跨源连接CSS表相关语法跨、源连接DCS表相关语法跨、连接DDS表相关语法、视图相关语法、查看计划相关语法数、据权限相关语法自、定义函数相关语法数、据多版本相关语法等。 精选文章推荐 Spark SQ
弹性资源池应用场景 如何创建弹性资源池并运行作业 通过从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程的介绍,帮助您更好、更方便的使用弹性资源池。 通过从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程的介绍,帮助您更好、更方便的使用弹性资源池。
进阶的语法:创建源表、创建结果表、创建维表、Format等,创建源表支持主流的各种源表,结果表也支持主流的结果表,创建维表同样也支持主流的各种维表。 Flink OpenSource SQL作业的开发指南 从Kafka读取数据写入到DWS 汽车驾驶的实时数据信息为数据源发送到Kafk
CDM提供同构/异构数据源之间批量数据迁移的功能,帮助您实现从多种类型的数据源迁移数据到GaussDB(DWS)。CDM在迁移数据到GaussDB(DWS)时,采用的是Copy方式和GDS并行导入方式。 数据源丰富,操作简单。 使用DSC工具迁移SQL脚本 数据库、NoSQL、文件系统、大数据平台
种角色。 数据集成集群:一个数据集成集群运行在一个弹性云服务器之上,用户可以在集群中创建数据迁移作业,在云上和云下的同构/异构数据源之间批量迁移数据。 数据源:即数据的来源,本质是讲存储或处理数据的媒介,比如:关系型数据库、数据仓库、数据湖等。每一种数据源不同,其数据的存储、传输
在“订阅名称”中输入“OfficialEvent”,单击“确定”,回到订阅详情页。 6 单击“事件源”,配置事件源。 选择提供方:选择“华为云” 事件源:选择“对象存储服务” 过滤规则:保存默认 图2 设置事件源参数 7 单击“事件目标”,配置事件目标。 选择提供方:选择“华为云” 事件目标:选
程,保证跨链交互数据安全可靠,跨链中继侧不记录对应链的数据信息,支持跨链组件点对点数据交互,防止隐私泄露,有效保护跨链数据隐私。 可信跨链服务使用文档 可信跨链服务开发 入门指引 立即查看 可信跨链服务开发 注册区块链 立即查看 可信跨链服务开发 购买跨链通道 立即查看 可信跨链服务开发
DLI跨源查询
操作场景
DLI 可以查询存储在RDS 数据库 中的数据,本节操作介绍使用DLI提交SQL作业查询RDS MySQL数据的操作步骤。
本例创建RDS实例并新建数据库和表,创建DLI弹性资源池队列,通过增强型跨源连接打通DLI弹性资源池和RDS实例的网络,并提交SQL作业跨源访问RDS的表数据。
操作流程
使用DLI提交SQL作业查询RDS MySQL数据操作流程如表1所示。
开始进行如下操作前,请务必参考准备工作完成必要操作。
操作步骤 |
说明 |
---|---|
步骤1:创建RDS MySQ L实例 |
样例场景需要创建RDS MySQL实例。 |
步骤2:创建RDS数据库表 |
登录RDS实例创建数据库和表。 |
步骤3:创建弹性资源池并添加队列 |
创建提交作业所需的计算资源。 |
步骤4:创建增强型跨源连接 |
通过增强型跨源连接建立DLI弹性资源池与RDS实例的网络连通。 |
步骤5:创建跨源认证 |
使用跨源认证保存DLI读写RDS数据的访问凭证。 |
步骤6:提交SQL作业 |
使用标准SQL语句进行数据的查询和分析。 |
准备工作
- 已注册华为账号并开通华为云,且在使用DLI前检查账号状态,账号不能处于欠费或冻结状态。
- 配置DLI委托访问授权。
- 配置DLI作业桶。
请务必在使用DLI提交作业前配置DLI作业桶,该桶用于存储DLI作业运行过程中产生的临时数据,例如:作业日志、作业结果。
参考配置DLI作业桶在DLI管理控制台的“全局配置 > 工程配置”页面配置DLI作业桶。
步骤1:创建RDS MySQL实例
本样例中,假设作业名称为“JobSample”,采用RDS服务作为数据源,创建RDS MySQL实例。
具体操作请参见购买 RDS for MySQL 实例。
- 登录RDS管理控制台。
- 在管理控制台左上角选择区域和项目。
- 在“实例管理”页面,单击“购买数据库实例”。
- 在购买数据库实例页面,选择计费模式,填写并选择实例相关信息后,单击“立即购买”。
更多RDS实例的参数配置信息请参考购买RDS实例。
表2 RDS MySQL实例参数配置信息 参数名称
参数说明
取值样例
计费模式
选择RDS实例的计费模式。
按需计费
区域
资源所在的区域。
华东-上海二
实例名称
实例名称。
rds-demo
数据库引擎
MySQL
MySQL
数据库版本
选用RDS for MySQL数据库时,请根据实际业务需求选择合适的数据库引擎版本。建议您选择当前可用的最高版本数据库,因其性能更稳定,安全性更高,使用更可靠。
8.0
实例类型
选择实例的主备类型。
单机
存储类型
实例的存储类型决定实例的读写速度。最大吞吐量越高,读写速度越快。
SSD云盘
可用区
对于单机实例,仅需选择单个可用区。
-
时区
由于世界各国家与地区经度不同,地方时也有所不同,因此会划分为不同的时区。时区可在创建实例时选择,后期可修改。
默认
性能规格
实例的CPU和内存。不同性能规格对应不同连接数和最大IOPS。
2vCPUs | 4GB
存储空间
如果存储类型为SSD云盘或极速型SSD,可设置存储空间自动扩容,当存储空间可用率过小时,会自动扩容存储空间。
40GB
磁盘加密
选择是否开启磁盘加密功能。
不加密
选择已有的虚拟 私有云 。
如需重新创建VPC和子网,请参考创建虚拟私有云和子网。
说明:跨源场景数据源网段和弹性资源池的网段不能重合。
-
数据库端口
默认使用3306端口。
3306
安全组
安全组限制实例的安全访问规则,加强 云数据库 RDS服务与其他服务间的安全访问。
数据源的安全组需放通DLI弹性资源池的网段。
-
设置密码
设置实例的登录密码。
-
管理员账号
root
root
管理员密码
设置管理员密码。
-
参数模板
数据库参数模板就像是数据库引擎配置值的容器,参数模板中的参数可应用于一个或多个相同类型的数据库实例。
系统默认模板:Default-MySQL-5.7
表名大小写
配置表名不区分大小写。
不区分大小写
企业项目
对于已成功关联企业项目的用户,仅需在“企业项目”下拉框中选择目标项目。
default
购买数量
实例购买数量
1
只读实例
为了实现读取能力的弹性扩展,分担数据库压力,您可以在某个区域中创建一个或多个只读实例。
暂不购买
- 单击“立即购买”,进入规格确认页面。
- 单击“提交”,完成购买RDS MySQL实例。
- 实例创建成功后,用户可以在“实例管理”页面对其进行查看和管理。
步骤2:创建RDS数据库表
- 登录RDS管理控制台。
- 在管理控制台左上角选择区域和项目。
- 在“实例管理页面”,找到您已经创建的RDS实例,记录并保存RDS实例的内网地址。
图2 内网地址
- 单击所创建RDS实例的“登录”,跳转至“ 数据管理服务 - DAS ”。输入相关账户信息,单击“测试连接”。显示连接成功后,单击“登录”,进入“实例登录”页面。
图3 登录RDS图4 实例登录
- 登录RDS实例后,单击“新建数据库”,创建名称为“dli_demo”的数据库。
- 单击“SQL查询”,执行如下SQL创建表。
CREATE TABLE `dli_demo`.`tabletest` ( `id` VARCHAR(32) NOT NULL, `name` VARCHAR(32) NOT NULL, PRIMARY KEY (`id`) ) ENGINE = InnoDB DEFAULT CHARACTER SET = utf8mb4;
步骤3:创建弹性资源池并添加队列
执行跨源场景的SQL作业,不能使用系统已有的default队列,需要您创建SQL队列,本例创建弹性资源池“dli_resource_pool”、队列“dli_queue_01”。
- 登录DLI管理控制台。
- 在左侧导航栏单击“资源管理 > 弹性资源池”,可进入弹性资源池管理页面。
- 在弹性资源池管理界面,单击界面右上角的“购买弹性资源池”。
- 在“购买弹性资源池”界面,填写具体的弹性资源池参数。
- 参数填写完成后,单击“立即购买”,在界面上确认当前配置是否正确。
- 单击“提交”完成弹性资源池的创建。
- 在弹性资源池的列表页,选择要操作的弹性资源池,单击操作列的“添加队列”。
- 配置队列的基础配置,具体参数信息如下。
表4 弹性资源池添加队列基础配置 参数名称
参数说明
配置样例
名称
弹性资源池添加的队列名称。
dli_queue_01
类型
选择创建的队列类型。
- 执行SQL作业请选择SQL队列。
- 执行Flink或Spark作业请选择通用队列。
_
执行引擎
SQL队列可以选择队列引擎为Spark或者HetuEngine。
_
企业项目
选择对应的企业项目。
default
- 单击“下一步”,配置队列的扩缩容策略。
单击“新增”,可以添加不同优先级、时间段、“最小CU”和“最大CU”扩缩容策略。
本例配置的扩缩容策略如图5所示。表5 扩缩容策略参数说明 参数名称
参数说明
配置样例
优先级
当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略,默认优先级为1。
1
时间段
首条扩缩容策略是默认策略,不能删除和修改时间段配置。
即设置00-24点的扩缩容策略。
00-24
最小CU
设置扩缩容策略支持的最小CU数。
16
最大CU
当前扩缩容策略支持的最大CU数。
64
- 单击“确定”完成添加队列配置。
步骤4:创建增强型跨源连接
- 在RDS实例所在的安全组上放通DLI队列网段
- 创建RDS与DLI的增强型跨源连接。
创建增强型跨源连接具体操作请参考创建增强型跨源连接。
绑定跨源的弹性资源池的网段和数据源网段不能重合。
- 在DLI管理控制台左侧导航栏中,选择“跨源管理”。
- 选择“增强型跨源”页签,单击左上角的“创建”按钮。配置参数:
- 连接名称:dlirds
- 弹性资源池:选择步骤3:创建弹性资源池并添加队列中创建的弹性资源池。
- 虚拟私有云:选择MySQL 实例所在的VPC,即步骤2:创建RDS数据库表中选择的VPC。
- 子网:选择MySQL 实例所在的子网,即步骤2:创建RDS数据库表中选择的子网。
在RDS控制台“实例管理”页面,单击对应实例名称,查看“连接信息”>“子网”,也可获取对应信息。
- 单击“确定”,创建增强型跨源连接。
- 在“增强型跨源”页签,单击创建的连接名称:dlirds,查看对等连接ID及连接状态,连接状态为“已激活”表示连接成功。
- 测试队列与RDS实例连通性。
- 单击“资源管理 > 队列管理”,选择步骤3:创建弹性资源池并添加队列添加的队列,单击“操作”列中的“更多 > 测试地址连通性”。
图6 检测地址连通性
- 输入步骤2:创建RDS数据库表中记录的RDS MySQL实例内网地址,进行网络连通性测试。
在RDS控制台“实例管理”页面,单击对应实例名称,查看“连接信息”>“内网地址”,即可获取对应信息。
- 测试结果显示可达,则DLI队列与MySQL实例的网络已经联通。
图7 测试结果
- 如果测试结果不可达,请参考创建跨源成功但测试网络连通性失败怎么办?进行排查。
排查完成后,重新进行网络连通性测试。
- 测试结果显示可达,则DLI队列与MySQL实例的网络已经联通。
- 单击“资源管理 > 队列管理”,选择步骤3:创建弹性资源池并添加队列添加的队列,单击“操作”列中的“更多 > 测试地址连通性”。
步骤5:创建跨源认证
跨源分析场景中,如果在作业中直接配置认证信息会触发密码泄露的风险,因此推荐您使用DLI提供的跨源认证方式来存储数据源的认证信息。
RDS数据源在Spark SQL作业场景可以创建Password类型的跨源认证。
- 登录DLI管理控制台。
- 选择“跨源管理 > 跨源认证”。
- 单击“创建”。
填写认证信息,详细参数说明请参考表6。
表6 跨源认证参数说明 参数
参数说明
类型
选择Password。
认证信息名称
所创建的跨源认证信息名称。
- 名称只能包含数字、英文字母和下划线,但不能是纯数字,且不能以下划线开头。
- 输入长度不能超过128个字符。
用户名称
访问RDS实例用户名。
用户密码
RDS实例登录密码。
图8 创建认证信息-Password
步骤6:提交SQL作业
本节示例以SQL作业为例说明如何跨源访问RDS表。
- 在DLI管理控制台的左侧导航栏中,单击“SQL编辑器”,进入SQL作业编辑器页面。
- 在“SQL编辑器”页面右侧的编辑窗口中,输入如下SQL语句创建数据库db1,单击“执行”。
create database db1;
- 在编辑窗口中,选择队列“dli_queue_01”和数据库“db1”。输入如下SQL语句创建表,向RDS表插入数据,以及查询数据,单击“执行”。
根据界面显示的执行结果查询RDS表数据信息,整个操作完成。
CREATE TABLE IF NOT EXISTS rds_test USING JDBC OPTIONS ( 'url' = 'jdbc:mysql://{{ip}}:{{port}}', //RDS内网地址及端口 'driver' = 'com.mysql.jdbc.Driver', 'dbtable' = 'dli_demo.tabletest', //在RDS创建的库名及表名 'encryption' = 'true', 'passwdauth'="xxxxx" // DLI侧创建的Password类型的跨源认证名称。使用跨源认证则无需在作业中配置账号和密码。 ) insert into rds_test VALUES ('123','abc'); SELECT * from rds_test;
后续指引
完成增强型跨源连接访问RDS快速入门操作后,如果您想了解更多关于跨源连接的相关操作,建议您参考以下指引阅读。
分类 |
文档 |
说明 |
---|---|---|
界面操作 |
提供跨源连接、分析相关的功能介绍和操作指导。 |
|
开发指南 |
提供跨源访问 CSS 、DWS、HBase、OpenTSDB、RDS、Redis、Mongo等样例代码和开发指导。 |
|
提供增强型跨源相关API接口指导。 |
DLI跨源查询常见问题
更多常见问题 >>-
DLI支持原生Spark的DataSource能力,并在其基础上进行了扩展,能够通过SQL语句、Spark作业或者Flink作业进行跨源连接其他数据存储服务并导入、查询、分析处理其中的数据。
-
数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理等,挖掘和探索数据价值
-
DLI在开源Spark基础上进行了大量的性能优化与服务化改造,不仅兼容Apache Spark生态和接口,性能较开源提升了2.5倍,在小时级即可实现EB级数据查询分析。
-
数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理等,挖掘和探索数据价值。
-
数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark和Apache Flink生态, 实现批流一体的Serverless大数据计算分析服务。DLI支持多模引擎,企业仅需使用SQL或程序就可轻松完成异构数据源的批处理、流处理等,挖掘和探索数据价值
-
DLI表表示数据存储在数据湖探索(DLI)内部的表。查询性能更好,适用于对时延敏感类的业务,如交互类的查询等。
更多相关专题
增值电信业务经营许可证:B1.B2-20200593 | 域名注册服务机构许可:黔D3-20230001 | 代理域名注册服务机构:新网、西数