-
发现敏感数据 - 数据治理中心 DataArts Studio
*数据库 呈现待扫描的数据库和数据表。 单击数据库后的“设置”,设置待扫描的数据库范围。 单击数据表后的“设置”,设置待扫描的数据表范围。 单击“清除”,可对已选择的数据库和数据表进行修改。 *数据表 *计算队列 数据源类型为DLI时,需要选择通用队列。
-
获取质量报告子规则字段评分 - 数据治理中心 DataArts Studio
响应示例 状态码: 200 Success 示例 1 1 示例 2 [ "字段名称", "规则描述", "分数", "字段权重", "空值行数", "总行数", "空值率", "告警状态" ] 示例 3 [ [ "postgres.public.test.name", "数据表空值扫描
-
获取质量报告规则评分 - 数据治理中心 DataArts Studio
score" : 0.0, "rule_id" : "1044554894322835457", "instance_id" : "1047298515736334336", "scoring_weight" : 5, "rule_type_name" : "数据表空值扫描
-
如何查看表行数和库大小 - 数据治理中心 DataArts Studio
计算范围:选择“全表扫描”。 告警条件:非必填,保持默认即可。 图4 子作业规则配置 单击“下一步”,进入“告警配置”页面。 告警条件选择“子规则告警条件”,表达式可以自定义,此处可配置为“${1}<=0”,表示总行数小于等于0时触发告警。
-
数据安全治理维度 - 数据治理中心 DataArts Studio
图3 数据安全技术体系 其中基础通用技术工具为数据全生命周期的安全提供支撑: 数据分类分级相关工具平台主要实现数据资产扫描梳理、数据分类分级打标和数据分类分级管理等功能。
-
配置DWS目的端参数 - 数据治理中心 DataArts Studio
列模式:表的数据将以列式存储,适用于统计分析类查询(group、join多的场景),或者即席查询(查询条件不确定,行模式表扫描难以使用索引)的场景。
-
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio
对庞大的数据集查询需要耗费大量的时间去处理,在许多场景下,可以通过建立Hive分区方法减少每一次扫描的总数据量,这种做法可以显著地改善性能。 Hive的分区使用HDFS的子目录功能实现,每一个子目录包含了分区对应的列名和每一列的值。
-
新建规则模板 - 数据治理中心 DataArts Studio
表1 系统内置的规则模板一览表 规则类型 维度 模板名称 说明 库级 完整性 数据库空值扫描 计算数据库每个表中每个字段的空值字段行数,结果以字段为维度呈现。 表级 准确性 表行数 计算数据表的总行数。