-
准备数据 - 可信智能计算服务 TICS
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,例如双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集。
-
准备数据 - 可信智能计算服务 TICS
准备数据 首先,企业A和大数据厂商B需要商议确定要提供的数据范围及对应的元数据信息,双方初始决定使用最近三个月的已有用户转化数据作为联邦训练的训练集和评估集,之后使用每周产生的新数据作为联邦预测的预测集。
-
准备数据 - 可信智能计算服务 TICS
准备数据 企业A和大数据厂商B需要按照训练模型使用的特征,提供用于预测的数据集,要求预测的数据集特征必须包含训练时使用的特征。
-
发布数据 - 可信智能计算服务 TICS
图2 前往计算节点 在“数据管理”页签找到待发布的数据名称,单击“发布”,弹出发布数据集选择框。 图3 发布数据 在发布数据集选择框中选择需要发布的合作方,单击“发布”,数据就会被同步到对应合作方作业管理的数据集中。数据集创建者默认拥有数据集权限。
-
创建数据 - 可信智能计算服务 TICS
创建数据 数据拥有方公司A创建和发布数据集。可供选择有两种数据资产类型:结构化数据集、非结构化数据集。创建数据集后,发布数据集,此时对空间内的所有代理可见。 父主题: 可信数据交换场景
-
数据准备 - 可信智能计算服务 TICS
数据准备 数据准备 以下数据和表结构是根据场景进行模拟的数据,并非真实数据。 以下数据需要提前存导入到MySQL\Hive\Oracle等用户所属数据源中,TICS本身不会持有这些数据,这些数据会通过用户购买的计算节点进行加密计算,保障数据安全。
-
选择数据 - 可信智能计算服务 TICS
选择数据 首先企业A要在“数据选择”页面选择双方发布的数据集,已选择的数据集会出现在右侧,所选的数据集会用于后续的步骤。 父主题: 使用TICS可信联邦学习进行联邦建模
-
准备数据 - 可信智能计算服务 TICS
确保数据库端口对计算节点开放。 (可选)准备DWS数据源 如果您的数据需通过DWS发布到TICS,则您需要提前准备DWS数据源。 JDBC数据源支持DWS(GaussDB SQL)的连接,目前仅支持默认数据库为postgres的DWS数据源。
-
数据准备 - 可信智能计算服务 TICS
图3 配置数据集参数 发布数据集。 图4 发布数据集 数据集发布的过程并不会直接从数据源中导出用户数据,仅从数据源处获取了数据集相关的元数据信息,用于任务的解析、验证等。 父主题: 测试步骤
-
数据优化 - 可信智能计算服务 TICS
数据优化 根据统计结果,双方可能会发现存在以下两个问题: 碰撞后的数据总数比较小。 碰撞后的数据分布不太均衡,负样本的比例过高。 这种情况下双方可以重复2-5的步骤更新自己提供的数据,多次执行样本分布统计直至达到比较满意的碰撞结果和分布结果。
-
准备数据 - 可信智能计算服务 TICS
准备数据 企业A的实时业务不需要准备数据,在发起查询时通过参数传递需要查询的用户id。
-
准备数据 - 可信智能计算服务 TICS
准备数据 A方提供了待查询的用户ID数据,样例如下: blacklist_query.csv id 1914fd1aef9346e7a1b0a63c95aa918e 6b86b273ff34fce19d6b804eff5a3f57 66985617b4f74d14b4eceeaa25d61f5e
-
管理数据 - 可信智能计算服务 TICS
管理数据 数据管理概述 创建连接器 创建数据集 发布数据 数据预处理 父主题: 计算节点管理
-
发布数据集 - 可信智能计算服务 TICS
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。
-
发布数据集 - 可信智能计算服务 TICS
发布数据集 企业A和大数据厂商B分别将自己的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建各自的数据集。 企业A的数据集如下: 大数据厂商B的数据集如下: 创建数据集后单击“发布”按钮即可将数据的元数据信息发布到tics空间侧,供其他合作方参考。
-
获取数据详情 - 可信智能计算服务 TICS
_$ 长度0-128 最小长度:0 最大长度:128 data_type String 连接器数据类型 1.RDS--云数据库类型 2.MYSQL--MySQL类型 3.DWS--高斯数据库类型 4.MRS--MapReduce数据类型 5.ORACLE--ORACLE数据类型 6
-
数据安全 - 可信智能计算服务 TICS
数据安全 安全化数据库安装与配置 规则1:数据库安装使用单独的账号,安装账号不能用作业务使用,业务账号需单独申请。 规则2:数据库只安装必需的组件,并采用独立的分区安装,最小化安装目录权限。 最小化数据库账号权限 规则1:对数据库账号权限与功能分离,最小化各种账号的权限。
-
发布数据集 - 可信智能计算服务 TICS
发布数据集 企业A将自己的需要预测的csv数据文件上传到自己的计算节点上,通过“数据管理”模块创建用于预测的数据集。 企业A预测数据集如下: 大数据厂商B仍使用训练时的提供的全量数据作为预测数据集,没有发布新的数据集。 父主题: 使用TICS联邦预测进行新数据离线预测
-
数据预处理 - 可信智能计算服务 TICS
数据预处理 创建数据预处理作业 开发数据预处理作业 父主题: 管理数据
-
数据类型 - 可信智能计算服务 TICS
数据类型 数据类型概览 隐式转换 显式转换 父主题: SQL语法