数据治理中心 DATAARTS STUDIO-配置HDFS连接:FusionInsight HDFS

时间:2024-04-28 17:34:13

FusionInsight HDFS

连接FusionInsight HD上的HDFS数据源时,相关参数如表2所示。

表2 FusionInsight HDFS连接参数

参数名

说明

取值样例

名称

连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。

FI_hdfs_link

Manager IP

FusionInsight Manager平台的地址。

127.0.0.1

Manager端口

FusionInsight Manager平台的端口。

28443

CAS Server端口

与FusionInsight对接的CAS Server的端口。

20009

用户名

登录FusionInsight Manager平台的用户名。

从HDFS导出目录时,如果需要创建快照,这里配置的用户需要HDFS系统的管理员权限。

cdm

密码

FusionInsight Manager平台的密码。

-

认证类型

访问集群的认证类型:
  • SIMPLE:非安全模式选择Simple鉴权。
  • KERBEROS:安全模式选择Kerberos鉴权。

KERBEROS

运行模式

选择HDFS连接的运行模式:
  • EMBEDDED:连接实例与CDM运行在一起,该模式性能较好。
  • STANDALONE:连接实例运行在独立进程。如果CDM需要对接多个Hadoop数据源(MRS、Hadoop或CloudTable),并且既有KERBEROS认证模式又有SIMPLE认证模式,只能使用STANDALONE模式或者配置不同的Agent。

    说明:STANDALONE模式主要是用来解决版本冲突问题的运行模式。当同一种数据连接的源端或者目的端连接器的版本不一致时,存在jar包冲突的情况,这时需要将源端或目的端放在STANDALONE进程里,防止冲突导致迁移失败。

  • Agent:连接实例运行在Agent上。

STANDALONE

Agent

单击“选择”,选择连接Agent中已创建的Agent。运行模式选择Agent时显示此参数。

-

是否使用集群配置

您可以通过使用集群配置,简化Hadoop连接参数配置。

集群配置名

仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。

集群配置的创建方法请参见管理集群配置

hdfs_01

单击“显示高级属性”,然后单击“添加”,您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性,可单击属性后的“删除”按钮进行删除。

support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_0040.html