华为云用户手册

  • 资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,实际以收费账单为准,具体请参考华为云官网价格: 表1 资源和成本规划 华为云服务 配置示例 每月花费 录音文件识别服务 区域:华北-北京四 计费模式:包年包月套餐包 计费价格:15元/10h 15元 对象存储服务 区域:华北-北京四 数据存储(多AZ存储):0.1390元/GB/月 请求费用:0.0100元/万次 预计每月新增1GB数据量,花费0.1390元。 该方案存储费用消耗较低,详细请参考每月账单。 函数工作流 区域:华北-北京四 请求次数0-100万次/月:免费 计量时间:0-400,000 GB/秒:免费 节点执行次数:0-5000次:免费 0 事件网格 EG 区域:华北-北京四 华为云服务事件源自身产生发布的事件(任意事件状态变化 )免费,事件消费免费。 免费 合计 15.14元
  • 快速部署 本章节主要帮助用户快速部署“ 语音识别 ”解决方案。 表1 参数填写说明 参数名称 类型 是否必填 参数解释 默认值 function_name String 是 函数名称,用于定义创建函数及其他资源前缀,不支持重名。取值范围:2-60个字符,可包含字母、数字、下划线和中划线,以大/小写字母开头,以字母或数字结尾。 speech-recognition-demo speech_bucket_name String 是 OBS桶名称,全局唯一,用于上传wav语音文件。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.)。 channel_id String 必填 事件网格 EG中云服务事件通道ID,默认default通道ID,用于接收云服务事件源产生的事件。获取请参考取事件网格 EG云服务事件通道ID。 result_bucket_name String 是 OBS桶名称,全局唯一,用于存放语音识别结果。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.)。 登录华为云解决方案实践,选择“语音识别解决方案”,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 选择模板 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,自定义填写堆栈名称,根据填写表1配置参数信息,单击“下一步”。 图3 配置参数 在资源栈设置页面中,权限委托选择“rf_admin_trust”,单击“下一步”。 图4 资源栈设置 在配置确认页面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。 图6 创建执行计划 等待执行计划状态为“创建成功,待部署”后,单击“部署”,并且在弹出的执行计划确认框中单击“执行”。 图7 执行计划 图8 执行计划确认 待“事件”中出现“Apply required resource success”,表示该解决方案已经部署完成。 图9 部署完成 父主题: 实施步骤
  • 开始使用 登录华为云对象存储服务控制台,查看自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储语音文件的桶“speech-recognition-input”(实际桶名称以部署指定参数为准),上传wav语音文件。 图2 上传语音文件 选择用于存放结果的“speech-recognition-output”桶(实际桶名称以部署指定参数为准),即可自动获取该语音文件的识别结果,以语音文件名称为前缀的Json文件存储。 图3 获取识别结果文件 父主题: 实施步骤
  • 概念说明 GES基于属性图模型导入图数据,因此,您需要了解属性图(Property graph)的基本概念。 一个属性图是由点、边、标签(Label)和属性(Property)组成的有向图。 点又称作节点(Node),边又称作关系(Relationship),点和关系是最重要的实体。 元数据是用于描述点或边的属性信息,元数据由多个标签组成,每个标签由一个或多个属性组成。 为点或边设置标签,那么拥有相同标签的点属于一个分组,是一个集合。 如下示例中,此图数据由3个点和3条边组成,Vivian、Eric和Lethal Weapon表示点,(Vivian,Eric)、(Vivian,Lethal Weapon)和(Eric、Lethal Weapon)表示边,user和movie表示点的类型(标签),rate和friends表示关系类型(标签)。 图1 图数据格式的示例
  • 边文件 边文件罗列了各个边的数据信息,一行为一条边的数据。GES中图规格是以边的数量进行定义的,如一百万边。格式如下所示,id 1、id 2是一条边的两个端点的id。 id 1, id 2, label, property 1, property 2, … 示例: Eric,Lethal Weapon,rate,4,2000-11-21 15:33:18 Vivian,Eric,friends 注意:在持久化版中想要把两个端点和标签都相同的边存入进去,则需要sortKey列,放在属性后面即最后一列。 导入时指定sortKeyColumn参数,如果sortKey有值,则会根据图的sortKey类型正确读入,如果没有值需要在属性的末尾添加逗号,导入时会读入空表示将sortKey设置为空,即NULL。 id 1, id 2, label, property 1, property 2, …,sortKey 示例: Eric,Lethal Weapon,rate,4,2000-11-21 15:33:18,5 Vivian,Eric,friends,
  • 点文件 点文件罗列了各个点的数据信息。一行为一个点的数据。格式如下所示,id是点数据的唯一标识。 id,label,property 1,property 2,property 3,… 点id的名称,建议您不要使用中划线(-)命名,会影响Gremlin查询的使用。 点id的类型不需要设置,默认为string。 请注意label前后不要任意加空格,逗号表示分隔符,空格会被识别成label的一部分,可能会出现识别不了或提示label不存在的情况。 示例: Vivian,user,薇薇安,F,25-34,artist,98133 Eric,user,埃里克,M,18-24,college/grad student,40205
  • 属性编辑 属性页签可展示选中点或边的属性信息,也可对单个点或边的属性进行编辑。 属性编辑的操作如下: 在绘图区选中一个点或边,单击右键,选择“查看属性”,会在右侧显示“属性”页签,展示选中点边的属性信息。 若选中的点有多个标签(label),可单击label后的下拉框来查看其它label的属性信息。 图1 属性信息 单击属性名后的按钮 ,可对该点或边的属性进行编辑。 编辑完成后,单击即可。 单击属性区最下方的“编辑全部”按钮,可编辑所有属性,编辑完成后单击“保存全部”可一次性保存所有修改的属性。 注意:此处的属性编辑只针对单个点或边,而Schema编辑章节在元数据区进行的属性添加或删除是针对一个标签的属性编辑,修改后会改动所有该标签的属性信息。 父主题: 访问图和分析图
  • 群体演化 针对包含某些节点的群体,结合时间轴观察其结构的动态演化过程 。具体操作步骤如下: 在左侧“动态图”操作区的“群体演化”模块内填写参数。 开始和结束的时间以及属性值在上述章节时间轴设置中已经设置完成,如果要修改参数,单击当前输入框或左下方按钮,在弹出的“时间轴设置”框内填写,此处不可填写。 sources:表示群体内包含的节点ID,最多可以输入十万个节点,节点之间需要用逗号隔开。 图1 群体演化模块 输入完成后,单击“群体演化”模块右侧的按钮,运行结果将在画布上展示。 图2 动态图展示 界面元素 说明 动态图的开始运行按钮。 动态图的播放方向,默认开启为正向播放,关闭后为反向播放。 动态图演示的时间区域限制。 默认开启:表示启动双滑块,开始和结束的时间滑块同时移动,滑块表示的时间窗长度不变。 关闭后:表示启动单滑块。 当启动单滑块且播放方向为正向时,开始时间的滑块固定,结束时间滑块在时间轴上后移。 当启动单滑块且播放方向为反向时,结束时间的滑块固定,开始时间滑块在时间轴上前移。 表示画布展示数据包含静态数据,开启后表示仅展示动态数据。 静态数据是指不会随着时间变化而动态显示或隐藏的数据。 控制滑块运行区段开始和结束时间的显示方式。 默认开启是以时间戳的方式填写和展现。 关闭是以日期的方式填写和展现。 重置区段选择时间。 设置滑块运行区段的开始时间和结束时间。 时间轴设置,具体参数填写请参考时间轴设置章节。 步进值:滑块每次单位时间内运行的距离。 间隔时间:滑块每运行一次的间隔时间。 运行时间轴。 父主题: 动态图
  • 恢复图 如果当前编辑的图数据存在问题,需要获取之前备份的数据进行分析时,您可以将备份数据载入,以恢复图数据。 图规格为“一万边”的图和产品类型为持久化版的图没有自动备份功能,恢复图数据时只能通过手动备份恢复。其他规格的图可以通过“自动备份”和“手动备份”两种方式恢复图数据。 具体操作步骤如下: 登录图引擎服务管理控制台,在左侧导航栏选择“备份管理”。 在“备份管理”页面,选择需要恢复数据的备份,在“操作”列单击“恢复”。 在“恢复”页面,选择待恢复图,勾选“恢复操作将覆盖关联图。恢复操作启动后,待恢复图将重新启动。”,单击“是”。 图1 恢复数据 页面提示执行恢复命令成功后,您可以在“图管理”页面,等待图状态为“运行中”后,访问关联图,获取恢复后的数据。 父主题: 备份图和恢复图
  • 操作步骤 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 在算法分析区,你可以选择算法,并设置参数。 图引擎服务支持的算法如算法一览表所示,详细算法介绍请参见算法参考。 图1 设置算法参数 对于用source(节点ID) 和target参数进行查询的算法,例如personalrank算法,k跳算法,最短路径算法等,支持按照属性查询点。当前该功能只支持图规格为内存版的图使用。 图2 查询点 单击运行算法分析,分析结束后您可以查询结果。 在图引擎编辑器页面上调用算法,由于受限于可视化呈现效果,仅截取了500个节点的结果进行显示。对于全局迭代性算法例如pagerank算法等,如果您想要获得全量的算法结果可以采用API方式调用,具体请参考算法API。 以模板中的电影数据为例,运行后得到的PageRank值如下图所示。 图3 查询分析结果 将参数进行调整后,再次运行算法得到的pagerank值不同,但TOP排序不会有明显差异。 挑出了最有影响力的两部电影,分别是ID Comedy和ID Action。 图4 调整参数 执行“关联预测”,分析上述两部电影的关联程度,关联度为0.029,说明很少有人同时看过这两部电影。 图5 关联分析 图6 关联分析结果
  • 修改安全模式 创建图之后,您若想要修改安全模式,可以在图详情中进行操作。 2.4.4及以上版本,且必须是运行状态的图支持该功能。 具体操作步骤如下: 登录图引擎服务管理控制台,在左侧导航栏中选择“图管理”。 在图管理页面,选中想要修改安全模式的图,页面下方将会显示该图的信息。 图1 图详情页签 在图信息详情中,可以修改安全模式的状态,进行打开或者关闭。 更新安全模式中,按钮置灰不可使用,您可以到任务中心查看任务进度。 图2 查看任务状态 父主题: 管理图
  • 新增图和删除图 创建完持久化版图集群后,进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 在页面左上角,单击“新增图”按钮,在弹出的新增图窗口中填写图名称、选择点ID类型和SortKey类型。 图2 新增图 ID类型:目前支持固定长度String、可变长度String和哈希三种点ID类型。 String(固定长度):实际点ID直接用于内部存储与计算,需指定一长度,实际点ID不可超过此长度。长度过大可能影响查询性能,建议根据数据集状态进行设置。选择固定长度String格式,还需填写点ID长度。 String(可变长度):用户写入的点ID无长度限制,但是ID过长会影响读写性能,建议长度控制在1K字节以内,最大不要超过4K字节。 哈希格式下,内部计算时将实际点ID转换成哈希码进行存储与计算,对实际点ID长度无限制,但是存在极低的概率(约10^(-43))出现点ID碰撞。 若用户无法确定点ID的最大长度,建议选择哈希类型。 SortKey类型:选择SortKey的值类型,通过配置不同SortKey的值来区分重复边(源点,终点,Label三者都相同的边)。 整数:整数类型。 String(字节长度小于等于40):导入大于40的SortKey将报错。 String(可变长度):长度无限制,但是过长会影响读写性能,建议长度控制在1K字节以内,最大不要超过2K字节。 填写完成后,单击“确定”完成新增图操作。 若您需要删除某个图实例,可以单击“删除图”按钮,来完成删除图操作。
  • 参数说明 表1 标签传播算法(Label Propagation)参数说明 参数 是否必选 说明 类型 取值范围 默认值 convergence 否 收敛精度 Double 0~1,不包括0和1 0.00001 max_iterations 否 最大迭代次数 Integer 1~2000 1000 initial 否 点上用作初始化标签的属性名称 String 空或字符串。 空:每个节点各自分配一个特有的初始化标签;适用于事先没有任何节点标注信息的情况。 字符串:将节点的对应的属性字段取值作为初始化标签(类型为string,对于未知标签的点,初始化标签字段赋空);适用于已标注部分节点标签,预测未知节点标签的情况。 说明: 当initial取值非空时,对于具有初始化标签的点,其数量应大于0,小于点总数。 -
  • 统计信息展示 通过框选画布中点和边,在统计信息区会显示出当前所框选的点边对应的标签和节点权重的数量。关于点和边的概念请参考图数据格式。 统计信息展示的具体操作如下: 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 单击绘图区右侧的,显示“条件过滤“、“属性”、“统计信息”页签,单击“统计信息”页签。 标签:统计当前画布中所有的标签名称和对应的点边数量。 节点权重Top10:当前图中边数量最多的十个节点。 以下图统计信息为例,图中共有7个标签。标签为FUND_PRODV的点有5个,标签为FIN_PRODV的点有3个。 图中权重最大的是节点id为1101的点,共有5条边。排名第十的是节点id为1103的点,共有1条边。 图1 统计信息展示 框选(Shift+ 鼠标左键拖动)图中的点和边,被框选的标签和各个节点权重的占比数量会显示在统计信息页签中。 以下图统计信息为例,可知图中被框选的标签为FUND_PRODV的点有5个,标签为CHANNELV的点有2个。 节点id为1101的点框选了5条边,节点id为6101的点框选了5条边,节点id为3101的点框选了2条边。 图2 框选后的标签和节点权重 父主题: 访问图和分析图
  • 时序路径 从一个点出发搜索到目标节点的时序路径(时序路径满足动态图上信息传播的有序性,路径上后一条边的经过时间要晚于或等于前一条边的经过时间),在画布上呈现点、边随时间递增(或非减)的变化趋势。 该功能可以通过strategy参数调整,搜索的是距离最短的时序路径,还是尽早到达目标节点的时序路径。具体操作步骤如下: 在左侧“动态图”操作区的“时序路径”模块内填写参数: 开始和结束的时间以及属性值:在上述章节时间轴设置中已经设置完成,如果要修改参数,单击当前输入框或左下方按钮,在弹出的“时间轴设置”框内填写,此处不可填写。 source:指定单个节点作为起始节点ID。 targets:终点节点ID集合(可设置多个终点节点ID)。 k:拓展深度,表示要拓展的最大级数,取值范围为1-100,默认值为3。 strategy:运行的算法策略,取值为shortest或foremost。 shortest:返回距离最短的时序路径。 foremost:返回尽可能早的到达目标节点的时序路径。 directed:拓展方向(是否考虑边的方向)取值为true或false,默认true。 true:考虑边的方向。 false:不考虑边的方向。 图1 时序路径 输入完成后,单击“时序路径”模块右侧的按钮,运行结果将在画布上展示。例如图2和图3所示,动态图数据会随着时间呈现变化趋势。 图2 运行结果展示1 图3 运行结果展示2 父主题: 动态图
  • 参数说明 表1 关联路径算法(n-Paths)参数说明 参数 是否必选 说明 类型 取值范围 默认值 source 是 输入路径的起点ID String - - target 是 输入路径的终点ID String - - directed 否 是否考虑边的方向 Boolean true或false false n 否 路径个数 Integer 1~100 10 k 否 层数 Integer 1~10 5
  • 实例概况 进入图实例的运维监控页面后,您可以看到图实例概况,展示了图实例的状态,实时资源消耗,资源消耗,业务负载等信息。下面为您进行详细说明各个模块的作用: 图集群状态 在图集群状态模块,您可以浏览当前图实例基本信息和容量、请求数等统计信息。 集群信息:包括图规格、CPU架构等信息。 集群容量:包括点和边的使用量、容量和使用率。 集群节点:包括各个类型节点数量/总数量。 集群请求数统计(内存版):包括等待中的读请求个数、运行中的读请求个数、等待中的写请求个数、运行中的写请求个数。 图2 图集群状态 实例资源 在实例资源模块,您可以查看当前实例资源使用情况,包括“CPU使用率”,“磁盘I/O”,“磁盘使用率”,“内存使用率”,“网络I/O值”。单击对应资源指标可显示过去72小时该指标的变化趋势,以及该资源当前时刻的Top5节点使用情况。 图3 实例资源 业务负载 在业务负载模块,您可以查看当前数据库业务负载指标QPS在过去72小时该指标的变化趋势。 图4 业务负载
  • 条件过滤 为了方便用户对图数据的分析,可以通过设置条件过滤,对图数据进行进一步的过滤分析。 具体操作如下: 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 单击绘图区右侧的,或者在绘图区,选中一个点,单击右键,选择“查看属性”,显示“属性”页签。 单击“条件过滤”页签,进入“条件过滤”区,设置条件: 匹配:默认选中点,可选择过滤点或者边。 标签:默认选中所有标签,可在下拉框中选择点或者边的“标签”,“标签”在用户上传的元数据文件中定义。 添加过滤条件:单击“添加过滤条件”后的,选中一个“属性”,并选择约束条件(包含“小于、大于、等于、不等于、在范围、存在、不存在、大于或等于、小于或等于”)。“属性”在用户上传的元数据文件中定义。此处可添加多条过滤条件,也可单击右侧“删除”,删除已设置的过滤条件。 图1 设置条件过滤 运行结束后,过滤结果将呈现在绘图区以及结果查询区。 父主题: 访问图和分析图
  • 管理面任务中心 管理面任务中心功能,可用于查看创建图、备份图、启动图、增加备份、导入图、导出图、升级图等操作的异步任务的详情。 具体操作步骤如下: 在左侧导航栏,选择“任务中心”。 在“任务中心”页面可以查看对应图所执行任务的类型,任务名称,图名称,关联图,开始时间,结束时间,状态和任务ID等信息。 图1 任务中心 在“操作”列,单击“查看详情”可以查看该任务的详细信息。单击“失败原因”可以查看失败任务的原因详情。 图2 查看详情 导入图时,如果任务状态为“部分成功”,可以单击“查看详情”,查看失败的数据“类型” ,“导入失败行数”等信息,失败的具体原因,请查看导入图时指定的日志路径(可选),失败的日志会上传到该路径下。 图3 部分成功 在“任务中心”页面,可以通过以下六种方式查找任务: 图4 查找任务方式 通过选择类型查找 通过任务名称查找 通过输入关联图进行查找 通过输入任务状态进行查找 通过输入任务ID进行查找 通过设置时间查找 父主题: 任务中心
  • 参数说明 表1 最短路径算法(Shortest Path)参数说明 参数 是否必选 说明 类型 取值范围 默认值 source 是 输入路径的起点ID String - - target 是 输入路径的终点ID String - - directed 否 是否考虑边的方向 Boolean true或false false weight 否 边上权重 String 空或字符串 空:边上的权重、距离默认为“1”。 字符串:对应的边上的属性将作为权重,当某边没有对应属性时,权重将默认为1。 说明: 边上权重应大于0。 - timeWindow 否 用于进行时间过滤的时间窗 Json 具体请参见表2。 说明: timeWindow目前不支持带weight的最短路,即timeWindow与weight不可同时输入。 - 表2 timeWindow参数说明 参数 是否必选 说明 类型 取值范围 默认值 filterName 是 用于进行时间过滤的时间属性名称 String 字符串:对应的点/边上的属性作为时间 - filterType 否 在点或边上过滤 String V:点上 E:边上 BOTH:点和边上 BOTH startTime 否 起始时间 String Date型字符串或时间戳 - endTime 否 终止时间 String Date型字符串或时间戳 -
  • 隐藏图敏感信息 进入图引擎编辑器页面,详细操作请参见访问图引擎编辑器。 隐藏图Label:在元数据编辑页面的上方,单击右侧的小眼睛,取消当前label在画布上的展示。 隐藏图ID的敏感信息:单击左侧的小眼睛,会在画布中隐藏该图ID的敏感信息。 注意:若您只是单击右侧的小眼睛隐藏,呈现状态,画布中会显示图ID名称。 图1 隐藏图ID敏感信息 隐藏Label下某个属性的敏感信息: 在元数据编辑页面的某个属性的操作列,先单击右侧的小眼睛,设置该属性在画布上展示,再单击左侧的小眼睛,隐藏该属性的敏感信息,设置完成后单击“保存”。 图2 隐藏图属性敏感信息
  • 图规格 图规格展示了不同规格的图数量,当前系统支持8种规格。 当前图规格支持显示图名称及个数。 表2 规格介绍 规格 说明 一万 表示允许创建的图的边数不超过一万。 一百万 表示允许创建的图的边数不超过一百万。 一千万 表示允许创建的图的边数不超过一千万。 一亿 表示允许创建的图的边数不超过一亿。 十亿 表示允许创建的图的边数不超过十亿。 十亿增强 表示允许创建的图的边数不超过二十亿。 一百亿 表示允许创建的图的边数不超过百亿。 一千亿 表示允许创建的图的边数不超过千亿。
  • 图状态 图状态展示了处于不同状态的图数量,当前系统支持的状态如下。 表1 状态说明 状态 说明 运行中 表示正在运行的图,处于该状态的图可访问。 准备中 表示正在创建或正在启动E CS 。 启动中 表示正在启动图。 停止中 表示正在停止的图。 升级中 表示正在升级的图。 导入中 表示正在导入的图。 导出中 表示正在导出的图。 回滚中 表示正在回滚的图。 清空中 表示正在清空的图。 变更规格准备中 表示正在创建或正在启动变更图规格。 变更规格中 表示正在变更图规格。 变更规格回退中 表示正在变更规格回退的图。 扩副本准备中 表示正在准备扩副本的图。 扩副本中 表示正在扩副本的图。 已停止 表示已停止的图,处于该状态的图不可继续访问。停止状态的图可以重新启动。 已冻结 表示用户的账户和资源被冻结。详情可参考账号中心。 说明: 用户账户被冻结后,只能做删除操作。 故障 表示出现故障的图,处于该状态的图不可访问。 失败 表示创建失败的图。 版本回退中 表示图正在进行版本回退中。
  • 动态拓展 指定某个起始节点id,结合消息传递时间递增和BFS遍历顺序(temporal bfs算法),搜索周围与之相关联的点,输出对应各节点的到达时间以及和源起点之间的距离。具体操作步骤如下: 在左侧“动态图”操作区的“动态拓展”模块内填写参数: 开始和结束的时间以及属性值在上述章节时间轴设置中已经设置完成,如果要修改参数,单击当前输入框或左下方按钮,在弹出的“时间轴设置”框内填写,此处不可填写。 sources:指定单个节点作为起始节点ID。 k:拓展深度,表示要拓展的最大级数,取值范围为1-100,默认值为3。 directed:拓展方向(是否考虑边的方向)取值为true或false,默认true。 true:考虑边的方向。 false:不考虑边的方向。 图1 动态拓展 输入完成后,单击“动态拓展”模块右侧的按钮,运行结果将在画布上展示,该算法下使用单滑块播放。例如图2和图3所示,动态图数据会随着时间呈现递增的效果。 图2 运行结果展示1 图3 运行结果展示2 父主题: 动态图
  • 操作步骤 备份操作的入口有两个:“图管理”页面和“备份管理”页面。 “图管理”页面操作如下: 登录图引擎服务管理控制台。在左侧导航栏,选择“图管理”。 在图管理列表中,选择需要备份的图,在“操作”列单击“备份”。 在弹出的确认提示框中,单击“确定”完成图备份。 图1 图管理页面备份 “图管理”页面里的“备份”操作只是针对所选择的图进行备份,关联图选项不能更改。 在左侧导航栏选择“备份管理”,您可以在备份管理列表中查看正在备份或已备份的数据。 若备份“状态”显示为“备份中”,请耐心等待几分钟,当备份“状态”显示为“成功”时,表示备份成功。 图2 备份管理 “备份管理”页面操作如下: 登录图引擎服务管理控制台。在左侧导航栏选择“备份管理”。 在“备份管理”页面右上角,单击“备份”。 在备份页面,选择“关联图”,即当前用户创建的图,单击“确定”开始备份。 图3 备份管理页面备份 “备份管理”页面的“备份”操作,可选择“关联图”,但是当系统中只有一个图时,也不能更改其关联图选项。 您可以在备份管理列表中查看正在备份或已备份的数据。 若备份“状态”显示为“备份中”,请耐心等待几分钟,当备份“状态”显示为“成功”时,表示备份成功。 图4 备份管理 对已经备份好的图,在“备份管理”页面,您可以查看备份数据的名称和备份类型,关联图名称、关联图状态、关联图规格和关联图架构,备份图的创建时间、结束时间、备份大小和备份时长等。
  • 操作场景 图引擎服务在创建图完成后可以导入图数据,或者当您需要新增图数据时,可以利用“导入”功能进行增量导入。 当前仅支持 1.1.8 以上版本的图的增量导入功能。 为防止系统重启时,不能正常恢复导入图数据,建议在使用图期间,不要删除存储在OBS中的数据。 数据列的分隔符默认为逗号,暂不支持自定义。 导入目录下的单文件或者导入的单文件大小不能超过5GB,如果超过5GB,则会导入失败,建议把文件拆成小于5GB的多个文件后再导入。 单次导入的文件总大小(包括点、边数据集)不能超过可用内存的1/5。可用内存参考“运维监控面板”的“节点监控”中名称后缀为ges-dn-1-1和ges-dn-2-1节点可用内存(可以把鼠标悬浮在内存使用率上弹出)的最小值。
  • 算法一览表 为满足用户各种场景需求,图引擎服务提供了丰富的基础图算法、图分析算法和图指标算法。算法简介如下表所示。 表1 算法一览表 算法 介绍 PageRank算法 又称网页排名,是一种由搜索引擎根据网页(节点)之间相互的超链接计算的技术,用来体现网页(节点)的相关性和重要性。 PersonalRank算法 PersonalRank算法又称Personalized PageRank算法。该算法继承了经典PageRank算法的思想,利用图链接结构来递归地计算各节点的重要性。与PageRank算法不同的是,为了保证随机行走中各节点的访问概率能够反映出用户的偏好,PersonalRank算法在随机行走中的每次跳转会以(1-alpha)的概率返回到source节点,因此可以基于source节点个性化地计算网络节点的相关性和重要性(PersonalRank值越高,对source节点的相关性/重要性越高)。 k核算法(k-core) k-core是图算法中的一个经典算法,用以计算每个节点的核数。其计算结果是判断节点重要性最常用的参考值之一,较好的刻画了节点的传播能力。 k跳算法(k-hop) 从起点出发,通过宽度优先搜索(BFS),找出k层与之关联的所有节点。找到的子图称为起点的ego-net。k跳算法会返回ego-net中节点的个数。 最短路径(Shortest Path) 用于解决图论研究中的一个经典算法问题,旨在寻找图中两节点之间的最短路径。 全最短路(All Shortest Paths) 用于解决图论研究中的一个经典算法问题,旨在寻找图中两节点之间的所有最短路径。 单源最短路(SSSP) 图论中的经典问题,给定一个节点(称为源节点),该算法给出从该源节点出发到其余各节点的最短路径长度。 关联路径(n-Paths) 该算法用于寻找图中两节点之间在k层关系内的n条路径。适用于关系分析、路径设计、网络规划等场景。 紧密中心度(Closeness Centrality) 紧密中心度是一个节点到所有其他可达节点的最短距离的平均,该指标可以用来衡量信息从该节点传输到其他节点的时间长短。节点的“Closeness Centrality”越小,其所在图中的位置越中心。 标签传播(Label Propagation) 一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息去预测未标记节点的标签信息。利用样本间的关系建图,节点包括已标注和未标注数据,其边表示两个节点的相似度,节点的标签按相似度传递给其他节点。标签数据就像是一个源头,可以对无标签数据进行标注,节点的相似度越大,标签越容易传播。 Louvain算法 基于模块度的社区发现算法,该算法在效率和效果上都表现较好,并且能够发现层次性的社区结构,其优化目标是最大化整个社区网络的模块度。 关联预测(Link Prediction) 给定两个节点,根据Jaccard度量方法计算两个节点的相似程度,预测节点之间的紧密关系。 Node2vec算法 通过调用word2vec算法,把网络中的节点映射到欧式空间,用向量表示节点的特征。Node2vec通过回退参数P和前进参数Q来生成从每个节点出发的随机步,它带有BFS和DFS的混合,回退概率正比于1/P,前进概率正比于1/Q,每个节点出发生成多个随机步,反映出网络的结构信息。 实时推荐(Real-time Recommendation) 一种基于随机游走模型的实时推荐算法,能够推荐与输入节点相近程度高、关系或喜好相近的节点。该算法可以基于历史购买或浏览数据进行相近商品推荐,也可以针对人进行相近喜好的潜在好友推荐。 共同邻居(Common Neighbors) 是一种常用的基本图分析算法,可以得到两个节点所共有的邻居节点,直观地发现社交场合中的共同好友、消费领域共同感兴趣的商品,进一步推测两个节点之间的潜在关系和相近程度。 连通分量(Connected Component) 连通分量代表图中的一个子图,当中所有节点都相互连接。考虑路径方向的为强连通分量(strongly connected component),不考虑路径方向的为弱连通分量(weakly connected component)。 说明: 本算法计算得到的是弱连通分量。 度数关联度(Degree Correlation) 度数关联度算法计算所有边上起点和终点度数之间的Pearson关联系数,常用来表征图中高度数节点是否和高度数节点相连。 三角计数(Triangle Count) 不考虑边的方向,统计图中三角形个数。三角形越多,代表图中节点关联程度越高,组织关系越严密。 聚类系数(Cluster Coefficient) 聚类系数是表示一个图中节点聚集程度的系数,证据显示,在现实的网络中,尤其是在特定的网络中,由于相对高密度连接点的关系,节点总是趋向于建立一组严密的组织关系。 父主题: 算法参考
  • 查看快照 在图引擎编辑器左侧的区域内选择“快照”模块,界面会展示您保存的快照信息。 图2 快照界面 缩略图:快照缩略图,当鼠标放在缩略图上时,会自动放大快照图。 快照名称/ID:名称可修改。快照ID不可修改,ID由系统自动生成,用于导入快照时对各个保存的文件进行区分,相同ID的文件导入时会覆盖。 图信息:显示当前快照所保存的图数据。 主题色:记录保存快照时,画布的主题颜色。 创建时间:快照的创建时间。 修改时间:快照的修改时间。 操作列功能: 查看:将选择的快照展示在画布上。若您当前主题的颜色与当时保存的快照颜色不同,会有提示信息如图3所示。单击“是”系统会切换到快照保存时的主题,单击“否”系统会继续使用当前画布主题色。 图3 主题切换 删除:删除快照。确认即将要删除的快照信息后,需要在弹出的窗口中输入“DELETE”(或单击“一键输入”),输入完成后单击“确定”进行删除。 图4 删除快照 更多:包含下载和下载缩略图。 下载:将快照的JSON文件进行下载,保存到本地。 下载缩略图:以图片形式下载快照保存到本地。 删除图会将存储的快照一起删除,所以删除图前请先下载快照。
  • 参数说明 表1 PersonalRank算法参数说明 参数 是否必选 说明 类型 取值范围 默认值 source 是 节点的ID String - - alpha 否 权重系数 Double 0~1,不包括0和1 0.85 convergence 否 收敛精度 Double 0~1,不包括0和1 0.00001 max_iterations 否 最大迭代次数 Integer 1~2000 1000 directed 否 是否考虑边的方向 Boolean true或false true alpha决定跳转概率系数,也称为阻尼系数,是算法内的计算控制变量。 convergence定义每次迭代各个点相较于上次迭代变化的绝对值累加和上限,当小于这个值时认为计算收敛,算法停止。
  • 概述 PersonalRank算法又称Personalized PageRank算法。该算法继承了经典PageRank算法的思想,利用图链接结构来递归计算各节点的重要性。与PageRank算法不同的是,为了保证随机行走中各节点的访问概率能够反映出用户的偏好,PersonalRank算法在随机行走中的每次跳转会以(1-alpha)的概率返回到source节点,因此可以基于source节点个性化地计算网络节点的相关性和重要性。(PersonalRank值越高,source节点的相关性/重要性越高)。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全