云服务器内容精选

  • 基础设施底座设计思路 工业互联网公共技术服务平台基础设施云平台采用华为混合云解决方案,以一体化全栈方式交付完整的云服务平台,与华为云统一架构,统一服务,统一API;云平台部署在客户机房,就近提供云服务,可减少服务时延;数据本地保存,由华为云统一规划、运维,是用户业务迁移上云的优选途径。 华为混合云解决方案具体具有以下优势特点: 技术当先:服务能力与华为公有云同步,保持技术当先,可为工业互联网平台中试验证中心、行业知识中心以及接入本平台的制造业企业提供云原生服务、数据库服务、数据使能服务、备份服务、边缘服务、安全服务的底层IT能力; 混合联动:通过跨云联动能力(网络、存储、灾备、业务应用),满足工业互联网平台业务混合部署要求; 专享合规:物理隔离可审计,满足工业互联网平台上云业务安全合规诉求; 共享生态:华为混合云和华为云共享生态,线上线下相同体验,使能工业互联网平台相关业务生态共享; 混合运维:客户与华为云分层运维,华为提供平台管理面专业运维服务,降低客户运维成本;也可以提供本地云管平台,满足客户本地运维要求。
  • 中试中心设计思路 中试中心以模块化为设计的核心理念,旨在强化平台的可扩展性、重构性、复用性,从而适应互联网技术发展过程中的场景变化和需求变化。重点解决中小企业新型工业互联网技术集成验证难的问题。 中试中心由基础底座进行基础信息化能力支撑,同时为知识中心提供生产资源接入能力,承接知识中心反馈的验证需求,为其进行知识经验的迭代。为此,中试中心需要为用户提供工艺试制、测试认证、技术体验等多项综合服务。故此在总体设计方案中包括5G试制工厂、测试平台、以及体验中心三大部分。 其中,5G试制工厂根据招标技术需求以电路板及模组检测、机电产品整机设计、材料成型工艺设计、机械加工为主要聚焦场景。建设有5G全互联工厂网络、装备制造工艺试制区以及3C电子制造区建设。 测试平台针对中小企业的不同需求,将大企业的成套方案拆解,将其中有用的部分重新建发组合,为中小企业提供测试环境,降低它们的试错成本。提供先进网络测试,工业机器人测试,PLCopen测试,信息模型互通和互操作测试,数控装备互联互通标准测试,机床装备综合测试等测试环境,并为客户提供认证需求咨询业务、建议规划。 体验中心通过全息投影和智能桌面组合互动展示,对工业生产形成立体式、沉浸式的巡游与数字孪生监控体验效果。实现结合具体工业场景的全新工业数字化新型体验模式,体验场景包括5G+工艺数字化与机器人试制线柔性自适应缠绕场景、5G+远程设备运维场景、5G+双机器人辅层AI视觉引导场景、5G+AGV分布式调度场景、5G+AR虚拟制造管控场景。
  • 知识中心设计思路 知识中心是工业互联网的“操作系统”,核心围绕数据、知识、软件的工业知识价值化开发逻辑,聚焦中小企业在数字化研发设计和数字化生产制造两方面的典型产业数字化业务场景进行建设。 数据汇聚。通过网络采集的多源、异构、海量数据,按应用场景转换成高质量的领域数据资产,传输至工业互联网平台,为深度分析和应用提供基础; 建模分析。提供大数据、人工智能分析的算法模型和物理、化学等各类仿真工具,结合数字孪生、工业智能等技术,对海量数据挖掘分析,实现数据驱动的科学决策和智能应用,同时通过IDS可信数据空间试点,探索企业间的私密数据可信流转方案; 知识复用。通过建设行业知识库平台,将工业经验知识转化为平台上的模型库、知识库,并通过工业微服务组件方式,方便二次开发和重复调用,加速共性能力沉淀和普及; 应用创新。面向研发设计、设备管理、企业运营、资源调度等场景,建设工业APP引擎平台支持企业数字化业务的灵活需求。支持按需获取、灵活编排和组合,助力行业APP快速上线,降低试错成本,帮助企业提质增效; 产业协同。通过云工厂创新商业模式,在PCB和模具两个领域引入产业运营商,构建研发协同、生产协同、供应协同的业务平台,实现产业链上下游的数字化、网络化、智能化,以及被赋能企业生产过程的透明化、自动化和高效化。
  • 资源和成本规划 仅供参考,各个项目根据项目实际需求评估后再做调整。 表1 资源和成本规划 云资源 规格 数量 ECS X86计算 | 通用计算增强型 | c3ne.4xlarge.2 | 16核 | 32GB 镜像: CentOS | CentOS 7.6 64bit 系统盘: 通用型 | 100GB 30 EIP 独享 | 全动态BGP | 按带宽计费 | 20Mbit/s 10 SFS 1TB 1 ELB 小型 I | 10,000 新建连接数 | 500,000 并发连接 | 50 Mbit/s带宽 | 10 LCU 5 OBS 标准存储单AZ存储包 | 5TB 4 CCE CCE容器集群 | 混合集群 | 50节点 | 是 2 WAF 专业版 1 SMN 短信推送 | 100个数~100000个数(含) 1 RDS MySQL 通用型| 4 vCPUs | 8 GB (通用型) | 主备 | 500GB 5 NAT 小型 2 Redis 8G | Redis 5.0 | X86计算 |主备 | redis.ha.xu1.large.r2.8 2
  • 运维管理流程规范 遵从运维流程,为招标方提供规范性、标准化服务,从而提高解决问题的效率、缩短业务故障时间。 图1 运维管理流程规范 服务台:服务台是云平台和云服务用户之间的单一联系点。它通过提供一个集中和专职的服务联系点促进了组织业务流程与服务管理基础架构集成。服务台的主要目标是协调用户和云平台之间的联系,为云服务运作提供支持,从而提高用户的满意度。 工单管理:接收处理客户的服务工单,将资源申请类工单转入资源管理。 事件管理:是在不影响业务的情况下,尽可能快速的恢复服务,从而保证最佳的效率和服务的可持续性。事件管理流程的建立包括事件分类,确定事件的优先级和建立事件的升级机制。 问题管理:调查基础设施和所有可用信息,包括事件数据库,来确定引起事件发生的真正潜在原因,以及提供的服务中可能存在的故障。 变更管理:以受控的方式,确保所有变更得到评估、批准、实施和评审。 资源管理:资源发放,验证和审核。 配置管理:定义和控制服务与基础设施的部件,并保持准确的配置信息。 为更好地为客户提供服务,建立标准、规范的运维管理流程,力争以全面、细致的服务让客户满意。拥有各类专业技术人员,根据需要,可向各职能部门随时调用所需专业和技能人员,派往用户所在地,提供及时、优质的运维管理服务。 定期向客户进行回访。通过接受客户投诉和沟通,建立起信息反馈渠道获取各种信息,采取相应的纠正(预防)或改进措施,确保向客户提供满足要求的产品。 在后续运维管理工程中中,会持续关注并获取客户服务需求,不断提升售后服务质量。客户通过电话、电子邮件等多种形式提出支持服务需求;客户服务助理定期调查客户满意度得到支持服务需求;售后维护组成员也会在支持维护期挖掘客户的潜在服务需求。支持维护需求的获得如下图所示。 图2 获取支持维护需求 维护服务过程中,华为的工程师将认真解决客户提出的问题,并将维护的过程和解决方法填写在《支持维护记录》中,也要求客户对华为的维护服务质量做出评价。 在支持服务结束后,支持维护人员应请客户验收工作结果,并填写《维护总结》。 5G接入网运维流程规范 本项目运维流程规范包括:组织工作制度、网络服务质量管理制度、客户响应月报制度和考核制度、客户网络维护例会制度、客户业务资料管理制度、售后响应工作分析、客户网络运行报告制度和制定重要客户应急预案及演练制度。 组织工作制度 我方承担客户网络的集中监控、数据配置与变更、资源统一调配等工作,各相关团队从我方的统一指挥调度,承担客户网络服务相关工作。 网络服务质量管理制度 客户网络服务质量管理目标是使业务质量符合各种技术指标,保证提供给客户的业务满足客户需求,服务符合工业和信息化部等行业主管部门颁布的电信服务规范。我方针对业务特点,牵头进行性能指标的分析工作,找出业务的性能指标瓶颈,通过优化网络结构、采用高可靠性和高性能设备以及采用先进网管手段等方式提高业务的网络性能指标。我方对业务开通、故障响应的各个环节进行分析,优化服务流程,降低业务开通和故障响应时间,提高业务开通和故障处理及时率。对于客户业务的维护、服务工作以客户满意为目标,我方定期对客户业务的网络质量和服务质量进行统计分析。 客户响应分析月报制度 客户响应分析月报内容包括客户总体网络的基本信息和当月网络运行、服务执行等情况,包括典型案例分析、问题及建议、下月度工作计划等内容,业务响应分析月报上报时间按客户相关要求执行。 客户网络维护例会制度 我方应与客户建立定期维护例会制度,定期沟通客户网络运行情况、客户网络资源变更信息、客户网络故障原因及预防措施等,例会周期与客户协商确定,我方负责整理编写客户网络维护例会纪要。 客户业务资料管理制度 我方负责客户业务资料的新建、变更、核对等各项管理工作。客户业务资料信息包括客户基本信息、服务等级信息、网络资源信息、客户网络拓扑信息四部分。客户业务资料采用电子信息化方式进行管理,并具备查询、统计等功能。 待网络建设完毕后,将对相应的线路、设备进行特殊标记,以保证工业互联网公共技术服务平台相关维护资料的准确性;建立详细、完备的线路资料档案和网络运行档案,并提交客户,为保证网络稳定运行提供良好的物质条件。我方负责维护线路清单,内容包括两端单位名称、地址、线路号等,并及时更新,定时或应要求提供给客户备案,以建立完备的客户档案。 客户业务资料信息属企业机密,我方加强客户资料管理的保密工作,指定专人负责业务资料库的管理工作。未经许可,任何人不得以任何理由私自查阅、复制客户信息档案。 售后响应工作分析 我方定期对售后响应工作进行分析,并形成售后响应工作分析报告。报告内容应包括客户故障情况、客户重要通信保障情况、重点服务专题及典型案例。 客户网络运行报告制度 我方定期进行客户网络运行质量分析,定期对客户网络运行情况进行汇总、统计、分析,对客户网络存在的风险隐患提出解决方案及优化建议。客户网络运行报告由我方负责编制,并可根据客户需求提交客户。 应急预案及演练制度 我方应为客户的重点业务制定应急预案,针对客户重点业务制定多个故障场景下的导通及抢修方案,并明确紧急情况下的接口人及升级流程。我方可根据客户需求,组织各维护部门,根据应急预案内容进行演练。应急预案及演练工作可与客户重要通信保障需求或重要网络保障工作相结合,在上述工作开始前组织实施。
  • 事件处理流程规范 针对平台现场出现的各类问题,用户可以采用如下事件处理流程。 图3 事件处理流程图 当客户来电或客户助理查阅到运维需求电子邮件时,客户助理按照关键字检索迅速查找到用户的信息。核对用户信息后可立即进行报修及咨询业务; 客户助理对于可以在电话中解决的报修及咨询电话,客户助理通过电话与客户沟通并远程指导解决问题,并在电脑中记录存档。对于软件问题,在客户允许并且软件系统提供接口的前提下,可以通过远程操作对问题进行判断并实施维修; 遇客户助理无法解决的情况,应仔细询问故障现象,依靠建立的历史故障解决方式信息去服务客户; 如果无法解决用户的问题,应立即转给专业的后台工程师,后台工程师通过电话远程指导客户解决问题。对于软件问题,在客户允许并且软件系统提供接口的前提下,可以通过远程操作对问题进行判断并实施维修; 后台工程师经过判断分析为硬件故障,必需提供上门服务的。 由于技术原因无法解决的问题,应先做好用户的解释工作并告知用户第2次上门时间,并积极协调资源加快处理,更好的为用户服务。
  • 应急响应流程规范 图4 应急响应流程规范 紧急问题处理步骤: 问题反馈:遇到紧急问题的情况下, 我方建议招标方将专属的技术服务经理作为第一反馈对象。 问题界定:技术服务经理根据对招标方云资源和业务架构的深入了解以及当前问题现象判断是否启动紧急问题处理流程 建立应急WarRoom:技术服务经理作为紧急问题处理组织者,将所有可能涉及到的技术专家拉上电话会议,成立紧急问题处理应急专家组,并拉通各部门主管负责资源协调和支撑。 应急专家组根据问题现象收集所需信息,如果条件允许,则在招标方授权的前提下远程接入招标方业务环境进行定位分析, 并在必要时快速搭建镜像环境用以模拟测试。 经过问题诊断, 在WarRoom中讨论并最终得出问题解决方案,并验证解决方案可行性。 应急小组将解决方案实施到招标方环境,或指导招标方和服务经理实施。实施后检查业务是否恢复 问题恢复后, 应急小组待命,由服务经理和招标方持续观察稳定性。 服务经理组织应急小组汇总问题处理过程,输出故障报告 提供故障报告给招标方,关闭紧急问题。 紧急问题处理原则: 紧急问题处理责任人应以最快恢复招标方业务为第一要务,优先输出较容易实现的问题规避方案或临时恢复方案,尽量缩短问题影响时间。 紧急问题处理全程需由处理责任人指定专人负责向招标方和华为所有相关人员通报问题处理进展, 时间间隔为30分钟。 相关技术专家收到WarRoom请求,立即接入应急WarRoom,将问题处理作为第一优先级工作。
  • 变更流程规范 由于平台的复杂性,在实施过程中项目变更不可避免。造成变更的潜在因素很多,包括现场施工条件的变化、用户需求的变化、厂家产品因素等原因,因此要全程做好变更的管理。变更管理的目的并不是控制变更的发生,而是对变更进行管理,确保变更有序进行。 变更管理原则 为了变更进行有效控制,成功地完成项目的目标,项目应遵循以下原则: 所有变更必须遵循项目变更管理计划,受控管理; 组建项目变更管理委员会,成员包括业主,联合体双方关键角色对项目范围、方案、进度等进行集团决策管理; 对变更请求,应遵循项目变更管理流程,综合评估各方面因素,选择对实现项目目标特出的方案; 变更委员会可根据变更影响范围按权责对等的原则进行分层决策授权,如子模块内部的详细设计方案变更由责任方内部决策并备案;涉及项目范围、整体解决方案及需多模块间配合的变更需委员会集体决策。 及时发布项目的变更信息,做好关联任务联动。 变更的具体流程 项目变更的具体流程分为如下几个步骤: 收集变更申请 相关责任方按变更管理模板对变更内容,变更影响进行初步分析;根据变更影响的等级提交到相应的变更管理决策组织; 变更分析评估 变更管理组接收到变更请求之后,需要识别相关干系人,并组织在约定的期限内对变更影响进行审核评估,包括变更实现的风险、人力、物力、时间等成本等。 变更审批 变更管理委员会基于变更分析评估结论,在约定的期限内组织决策,审批是否允许变更,形成《项目变更决策报告》并把审批结果反馈给项目执行组。 变更执行 项目经理获取相应的审批结果后,组织项目团队来落实变更要求。 变更确认 变更执行完毕后,业主按变更后的项目基线进行验收、确认。
  • 应用场景 企业上下游业务协同 企业研发、生产、销售、供应、物流、服务全价值链都需要进行协同,如:研发设计协同、制造生产协同、供应链物流协同、运维服务协同。协同过程中需要实现各类数据可信、可控、可追溯的共享流通。如:研发(协同、图纸、程序、文案等、生产(生产进度、状态、异常等)、销售/供应(库存、交期、价格等)、物流(发运、在途、物品状态等)、服务(设备资源、运行状态、报警事件等)。 产业云平台、行业云平台的产业链协同 为实现产业链的数字化转型升级,提升产业链的整体竞争力,各省市政府机构主导建立了工业互联网平台等各类产业云平台、行业云平台。为产业链上的相关企业需要进行业务协同提供数据共享流通能力支撑,从而实现产业链商业模式的创新。如:多主体下架构及方案设计、仿真验证、业务协同研发等集成研发与模型设计协同;外协工厂生产任务及计划定制中人、机、料、法、环等配套供给协同;人员与设备等服务能力跨企业动态调度协同;行业专家库、工具库、运维知识库、客户信息库等服务资源共享协同等。
  • 产品特性 领域数据空间流通平台采用去中心化架构、私有化部署,通过提供数据提供方连接器、数据消费方连接器、可信安全计算沙盒等,实现数据在提供方、消费方、中间服务方、监管方之间,跨网络进行可信、可控、可追溯的数据交换流通;同时,支持数据进行轻量化加工处理。从而实现数据的快速实施交付,真正促使各方数据安全合规流动。 可信 基于成熟的安全传输协议构建数据安全传输通道,利用加密技术对数据进行加密,保护传输的数据安全。根据不同安全等级采用CA数字证书、数字签名等身份标识技术,在线交换及完成数字证书公钥设备属性校验、数字签名及验签方式。从而实现提供方、消费方、中间服务方、监管身份及环境的可信任。 可控 跨网络进行数据交换流通过程中,数据提供方可灵活配置开放数据资源,各方在线协商数据访问及使用控制策略,动态实现事前、事中、事后都能基于各方达成的数据控制策略,有效保障数据提供方数据权益下的数据交换流通。 可追溯 实现各方数据交换流通全过程的日志自动进行记录,方便可视化查看各种明细信息及统计信息,及提交第三方监管审计。 安全计算 通过在数据消费方构建可信计算环境,实现数据在内存中轻量化加工处理及存储落地。并且能结合各方协商的应用使用数据方式、数据控制策略进行控制。
  • 产品设计3D模型搜索 中小型制造企业通过长年累月的积累形成了庞大的3D模型库 ,但是这些模型由于各种原因存在标签标注模糊、不准确或“一物多码”等情况,单一且传统的关键字检索方式无法有效的从海量模型中快速并准确的找到所需模型进行重用,从而导致如设计效率低下、无序设计所导致的物料管理成本、集采成本大幅增加等诸多成本管理问题因此,通过更为智能且多样的数据信息及模型检索方式来快速找到并重用数据对于企业实现提效降本将尤为重要。 3D模型搜索引擎支持包括3D形状检索、2D形状检索、关键词检索、属性查询、组合检索等多搜索方式,企业可以利用引擎快速搭建3D模型管理和检索应用,帮助设计工程师快速地查找已有设计图档并进行重用,从而提高工作效率。同时,引擎帮助企业提升零件标准化率,节约成本。 3D模型搜索引擎可支持3D模型管理、3D模型搜索、3D模型批量操作以及引擎平台部署服务,底层依赖华为云盘古大模型、向量检索引擎、容器引擎以及各种数据服务。3D模型管理服务为用户提供模型索引库创建、更新、删除和模型数据的入库、更新、查询、删除接口,支持用户构建和管理3D模型索引库。3D模型搜索服务为用户提供库内数据的各种搜索接口,用户可利用该接口对库中模型数据进行多种不同模态的检索。3D模型批量操作服务为用户提供批量的数据操作功能,包括批量数据入库、更新、删除和批量数据的重复率分析等。引擎平台部署服务是将引擎进行容器化部署,减少对部署环境以及底层的依赖。
  • 工业模型管理平台 华为云工业模型管理平台(DME)基于华为内部支撑华为工业应用的通用数据管理底座基础上,构建数据模型驱动能力,为工业数据管理软件提供通用工业数据管理引擎能力。 针对各个工业软件对工业模型管理平台整体技术要求高、业务需求复杂、千DM千场景等的要求下,华为云工业模型管理平台,构建数据模型驱动和元模型驱动多租架构的工业模型管理平台,架构设计思想为万物皆模型,一切皆数据,架构示意如下: 图3 华为云工业模型管理平台架构设计思想 底层为基础数据,数据会统一有元数据进行定义和描述; 元元数据将底层数据进行定义和描述,元数据由底层抽象的元元数据组成,同时元数据被数据模型定义; 数据模型驱动,数据模型可定义和描述业务对象实体、关系、功能、API、UI、权限、数据图谱; 工业模型管理平台提供各类元数据引擎,未来可扩展支持流程、规则、数据质量、报表等元数据引擎; 基于元数据引擎构建工业数据管理应用设计能力; 根据设计服务及其所定义的元数据自动生成工业数据原理引擎:构建模型驱动、功能可配置、服务可编排、一键可发布的统一能力。真正做到设计即开发。 华为云工业模型管理平台总体架构如下: 图4 华为云工业模型管理平台总体架构
  • 工业AI运营平台设计 本次工业AI运营平台同样以华为ModelArts AI技术平台为基础进行构建。华为ModelArts是面向AI开发者的一站式开发平台 为了满足人工智能计算中心的业务发展需求,工业AI运营平台提供但不限于以下能力: 包含数据管理、模型管理部署、在线推理、批量推理、工作流引擎平台、AI算法模型资产管理等功能模块,并配置管理标书中给定规模的AI推理资源。 整体系统:系统采用B/S架构,无需安装插件,无需下载客户端 AI应用模型管理:提供管理模型版本变化的能力,记录各版本模型发布时间、模型大小、精度、AI引擎、模型来源等信息,对模型进行分析和优化时进行模型比对和评估;支持模型以镜像方式存储和导入;支持查询模型版本详情,包括模型名称、ID、状态、版本号、部署类型、事件的信息; 提供模型存储、查询和删除的能力,支持多种类型AI引擎的统一管理;支持从训练作业导入模型、支持从O对象存储导入模型、支持导入用户自定义镜像;支持修改AI应用描述;支持将Tensorflow模型格式转换为Mindspore模型格式; 部署管理:支持在线推理服务和批量推理服务两种形式部署;支持将AI应用多个版本部署为一个服务,可配置不同版本分流比例;模型部署为在线推理服务时,平台自动配置对外Rest API 接口,以提供实时推理服务,通过AKSK认证保证服务的安全访问;在线服务Rest API接口使用时,支持从公网发起预测请求同时支持从租户VPC发起预测请求;支持多种节点规格进行在线推理服务与批量推理服务部署;支持服务部署在专属资源池或公共资源池中;支持对在线服务每秒内能够被访问的次数上限进行配置;支持在线推理服务设置自动停止时间,实现空闲算力自动回收,提升资源使用率;支持对在线服务的配置、更新、事件进行记录,对在线服务的变更进行跟踪与回溯;支持查看在线推理服务实时资源占用情况,资源占用指标包括CPU,内存,AI芯片;支持查看在线推理服务实时日志;支持在线服务滚动升级,实现平滑更新在线服务的AI应用版本;支持对在线服务的查询,更新,对在线服务进行启停;支持从控制台发起预测请求进行在线服务效果测试;支持对在线推理服务进行数据采集,采集到的数据自动上传至对象存储; 资源管理:具备不同类型算力资源的统一纳管能力,可纳管国内外主流AI芯片,涵盖英伟达GPU、华为昇腾NPU等;具备资源调度、分配与管理能力;支持紧凑型资源调度,提升资源使用率;支持资源池扩缩容;支持对专属资源池的资源分配率、使用率查看;支持将开发环境、训练作业、推理服务部署到公共资源池和专属资源池中; AI Hub:通过AI Hub实现AI算法模型资产管理。支持对算法、数据集、workflow的资产进行发布、订阅、版本管理、查询、编辑、收藏;支持资产目录,支持通过标签摘选资产,支持收藏和取消收藏资产 workflow:通过workflow构建工作流引擎平台。 支持通过工作流进行有向无环图(Directed Acyclic Graph,DAG)的开发;支持工作流,支持定义作业节点、模型注册节点、服务部署节点、条件节点;支持流水线工具,支持覆盖数据标注、数据处理、模型开发/训练、模型评估、应用开发、应用评估等步骤;支持工作流的启动、重试、停止、继续运行等基本功能;支持查看工作流节点的运行状态、启动时间以及运行时长;支持工作流目录统一规划,支持资源配置管理和参数配置管理; 支持从 AI Hub订阅Workflow;支持Workflow进行管理包括启停、查询、删除;支持将数据标注、模型训练、AI应用管理、服务部署、服务更新等能力进行流程编排;支持对历史Workflow运行的参数以及状态记录,方便回溯与对比;
  • 工业AI开发平台设计 本次工业AI开发平台采用华为ModelArts AI技术平台。华为ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及模型部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。 “一站式”是指AI开发的各个环节,包括数据处理、模型训练、模型部署都可以在ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。同时,ModelArts支持Tensorflow、PyTorch、MindSpore等主流开源的AI开发框架,也支持开发者使用自研的算法框架,匹配您的使用习惯。 ModelArts的理念就是让AI开发变得更简单、更方便。 ModelArts是一个一站式的开发平台,能够支撑开发者从数据到AI应用的全流程开发过程。包含数据处理、模型训练、模型管理、模型部署等操作。 ModelArts支持应用到图像分类、物体检测应用场景。 图1 物体检测应用场景 为了满足工业互联网平台的业务发展需求,华为设计的工业AI开发平台提供但不限于以下能力: 包含数据管理、模型开发训练、模型管理部署、资源调度引擎等功能模块,并配置管理标书中给定规模的AI训练资源。 具体功能介绍: 整体系统:系统采用B/S架构,无需安装插件,无需下载客户端 数据处理与标注:提供新建标注数据集功能,数据类型需涵盖图像、视频、文本、表格、音频;可设置数据集名称;支持按比例进行数据切分;支持将同一数据集发布为不同版本,对数据集进行跟踪与回溯;支持以Pascal Voc格式进行数据集导出与导入;支持清单文件(manifest)格式进行数据集导入;标注工具提供2D框、多边形、点、直线等标注图形;支持数据可视化标注,查看标注详情;支持标注框颜色按照物体类型区分。 开发环境:预置主流AI引擎,如TensorFlow、MindSpore等开源框架;支持通过自定义镜像构建开发环境;支持自动停止,实现空闲算力自动回收提升资源使用率;支持镜像保存,对化镜像的修改完成持久化保存;支持镜像变更,允许用户在同一个Notebook实例中切换镜像,方便用户灵活调整实例的AI引擎;预置MindInsight实现模型训练可视化;支持通过SSH方式登录开发环境进行远程开发,通过密钥对和远程访问白名单实现开发环境的安全访问;支持开发环境实例选择不同的规格的AI芯片资源;预置MindStudio进行算子开发;提供对开发环境实例创建和管理,包括实例创建,实例运行,实例停止,实例删除;支持 训练管理:预置计算框架Tensorflow、Mindspore;提供计算框架及其依赖环境的定期版本更新;支持用户以Docker镜像的方式自定义构建计算框架;;支持作业分组展示,配置列表展示,配置可见性,方便用户对不同实验作业的管理和查询;提供对训练作业创建和管理,包括作业创建,作业终止,作业重建等能力;提供实时日志查看训练作业实时状态,辅助模型调优;支持将实时日志持久化存储到对象存储;支持故障诊断模式,用户可以查看故障诊断数据辅助问题定位;支持查看训练作业历史资源占用情况,资源占用指标包括CPU,MEM,AI芯片利用率,AI芯片显存利用率;支持对不同版本的算法代码进行管理; 资源管理:具备不同类型算力资源的统一纳管能力,可纳管国内外主流AI芯片,涵盖英伟达GPU、华为昇腾NPU等;具备资源调度、分配与管理能力;支持紧凑型资源调度,提升资源使用率;支持资源池扩缩容;支持对专属资源池的资源分配率、使用率查看;支持将开发环境、训练作业部署到公共资源池和专属资源池中;
  • 组织架构 为保障平台运营的公共属性和开放性,采用民办非企业的组织形式(以下简称“民非机构”)。民非机构作为运营主体,与联合体及生态伙伴的技术专家团队,组成项目运营团队。采用“综合运营机构+产业运营商/专业服务商”运营体系。民非机构承担综合运营机构角色,联合体及生态伙伴承担产业运营商/专业服务商角色,依托平台构建创新服务综合体。 图1 创新服务综合体运营体系 在正式运营阶段,构建本地化运营团队,本地化运营团队采用COO负责制,COO负责整体管理与战略落地执行、CTO辅助管理团队,下设技术团队、项目管理团队、市场拓展团队。具体组织机构架构如下: 表1 组织机构架构 机构 职务 职责 管理层 COO 整体管理与战略落地执行,运营主导,预算管理,外部资源协调,做好企业服务、平台运营等工作,负责政府、产业资源协调 CTO 技术总负责,协助总经理做好企业服务,对技术当先负责,对创新项目目标,以及运营平台当先性负责 技术服务组 技术总监 团队主管,对运营平台承接的项目技术部分交付负责,承接人才培养目标 技术专家 依托平台与技术能力,对于合作项目从技术角度进行评估分析;后期对于评估可行的项目提供技术支持。 联合创新组 联合创新总监 团队主管,协调资源、围绕特定场景联合龙头企业、科研院校开展联合创新。 联合创新经理 协调资源、围绕特定场景联合龙头企业、科研院校开展联合创新。 生态合作组 生态合作总监 团队主管,构建产业生态体系、对接发展本地生态伙伴、对接引入外地合作伙伴。 生态合作经理 构建产业生态体系、对接发展本地生态伙伴、对接引入外地合作伙伴。 市场拓展组 市场拓展总监 团队主管,对本地产业交流活跃度负责 市场拓展经理 利用政府、运营机构等平台各种资源,拓展工业企业。