PaaS技术创新Lab-华为云

华为云PaaS技术创新Lab

PaaS技术创新Lab聚焦软件工程领域的硬核能力，综合利用 软件分析、数据挖掘、机器学习、大模型及AI智能体 等技术，为软件研发人员提供最先进的核心引擎和智慧大脑。PaaS技术创新Lab目前由梁广泰博士担任Lab主任，由王千祥博士担任首席科学家。梁广泰博士曾于14年初获北大计算机系博士学位，毕业后曾任职于IBM中国研究院，16年5月加入华为工作至今，目前担任CCF软工专委常委/CCF开源发展委员会供应链安全工作组秘书长等学术角色。王千祥博士曾于北京大学担任教授职务，于2016年加入华为工作至今，目前担任CCF软件工程专委副主任、CCF开源发展委员会常委/供应链安全工作组组长等学术角色。PaaS技术创新Lab团队主要分布在中国（北京、上海、东莞）、俄研所（莫斯科、圣彼得堡）等城市，欢迎志同道合的朋友加入我们，一起开创软件研发新天地。

研究方向

缺陷检查与修复

软件缺陷严重威胁着软件系统质量和安全性。静态缺陷检查是保障软件质量和安全性的重要技术手段，能够帮助开发人员在编码阶段尽早发现问题。但随着软件规模越来越大，对静态缺陷检查技术也提出了巨大的挑战。如何进行全面、快速、准确的检查，如何帮助开发人员高效地修复发现的问题，以及如何有效地获取大型系统特有的缺陷知识，是三个亟需解决的技术难题。本研究团队致力于打造业界最精准和高效的缺陷检测与修复核心引擎，构筑自主可控的软件分析基础平台。主要研究方向聚焦在：
（1）构建缺陷检查能力，覆盖华为编码规范、CWE、MISRA规范等，看护代码质量和安全性；
（2）利用增量分析、分布式分析、冗余分析识别等技术来提高分析效率，减少时间和计算资源开销；
（3）利用数据挖掘和机器学习技术，从大规模代码中挖掘缺陷模式及修复模式。

软件缺陷严重威胁着软件系统质量和安全性。静态缺陷检查是保障软件质量和安全性的重要技术手段，能够帮助开发人员在编码阶段尽早发现问题。

开源软件供应链保障技术

构建开源软件供应链安全图谱，涵盖组件、漏洞、许可证等多类数据，覆盖C/C++，Java，Python等主流语言软件上万款；基于图谱库进行开源软件风险检测，包含恶意代码识别，开源已知漏洞识别，License合规风险识别等；并探索开源软件安全治理技术，包括三方库升级、三方库替换迁移、补丁迁移等。

构建开源软件供应链安全图谱，涵盖组件、漏洞、许可证等多类数据，覆盖C/C++，Java，Python等主流语言软件上万款；基于图谱库进行开源软件风险检测，包含恶意代码识别，开源已知漏洞识别，License合规风险识别等；并探索开源软件安全治理技术，包括三方库升级、三方库替换迁移、补丁迁移等。

智能化开发者测试

帮助开发者在编码过程中实时保障代码质量，结合深度理解需求和代码仓理解，智能生成契合业务场景的高质量开发者测试用例，形成有效的代码质量看护。支持主流开发语言如Java/C/CPP/Python/前端语言/ArkTS等。研究方向包括：基于后训练技术增强（微调/强化学习）的单元测试生成，开发者测试智能体，测试用例有效性提升，测试驱动开发（TDD）等。

帮助开发者在编码过程中实时保障代码质量，结合深度理解需求和代码仓理解，智能生成契合业务场景的高质量开发者测试用例，形成有效的代码质量看护。支持主流开发语言如Java/C/CPP/Python/前端语言/ArkTS等。研究方向包括：基于后训练技术增强（微调/强化学习）的单元测试生成，开发者测试智能体，测试用例有效性提升，测试驱动开发（TDD）等

研发数据深度理解&RAG

代码RAG：支持Java、C++、Python、Vue、TypeScript等主流编程语言，更高效的构建片段级别的知识库。利用自主研发的分析引擎实现代码切分，精准解析各类代码架构；推出同等参数规模下性能和效果领先的Embedding模型，提供更精准的代码特征提取能力。

CodeBase：基于CodeBase技术构建多模态知识库，实现了函数片段、调用关系图谱和文档级知识的系统化管理，动态维护代码上下文信息，支持增量式更新，为各类开发场景提供丰富的语义上下文，显著提升开发效率和质量。

代码解释：通过融合代码仓库理解技术，实现了深层次的代码解释功能，支持从函数级到项目级的全方位解析，自动构建代码知识图谱，并智能生成技术文档，帮助开发者快速理解复杂代码逻辑。

代码RAG：支持Java、C++、Python、Vue、TypeScript等主流编程语言，更高效的构建片段级别的知识库。利用自主研发的分析引擎实现代码切分，精准解析各类代码架构；推出同等参数规模下性能和效果领先的Embedding模型，提供更精准的代码特征提取能力。

CodeBase：基于CodeBase技术构建多模态知识库，实现了函数片段、调用关系图谱和文档级知识的系统化管理，动态维护代码上下文信息，支持增量式更新，为各类开发场景提供丰富的语义上下文，显著提升开发效率和质量。

代码解释：通过融合代码仓库理解技术，实现了深层次的代码解释功能，支持从函数级到项目级的全方位解析，自动构建代码知识图谱，并智能生成技术文档，帮助开发者快速理解复杂代码逻辑。

代码智能生成

深度理解开发者的编程意图，全面感知代码仓多维度上下文，智能生成契合场景的高质量代码，致力于做开发者在敲击键盘时最强力的伙伴，点亮程序员的夜空。研究方向包括：代码补全智能上下文工程、知识检索增强的代码补全与生成等。

深度理解开发者的编程意图，全面感知代码仓多维度上下文，智能生成契合场景的高质量代码，致力于做开发者在敲击键盘时最强力的伙伴，点亮程序员的夜空。研究方向：代码补全智能上下文工程、知识检索增强的代码补全与生成、

研发语料构建技术

面向研发智能化需要，结合大模型领域的知识和能力，面向各研发业务场景，聚焦研发语料构建技术，提升大模型在研发全链路任务效果。研究方向包括：语料分析与理解，高质量语料构建与清洗，语料构建自动化工具，语料合成/蒸馏，强化学习语料技术，昇腾算子语料构建等。

面向研发智能化需要，结合大模型领域的知识和能力，面向各研发业务场景，聚焦研发语料构建技术，提升大模型在研发全链路任务效果。研究方向包括：语料分析与理解，高质量语料构建与清洗，语料构建自动化工具，语料合成/蒸馏，强化学习语料技术，昇腾算子语料构建等。

项目级研发智能体

构建面向软件工程任务的端到端智慧能力，让AI赋能需求澄清与拆解、架构设计与优化、代码生成与测试、问题定位与修复、版本升级与更新，通过多智能体协同实现软件研发的全流程智能。研究方向：领域知识库增强的需求澄清与拆解技术、研发智能体工具选择技术及工具调用链路优化技术、项目级代码生成的失败任务复盘及经验总结技术、经验增强的项目级代码生成技术。

构建面向软件工程任务的端到端智慧能力，让AI赋能需求澄清与拆解、架构设计与优化、代码生成与测试、问题定位与修复、版本升级与更新，通过多智能体协同实现软件研发的全流程智能。研究方向：领域知识库增强的需求澄清与拆解技术、研发智能体工具选择技术及工具调用链路优化技术、项目级代码生成的失败任务复盘及经验总结技术、经验增强的项目级代码生成技术。

新闻与动态

研究合作

PaaS创新lab合作计划，与学术界以及工业界精英一道，为创新技术提供顶级支撑。

与世界级大师一起，改变世界。

了解详情

加入我们

PaaS创新技术Lab精英招募计划，诚邀各路精英加入，赋能华为云，构建万物互联的智能世界。

查看机会

研究合作

PaaS创新lab合作计划，与学术界以及工业界精英一道，为创新技术提供顶级支撑。

与世界级大师一起，改变世界。

了解详情

加入我们

PaaS创新技术Lab精英招募计划，诚邀各路精英加入，赋能华为云，构建万物互联的智能世界。

PaaS技术创新Lab

PaaS技术创新Lab

PanGu-Coder: 函数级的代码生成模型

PanGu-Coder: 函数级的代码生成模型

研究方向

研究方向

新闻与动态

ICSE顶级会议论文MOREST: Model-based RESTful API Testing with Execution Feedback

华为云基于多源数据画像的失败用例智能分析

华为云创新Lab

算法创新Lab

C Lab

云数据库创新Lab

计算与网络创新Lab

云存储创新Lab

数据智能创新Lab

边缘云创新Lab

AI系统创新Lab

竖亥实验室

EI创新孵化Lab

媒体创新Lab

PaaS技术创新Lab