检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ployment_id}/chat/completions API接口域名格式为https://ip:port,获取方式参考《API参考》文档“获取大模型推理API接口域名”章节。 API访问路径(URI)中的deployment_id、project_id获取方式如下。 使用最终租户登录ModelArts
在左侧导航栏中选择“模型开发 > 模型部署”,单击模型名称在“详情”页面获取API接口域名。 只有处于“运行中”状态的模型才可以正常调用。 图1 获取Deepseek模型API接口域名 获取API接口域名后,结合API访问路径拼接成完整的API接口。 获取Token 参考《API参考》文档“如何调用REST
如何查看预置模型的历史版本 ModelArts Studio平台支持查看预置模型的多个历史版本,并提供对历史版本进行训练等操作的功能。您还可以查看每个版本的操作记录、状态以及其他基础信息。 要查看预置模型的历史版本,您可以按照以下步骤操作: 进入平台的“空间资产 > 模型 > 预置”页面。
URL的格式来拼接即可获取接口的调用域名。 如果是监控网关的访问模式,获取部署配置中的ELB IP、ELB负载端口、API URL信息。按照https://ip:port+API URL的格式或者https://ip:port+API URL的格式来拼接即可获取接口的调用域名。
Studio平台,在“我的空间”(详见工作空间介绍)分页,单击进入所需空间。 在左侧导航栏中选择“模型开发 > 模型部署”,单击“模型名称”在“详情”页面获取API请求地址。 只有处于“运行中”状态的模型才可以正常调用。 图1 云上部署获取图像搜索模型API请求地址 获取API接口域名后,结合API访问路径拼接成完整的API接口。
单击任务ID查看加工任务详情页的日志管理页签下的运行日志页签。 在“运行日志”页签可实时查看数据集加工的进度。 可以找到每个任务开始结束的时间戳,可以算出任务时长。 可以查看每个任务对应作业的运行状态和结果。 图2 日志管理 图3 日志管理 运行日志内容介绍 数据集加工任务运行日志包括3个部分。具体如下。
出所需要的模型;并且支持按照关键字搜索模型。右侧区域是模型展示区,以卡片的形式展示模型内容,包括模型名称、模型描述、应用场景标签,支持单击“查看详情”,进入模型详情页,查看版本号、版本描述、版本详情等信息,支持单击“训练”或者“部署”,单击跳转到模型训练或模型部署界面,对该模型创建训练或部署任务。
单击操作列“评测报告”,在“评测报告”页面,可以查看评测任务的基本信息及评测概览。 其中,各评测指标说明详见Deepseek大模型评测指标说明。 导出评测报告。 在“评测报告 > 评测明细”页面,单击“导出”,可选择需要导出的评测报告,单击“确定”。 单击右侧“导出记录”,可查看导出的任务ID,单击操作列“下载”,可将评测报告下载到本地。
得分最高的类别和标签类别相等的样本数。 图像分类-多分类 mAP 平均精度值。 精确率 预测为正的样本中,实际为正的比率。 召回率 实际为正的样本,预测为正的比率。 F1分数 精准率和召回率的调和平均数,数值越高,表明模型性能越好。 预测正确 预测得分大于置信度阈值的类别和对应标签包含的类别完全相等的样本数。
预测值对真实值变动的解释程度,越接近于1,说明模型对真实值的拟合越好。 平均绝对误差 预测值与真实值之间差异的平均绝对值。它衡量了模型预测的平均偏差程度,值越小表示模型的预测越准确。 均方根误差 预测值与真实值之间差异的平方和的平均值的平方根。它与MAE类似,但对大误差给予更高的惩罚。RM
模型生成句子与实际句子基于评估指标得到的评分后,统计平均得分。 goodcase 模型生成句子与实际句子基于评估指标得到的评分后,统计得分为5分的占比。 badcase 模型生成句子与实际句子基于评估指标得到的评分后,统计得分1分以下的占比。 用户自定义的指标 由用户定义的指标,如有用性、逻辑性、安全性等。
模型生成句子与实际句子基于评估指标得到的评分后,统计平均得分。 goodcase 模型生成句子与实际句子基于评估指标得到的评分后,统计得分为5分的占比。 badcase 模型生成句子与实际句子基于评估指标得到的评分后,统计得分1分以下的占比。 用户自定义的指标 由用户定义的指标,如有用性、逻辑性、安全性等。
Service,CTS)是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建、配置追踪器后,CTS可记录用户使用盘古的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
查看提示词评估结果 评估任务创建完成后,会跳转至“评估”页面,在该页面可以查看评估状态。 图1 查看提示词评任务状态 单击“评估名称”,进入评估任务详情页,可以查看详细的评估进度,例如在图2中有10条评估用例,当前已评估8条,剩余2条待评估。 图2 查看评估进展 评估完成后,可以查看每条数据的评估结果。
在Postman中新建一个GET请求,填入域名(将获取调用路径中获取的URL去除末尾的“/tasks”即为该域名),设置请求Header参数和任务ID参数。单击Postman界面的“Send”发送请求,以获取科学计算大模型的调用结果。 查询科学计算大模型调用详情API GET /tasks/{task_id}
调递减的,即随着训练的进行,Loss值不断减小,直到收敛到一个较小的值。 平均交并比 是一种常用的评估指标,主要用于衡量图像分割任务的性能。它通过计算预测结果与真实标签之间的交集与并集的比值,来评估模型的准确性。是一个综合性的评估指标,能够全面反映模型在图像分割任务中的表现。 像素精度
查看CV大模型部署任务详情 部署任务创建成功后,可以查看大模型部署的任务详情,具体步骤如下: 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。 图1 我的空间 在左侧导航栏中选择“模型开发 > 模型部署”,完成创建CV大模型部署任务后,可以查看模型的部署状态。
样本的比例。数值越高,表明模型在检测正类样本时的准确性越高。 召回率 召回率是指在所有实际为正类的样本中,被模型正确预测为正类的比例。数值越高,表明模型在检测正类样本时的全面性越高。 误报率 误报率是指被错误预测为异常的正常样本在总正常样本中所占的比例。误报率关乎于不必要的维护操
response)回答的奖励差值,衡量模型优选回答优于被拒回答的概率。 计算方式:一个训练步的数据中优选回答的奖励分数大于拒绝回答的奖励分数的比例。 NLP大模型 训练优选回复的奖励 强化学习(DPO)训练过程中的指标,表示模型对人类标注的优选回答(chosen response)的偏好得分。
查看NLP大模型部署任务详情 部署任务创建成功后,可以查看大模型部署任务详情,具体步骤如下: 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。 图1 我的空间 在左侧导航栏中选择“模型开发 > 模型部署”,完成创建NLP大模型部署任务后,可以查看模型的部署状态。