医学NLP大模型-华为云

盘古大模型 PANGULARGEMODELS-使用“体验中心”调用医学NLP大模型

使用“体验中心”调用医学NLP大模型体验中心功能支持用户调用预置或训练后的NLP大模型。使用该功能前，请完成模型的部署操作，步骤详见云上部署。使用“体验中心”调用NLP大模型可实现文本对话能力，即在输入框中输入问题，模型将基于问题输出相应的回答，具体步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。图1 我的空间在左侧导航栏中选择“体验中心”，单击“文本对话”页签。选择需要调用的服务。可从“预置服务”或“我的服务”中选择。填写系统人设。如“你是一个AI助手”，若不填写，将使用系统默认人设。在页面右侧配置参数，具体参数说明见表1。表1 NLP大模型体验中心参数说明参数说明温度用于控制生成文本的多样性和创造力。调高温度会使得模型的输出更多样性和创新性。核采样控制生成文本多样性和质量。调高核采样可以使输出结果更加多样化。话题重复度控制用于控制生成文本中的重复程度。调高参数模型会更频繁地切换话题，从而避免生成重复内容。词汇重复度控制用于调整模型对频繁出现的词汇的处理方式。调高参数会使模型减少相同词汇的重复使用，促使模型使用更多样化的词汇进行表达。输出最大TOKEN长度用于控制模型生成回复的长度，一般来说，较大的max_tokens值可以生成较完整的回复，但也可能增加生成无关或重复内容的风险。较小的max_tokens值可以生成较简洁的回复，但也可能导致生成不完整或不连贯的内容，请根据场景选择合适的值。如图2，输入对话，单击“生成”，模型将输出相应的回答。图2 调测医学NLP大模型父主题：调用医学NLP大模型

盘古大模型 PANGULARGEMODELS 调用医学NLP大模型

盘古大模型 PANGULARGEMODELS-训练医学NLP大模型:医学NLP大模型训练流程介绍

医学NLP大模型训练流程介绍医学NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。针对预训练阶段，还可以继续进行训练，这一过程称为增量预训练。增量预训练是在已经完成的预训练的基础上继续训练模型。增量预训练旨在使模型能够适应新的领域或数据需求，保持其长期的有效性和准确性。微调阶段：基于预训练的成果，微调阶段通过在特定领域的数据集上进一步训练，使模型能够更有效地应对具体的任务需求。这一阶段使模型能够精确执行如文案生成、代码生成和专业问答等特定场景中的任务。在微调过程中，通过设定训练指标来监控模型的表现，确保其达到预期的效果。完成微调后，将对用户模型进行评估并进行最终优化，以确保满足业务需求，然后将其部署和调用，用于实际应用。针对微调阶段，微调后的模型可以直接部署，也可以继续进行强化学习（DPO）训练，以进一步对齐任务场景下的用户偏好，例如模型回答的风格、模型的价值观等。注意，目前盘古NLP大模型仅支持对N4系列进行DPO微调训练。

盘古大模型 PANGULARGEMODELS 医学NLP大模型

盘古大模型 PANGULARGEMODELS-训练医学NLP大模型:NLP大模型训练类型选择建议

NLP大模型训练类型选择建议平台针对NLP大模型提供了三种训练类型，包括预训练、微调、强化学习（DPO），三者区别详见表3。表3 预训练、微调训练类型区别训练方式训练目的训练数据模型效果应用场景举例预训练关注通用性：预训练旨在让模型学习广泛的通用知识，建立词汇、句法和语义的基础理解。通过大规模的通用数据训练，模型可以掌握丰富的语言模式，如语言结构、词义关系和常见的句型。使用大规模通用数据：通常使用海量的无监督数据（如文本语料库、百科文章），这些数据覆盖广泛的领域和语言表达方式，帮助模型掌握广泛的知识。适合广泛应用：经过预训练后，模型可以理解自然语言并具备通用任务的基础能力，但还没有针对特定的业务场景进行优化。预训练后的模型主要用于多个任务的底层支持。通过使用海量的互联网文本语料对模型进行预训练，使模型理解人类语言的基本结构。微调关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于利用少量的特定任务数据，使模型的表现从通用性向具体任务需求过渡。使用小规模的特定任务数据：微调通常需要小规模但高质量的标注数据，直接与目标任务相关。通过这些数据，模型可以学习到任务特定的特征和模式。在特定任务上具有更高的准确性：微调后的模型在具体任务中表现更优。相较于预训练阶段的通用能力，微调能使模型更好地解决细分任务的需求。在一个客户服务问答系统中，可以用特定领域（如电商、保险）的对话数据对预训练模型进行微调，使其更好地理解和回答与该领域相关的问题。此外，针对微调训练任务，平台提供了两种微调方式：全量微调：适合有充足数据并关注特定任务性能的场景。在全量微调中，模型的所有参数都会调整，以适应特定任务的需求。这种方式适合样本量较大、对推理效果要求较高的任务。例如，在特定领域（如金融、医疗）中，若拥有大量标注数据，且需要更高的特定任务推理精度，则全量微调是优先选择。 LoRA微调：适用于数据量较小、侧重通用任务的情境。LoRA（Low-Rank Adaptation）微调方法通过调整模型的少量参数，以低资源实现较优结果，适合聚焦于领域通用任务或小样本数据情境。例如，在针对通用客服问答的场景中，样本量少且任务场景广泛，选择LoRA微调既能节省资源，又能获得较好的效果。微调方式选择建议：若项目中数据量有限或任务场景较为广泛，可以选择LoRA微调以快速部署并保持较高适用性。若拥有充足数据且关注特定任务效果，选择全量微调有助于大幅提升在特定任务上的模型精度。

盘古大模型 PANGULARGEMODELS 医学NLP大模型

盘古大模型 PANGULARGEMODELS-创建医学NLP大模型训练任务:设置plog日志

设置plog日志登录承载租户账户后，在左侧菜单页选择平台配置模块，并切换至运维配置页签。点击添加按钮，在添加弹窗中将模块设置为训练，名称(config_key)设置为plog_level。设置项目ID，其默认状态下是defalut，此默认状态表示为所有的项目设置plog日志级别，该字段支持填写项目id为其单独设置plog日志级别。设置资源池，该项选择全局，表示为所有资源池设置plog日志级别；选择单个后，需要输入资源池ID，用于对资源池单独设置plog日志级别。上述设置完成后，设置plog日志级别，详细说明参考获取训练日志。完成设置后，查看plog日志并基于日志内容排查训练问题参考表4 设置plog日志参数类别参数名称说明高级设置 plog日志开启后plog日志功能，会记录模型训练过程中的执行过程、状态、错误等信息，盘古技术支持人员可通过plog日志定位模型训练问题。训练任务开始后可以在承载租户的OBS桶中查看。plog日志分级如下： DEBUG：记录模型训练过程中代码的执行流、变量状态、参数的变化等。 INFO：记录模型训练过程中的运行信息，通常包括一些重要的状态变化、执行的关键步骤、模型训练进度等。 WARNING：记录模型训练过程中的告警信息，可用于识别潜在的问题或异常情况。 ERROR：记录模型训练过程中的执行错误信息。

盘古大模型 PANGULARGEMODELS 训练医学NLP大模型

盘古大模型 PANGULARGEMODELS-使用“体验中心”调用医学NLP大模型

使用“体验中心”调用医学NLP大模型体验中心功能支持用户调用预置或训练后的NLP大模型。使用该功能前，请完成模型的部署操作，步骤详见创建NLP大模型部署任务。使用“体验中心”调用NLP大模型可实现文本对话能力，即在输入框中输入问题，模型将基于问题输出相应的回答，具体步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。图1 我的空间在左侧导航栏中选择“体验中心”，单击“文本对话”页签。选择需要调用的服务。可从“预置服务”或“我的服务”中选择。填写系统人设。如“你是一个AI助手”，若不填写，将使用系统默认人设。在页面右侧配置参数，具体参数说明见表1。表1 NLP大模型体验中心参数说明参数说明温度用于控制生成文本的多样性和创造力。调高温度会使得模型的输出更多样性和创新性。默认值：0 核采样控制生成文本多样性和质量。调高核采样可以使输出结果更加多样化。默认值：1.0 最大口令限制用于控制聊天回复的长度和质量。默认值：2048 话题重复度控制用于控制生成文本中的重复程度。调高参数模型会更频繁地切换话题，从而避免生成重复内容。默认值：0 词汇重复度控制用于调整模型对频繁出现的词汇的处理方式。调高参数会使模型减少相同词汇的重复使用，促使模型使用更多样化的词汇进行表达。默认值：0 如图2，输入对话，单击“生成”，模型将输出相应的回答。图2 调测NLP大模型父主题：调用医学NLP大模型

盘古大模型 PANGULARGEMODELS 调用医学NLP大模型

盘古大模型 PANGULARGEMODELS-训练医学NLP大模型:医学NLP大模型训练类型选择建议

医学NLP大模型训练类型选择建议平台针对NLP大模型提供了三种训练类型，包括预训练、微调、强化学习（DPO），三者区别详见表3。表3 预训练、微调训练类型区别训练方式训练目的训练数据模型效果应用场景举例预训练关注通用性：预训练旨在让模型学习广泛的通用知识，建立词汇、句法和语义的基础理解。通过大规模的通用数据训练，模型可以掌握丰富的语言模式，如语言结构、词义关系和常见的句型。使用大规模通用数据：通常使用海量的无监督数据（如文本语料库、百科文章），这些数据覆盖广泛的领域和语言表达方式，帮助模型掌握广泛的知识。适合广泛应用：经过预训练后，模型可以理解自然语言并具备通用任务的基础能力，但还没有针对特定的业务场景进行优化。预训练后的模型主要用于多个任务的底层支持。通过使用海量的互联网文本语料对模型进行预训练，使模型理解人类语言的基本结构。微调关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于利用少量的特定任务数据，使模型的表现从通用性向具体任务需求过渡。使用小规模的特定任务数据：微调通常需要小规模但高质量的标注数据，直接与目标任务相关。通过这些数据，模型可以学习到任务特定的特征和模式。在特定任务上具有更高的准确性：微调后的模型在具体任务中表现更优。相较于预训练阶段的通用能力，微调能使模型更好地解决细分任务的需求。在一个客户服务问答系统中，可以用特定领域（如电商、保险）的对话数据对预训练模型进行微调，使其更好地理解和回答与该领域相关的问题。此外，针对微调训练任务，平台提供了两种微调方式：全量微调：适合有充足数据并关注特定任务性能的场景。在全量微调中，模型的所有参数都会调整，以适应特定任务的需求。这种方式适合样本量较大、对推理效果要求较高的任务。例如，在特定领域（如金融、医疗）中，若拥有大量标注数据，且需要更高的特定任务推理精度，则全量微调是优先选择。 LoRA微调：适用于数据量较小、侧重通用任务的情境。LoRA（Low-Rank Adaptation）微调方法通过调整模型的少量参数，以低资源实现较优结果，适合聚焦于领域通用任务或小样本数据情境。例如，在针对通用客服问答的场景中，样本量少且任务场景广泛，选择LoRA微调既能节省资源，又能获得较好的效果。微调方式选择建议：若项目中数据量有限或任务场景较为广泛，可以选择LoRA微调以快速部署并保持较高适用性。若拥有充足数据且关注特定任务效果，选择全量微调有助于大幅提升在特定任务上的模型精度。

盘古大模型 PANGULARGEMODELS 医学NLP大模型

盘古大模型 PANGULARGEMODELS-训练医学NLP大模型:医学NLP大模型训练流程介绍

医学NLP大模型训练流程介绍 NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。针对预训练阶段，还可以继续进行训练，这一过程称为增量预训练。增量预训练是在已经完成的预训练的基础上继续训练模型。增量预训练旨在使模型能够适应新的领域或数据需求，保持其长期的有效性和准确性。微调阶段：基于预训练的成果，微调阶段通过在特定领域的数据集上进一步训练，使模型能够更有效地应对具体的任务需求。这一阶段使模型能够精确执行如文案生成、代码生成和专业问答等特定场景中的任务。在微调过程中，通过设定训练指标来监控模型的表现，确保其达到预期的效果。完成微调后，将对用户模型进行评估并进行最终优化，以确保满足业务需求，然后将其部署和调用，用于实际应用。针对微调阶段，微调后的模型可以直接部署，也可以继续进行强化学习（DPO）训练，以进一步对齐任务场景下的用户偏好，例如模型回答的风格、模型的价值观等。注意，目前盘古NLP大模型仅支持对N4系列进行DPO微调训练。

盘古大模型 PANGULARGEMODELS 医学NLP大模型

盘古大模型 PANGULARGEMODELS-查看医学NLP大模型训练任务状态与指标:查看训练指标

查看训练指标对于训练状态为“已完成”的任务，单击任务名称，可在“训练结果”页面查看训练指标，模型的训练指标介绍请参见表2。图1 查看训练指标表2 训练指标说明模型训练指标指标说明 NLP大模型训练损失值训练损失值是一种衡量模型预测结果和真实结果之间的差距的指标，通常情况下越小越好。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。

盘古大模型 PANGULARGEMODELS 训练医学NLP大模型

盘古大模型 PANGULARGEMODELS-查看医学NLP大模型训练任务状态与指标:获取训练日志

获取训练日志单击训练任务名称，可以在“日志”页面查看训练过程中产生的日志。对于训练异常或失败的任务可以通过训练日志定位训练失败的原因。典型训练报错和解决方案请参见NLP大模型训练常见报错与解决方案。训练日志可以按照不同的节点（训练阶段）进行筛选查看。分布式训练时，任务被分配到多个工作节点上进行并行处理，每个工作节点负责处理一部分数据或执行特定的计算任务。日志也可以按照不同的工作节点（如worker-0表示第一个工作节点）进行筛选查看。图2 获取训练日志

盘古大模型 PANGULARGEMODELS 训练医学NLP大模型

盘古大模型 PANGULARGEMODELS-查看医学NLP大模型训练任务状态与指标:查看模型训练状态

查看模型训练状态在模型训练列表中查看训练任务的状态，各状态说明详见表1。表1 训练状态说明训练状态训练状态含义初始化模型训练任务正在进行初始化配置，准备开始训练。排队中模型训练任务正在排队，请稍等。运行中模型正在训练中，训练过程尚未结束。停止中模型训练正在停止中。已停止模型训练已被用户手动停止。失败模型训练过程中出现错误，需查看日志定位训练失败原因。已完成模型训练已完成。

盘古大模型 PANGULARGEMODELS 训练医学NLP大模型

云服务器内容精选

医学NLP大模型