From 4682fe7af3217df03382bdb0c5529371b4373605 Mon Sep 17 00:00:00 2001 From: windsonsea Date: Fri, 14 Jun 2024 15:42:19 +0800 Subject: [PATCH] fix format issues in fine-tuning-fast.md --- docs/zh/docs/dtx/fine-tuning-fast.md | 124 +++++++++++++++------------ 1 file changed, 70 insertions(+), 54 deletions(-) diff --git a/docs/zh/docs/dtx/fine-tuning-fast.md b/docs/zh/docs/dtx/fine-tuning-fast.md index 1695d76..66718e0 100644 --- a/docs/zh/docs/dtx/fine-tuning-fast.md +++ b/docs/zh/docs/dtx/fine-tuning-fast.md @@ -1,51 +1,58 @@ # 模型微调快速入门手册 -# 前置要求: -1.已购买算力集群,并且该算力集群被加入当前用户所在的workspace中 -2.集群有可用的大模型(目前微调只适用与llama2-7b模型) -3.已准备本地/远程数据集,数据集格式为Q&A(目前仅支持CSV格式且文件大小不超过50M) - -## 操作流程: -前置要求准备--》创建数据集--》创建参数组--》创建微调实验--》部署微调模型--》对话 - - - -## **创建数据集** - - 点击创建 **数据集** - ![创建数据集](images/dataset01.png) - - - 输入数据集名称。 - - 为数据集添加自定义标签。 - - 选择数据集语言,当前支持中文/英文 - - 选择要创建的数据集所属的集群以及命名空间,注意:数据集所有集群以及命名空间应该和微调实验所属集群/命名空间保持一致。 - - 根据数据集的属性,设置授权协议。 - - 根据数据集的大小,选择词条的数目。 - - 根据数据集属性,选择数据集被应用的任务的类型,同时,可以添加子类型。 - - 配置数据集的信息,可以上传本地数据集文件配置三种类型的数据集地址,或者设置插件,配置参数让插件拉取数据集。 - - 数据集的特征映射填写数据集中文件的表头。 - - 该数据集分为两列,列名分别为:question/answer - - 点击确认,创建数据集。以下为dce数据集为例: - +大致流程为:[前置要求准备](#_2) -> [创建数据集](#_3) -> [创建参数组](#_4) -> [创建微调实验](#_5) -> [部署微调模型](#_6) -> [对话](#_7) + +## 前置要求 + +1. 已购买算力集群,并且该算力集群被加入当前用户所在的 workspace 中 +2. 集群有可用的大模型(目前微调只适用与 llama2-7b 模型) +3. 已准备本地/远程数据集,数据集格式为 Q&A(目前仅支持 CSV 格式且文件大小不超过 50M) + +## 创建数据集 + +在 **模型微调** -> **数据集** 中,点击 **上传数据集** 按钮。 + +![创建数据集](images/dataset01.png) + +- 输入数据集名称 +- 为数据集添加自定义标签 +- 选择数据集语言,当前支持中文/英文 +- 选择要创建的数据集所属的集群以及命名空间。注意:数据集所有集群以及命名空间应该和微调实验所属集群/命名空间保持一致。 +- 根据数据集的属性,设置授权协议 +- 根据数据集的大小,选择词条的数目 +- 根据数据集属性,选择数据集被应用的任务的类型,同时可以添加子类型 +- 配置数据集的信息,可以上传本地数据集文件配置三种类型的数据集地址,或者设置插件,配置参数让插件拉取数据集 +- 数据集的特征映射填写数据集中文件的表头。该数据集分为两列,列名分别为:question/answer + +点击 **确认** ,创建数据集。以 DCE 数据集为例: + ![数据集](images/dataset02.png) +## 创建参数组 + +在 **模型微调** -> **数据集** 中,点击 **创建** 按钮。 + +![创建参数组](images/create-parameter-groups.png) + +- 设置参数组基本信息,参数组名称以及微调类型和所属集群以及命名空间,目前支持的微调类型为:SFT +- 按照需要配置参数组信息,点击右下角确认完成参数组的创建 -## **创建参数组** - - 点击创建 **参数组** - ![创建参数组](images/create-parameter-groups.png) +点击 **确认** 创建参数组 - - 设置参数组基本信息,参数组名称以及微调类型和所属集群以及命名空间,目前支持的微调类型为:SFT - - 按照需要配置参数组信息,点击右下角确认完成参数组的创建。 - - 点击确认,创建参数组。 - ![参数组](images/parmergroup02.png) +![参数组](images/parmergroup02.png) -以dce参数组为例: - ![参数组](images/parmergroup01.png) +以 DCE 参数组为例: +![参数组](images/parmergroup01.png) + +## 创建微调实验 + +1. 在 **模型微调** -> **数据集** 中,点击 **创建微调实验** 按钮 -## **创建微调实验** - - 点击创建 **微调实验** ![创建微调实验](images/create-fine-tuning-experiment、.png) +2. 填写表单 + - 实验名称:由小写字母、数字字符或“-”组成,并且必须以字母或数字字符开头及结尾。 - 选择评估方式:实验中对模型使用的评分准则。 - 选择命名空间。 @@ -55,21 +62,22 @@ - 任务名称:由小写字母、数字字符或“-”组成,并且必须以字母或数字字符开头及结尾。 - 选择算力类型并填写物理卡个数。 - !!! info + !!! info - 当前模型服务仅支持Nvidia的GPU,模型会根据物理卡个数在GPU上进行分布式微调。 + 当前模型服务仅支持Nvidia的GPU,模型会根据物理卡个数在GPU上进行分布式微调。 - 资源配置: - - CPU配额:通常需要使用多核CPU来加速训练和推理过程。具体的 CPU 配额需要根据任务的需求和可用的硬件资源来确定。 + + - CPU 配额:通常需要使用多核 CPU 来加速训练和推理过程。具体的 CPU 配额需要根据任务的需求和可用的硬件资源来确定。 - 内存配置:根据模型的大小和数据集的大小来确定内存需求,并根据需要调整内存配置。 - 推荐CPU配额和内存配置请求值为 **4** Core,限制值为 **8** Core。 + 推荐 CPU 配额和内存配置请求值为 **4** Core,限制值为 **8** Core - !!!note + !!! note 两者的请求值皆不可超过限制值。 - ![任务配置](images/resource-allocation.png) + ![任务配置](images/resource-allocation.png) - 选择实验中要使用的 **基础大模型** 、 **数据组** 以及 **参数组** 。 @@ -77,22 +85,30 @@ ![alt text](images/add-task.png) - 点击右下角 **确认** 按钮即可创建微调实验。 +3. 点击右下角 **确认** 按钮创建微调实验。 ## 部署微调模型 -在 **模型仓库-内置模型的微调模型**中可以查看运行成功的实验结果。在此处,您可点击右侧 **⋮** 按钮,选择 **部署** 或 **删除** 。 +在 **模型仓库** -> **内置模型** 的微调模型中,可以查看运行成功的实验结果。 + +1. 点击右侧的 **...** ,在弹出的选项中选择 **部署** 。 + + ![微调模型部署](images/dtx-chat01.png) -1. 微调模型部署 - - 点击右侧的 **...** ,在弹出的选项中选择 **部署** 。 - ![微调模型部署](images/dtx-chat01.png) - - 填写模型服务名称、命名空间、算力配额、资源配置后点击 **确定** (注:资源给的太少服务会起不来)。 - ![微调模型部署](images/dtx-chat02.png) - - 创建成功,接下来可以通过部署的模型提供服务 +2. 填写模型服务名称、命名空间、算力配额、资源配置后点击 **确定** (注:资源给的太少服务会起不来)。 + + ![微调模型部署](images/dtx-chat02.png) + +3. 创建成功,接下来可以通过部署的模型提供服务 ## 模型服务对话 -1. 微调模型部署成功后,可以在 **模型服务-本地模型服务-微调模型**,勾选模型服务后,点击右侧 **对比对话** 即可与该模型 **对话**(注:最多选中三个微调模型进行对话)。 -![模型服务对话](images/dtx-chat03.png) +1. 微调模型部署成功后,可以在 **模型服务** -> **本地模型服务** -> **微调模型** 勾选模型服务后, + 点击右侧 **对比对话** 即可与该模型 **对话** + (注:最多可选中三个微调模型进行对话)。 + + ![模型服务对话](images/dtx-chat03.png) + 2. 可以输入训练集中的问题,点击发送给微调模型,以此验证模型微调的效果,微调模型会回答用户提出的问题。 -![模型服务对话](images/dtx-chat04.png) \ No newline at end of file + + ![模型服务对话](images/dtx-chat04.png)