快速开始
更新时间:2022-12-05
邀测申请
目前ERNIE 3.0系列的模型精调处于邀测阶段,您可以通过以下方式申请加入试用:
申请表单:https://wenxin.baidu.com/wenxin/apply3
模型精调基本步骤
获取API Key
您可以登录大模型API服务平台个人中心获取您的专属 API Key(AK)和Secret Key(SK),请注意保护您的密钥信息,避免泄露。您可以通过删除已泄露的密钥来保护您的账户安全。
安装wenxin-api客户端
安装文心大模型API客户端wenxin-api
pip install --upgrade wenxin-api
(注意:建议使用python3.7及以上版本)
模型精调接口调用
您可以通过以下代码使用您的数据集进行模型精调(将上一步骤申请的AK、SK填入下方代码的your ak和your sk中)。
# -*- coding: utf-8 -*
import time
import wenxin_api
from wenxin_api import Dataset, Model, Train, Task
from wenxin_api.const import TASK_STATE_TRAIN_SUCCESS
wenxin_api.ak = "your ak"
wenxin_api.sk = "your sk"
# 上传用户自定义数据集
local_file_path = "local_file_path"
dataset = Dataset.create(local_file_path)
# 创建训练任务
# 注意请求频率,过于频繁的请求会被限制qps
sleep_time = 20
train_task = Train.create(train_datasets=[dataset])
while train_task.status != TASK_STATE_TRAIN_SUCCESS:
train_task.update()
print("task:", train_task)
time.sleep(sleep_time)
model = Model.retrieve(task_id=train_task.id)
input_text = "标题:小熊过桥。大纲:小熊成功走过|小熊害怕|小熊送给|小熊想|看望姥姥|妈妈道别|带上鲜花|竹桥走。正文:"
rst = Task.create(model=model, text=input_text)
其中常见的状态码可以参考:状态码汇总