0

0

OpenAI提供新的微调和定制选项

王林

王林

发布时间:2024-04-19 15:19:09

|

1145人浏览过

|

来源于51CTO.COM

转载

微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可使用户大大增加模型对专业内涵的理解,允许用户为特定任务的模型增加现成知识。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

OpenAI提供新的微调和定制选项

虽然这个过程可能需要时间,但与从头开始训练模型相比,它的成本效益通常要高三倍。这一数值正如OpenAI最近宣布扩展其自定义模型程序以及为其微调API提供各种新功能所反映的那样。

自服务微调API的新特性

OpenAI于2023年8月首次宣布推出针对GPT-3的自助微调API,并受到了AI社区的热烈响应。据OpenAI报告称,成千上万的团体已经利用API来训练成千上万的模型,比如利用特定的编程语言生成代码,将文本总结为特定的格式,或根据用户行为创建个性化的内容。

自从2023年8月开始,工作匹配和招聘平台Indeed取得了重大成功。为了将求职者与相关的空缺职位相匹配,Indeed向用户发送个性化推荐。通过微调GPT 3.5 Turbo以生成更准确的流程解释,并能够将提醒中的令牌数量减少80%。这使得该公司每月发送给求职者的信息从不足100万条增加到大约2000万条。

新微调API特性建立在这个成功的基础上,希望为未来的用户改进功能:

基于epoch的检查点创建:在每个训练epoch自动生成一个完整的微调模型检查点,这减少了后续再训练的需要,特别是在过度拟合的情况下。

Comparity Playground:一个新的并行Playground UI,用于比较模型质量和性能,允许人工评估多个模型的输出或针对单个提示进行微调快照。

第三方集成:支持与第三方平台的集成(从权限重和偏差开始),使开发人员能够将详细的微调数据共享给堆栈的其余部分。

综合验证指标:能够计算整个验证数据集的损失和准确性等指标,从而更好地了解模型质量。

超级参数配置:能够从仪表板配置可用的超级参数(而不仅仅是通过API或SDK)。

微调仪表板改进:包括配置超级参数、查看更详细的训练指标以及从以前的配置中重新运行作业的能力。

基于过去的成功,OpenAI相信这些新功能将使开发人员对他们的微调工作有更细粒度的控制。

辅助微调和定制训练模型

OpenAI还在2023年11月在DevDay上发布的基础上,改进了自定义模型计划。其中一个主要变化是辅助微调的出现,这是一种利用API微调之外的有价值技术的手段,例如在更大范围内添加额外的超级参数和各种参数有效微调(PEFT)方法。

SK电信就是充分发挥这项服务潜力的一个例子。这家电信运营商在韩国拥有超过3000万用户,因此他们希望定制一种可以充当电信客户服务专家的人工智能模型。

通过与OpenAI合作对GPT-4进行微调,使其专注于韩国电信相关的对话,SK电信的对话摘要质量提高了35%,意图识别准确率提高了33%。当将他们的新微调模型与广义GPT-4进行比较时,他们的满意度得分也从3.6提高到4.5(满分5分)。

OpenAI还引入了为需要深度微调的特定领域知识模型的公司构建定制模型的能力。与法律人工智能公司Harvey的合作证明了这一功能的价值。法律工作需要大量阅读密集的文件,Harvey想用LLMs(大型语言模型)从这些文件中综合信息,并将其提交给律师进行审查。然而,许多法律是复杂的,并且依赖于上下文,Harvey希望与OpenAI合作建立一个定制训练的模型,该模型可以将新的知识和推理方法纳入基本模型。

Harvey与OpenAI合作,添加了相当于100亿令牌的数据来定制训练这个判例法模型。通过增加必要的背景深度来做出明智的法律判断,结果模型的事实性回答提高了83%。

人工智能工具从来都不是“包治百病”的解决方案。可定制性是这项技术有用性的核心,OpenAI在微调和定制训练模型方面的工作将有助于扩展已经从该工具中获得的组织。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

397

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

397

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

15

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

12

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

554

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

197

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.2万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号